ITパスポート過去問 令和3年度(2021年)問19
ビッグデータの分析に関する記述として,最も適切なものはどれか。
選択肢
- ア:大量のデータから未知の状況を予測するためには,統計学的な分析手法に加え,機械学習を用いた分析も有効である。
- イ:テキストデータ以外の,動画や画像,音声データは,分析の対象として扱うことができない。
- ウ:電子掲示板のコメントやSNSのメッセージ,Webサイトの検索履歴など,人間の発信する情報だけが,人間の行動を分析することに用いられる。
- エ:ブログの書き込みのような,分析されることを前提としていないデータについては,分析の目的にかかわらず,対象から除外する。
- ア
- イ
- ウ
- エ
正解と解き方・学習ポイント(AI解説)
ビッグデータ分析では、統計学的な分析手法に加えて、予測や分類などに機械学習を用いることも有効です。また、画像、動画、音声などの非構造化データも分析対象になります。人間の行動分析に使うデータは、人の発信情報だけに限らず、検索履歴や購買履歴、位置情報、センサログなども対象になります。
Point
この問題は、ビッグデータ分析で使われる代表的な分析手法(統計、機械学習)と、分析対象となるデータの範囲(テキスト以外の非構造化データ、各種ログなど)を理解しているかを確認します。
解くために必要な知識
この問題を解くには、ビッグデータ分析の対象データの種類と、代表的な分析手法(統計、機械学習)を理解している必要があります。
用語の整理
| 用語 | 意味 | 補足 |
|---|---|---|
| ビッグデータ | 多量で多様な形式を含み、継続的に生成されることも多いデータ群です。 | 表形式のデータだけでなく、ログや画像なども含みます。 |
| 統計学的な分析手法 | データの傾向把握や推定に用いる手法です。 | 例: 相関、回帰など。 |
| 機械学習 | データから規則性を学習し、予測、分類、異常検知などに用いる手法です。 | 例: 予測モデル、クラスタリングなど。 |
| 非構造化データ | 表形式のように項目が固定されていないデータです。 | 例: テキスト、画像、動画、音声。分析では前処理や特徴抽出を行うことがあります。 |
| ログ(履歴データ) | システムや利用者の操作などの記録データです。 | 例: 検索履歴、閲覧履歴、購買履歴、位置情報、センサログ。 |
問題の解法手順
各選択肢の整理
判断の観点
ビッグデータ分析については、次の2点で確認します。
-
分析手法は統計だけに限らないか
-
分析対象はテキストだけに限らないか
選択肢ごとの判定
| 選択肢 | 内容 | 正誤 | 理由 |
|---|---|---|---|
| ア | 統計学的分析に加え機械学習も有効 | ○ | 予測や分類などで機械学習が広く用いられます |
| イ | 動画・画像・音声は分析対象にできない | × | テキスト以外も分析対象です |
| ウ | 人間の発信情報だけが行動分析に使われる | × | センサー値、位置情報、ログなども行動分析に利用できます |
| エ | 分析前提でないデータは除外する | × | 目的に合えば分析対象になります |
選択肢ごとの解説
- ア:正解
大量のデータから未知の状況を予測する場面では、統計学的な手法に加えて、機械学習による予測や分類を用いることも一般的であり、記述は適切です。
- イ:不正解
動画、画像、音声は非構造化データですが、現在は解析技術があり、分析対象として扱えます。したがって不適切です。
- ウ:不正解
行動分析に使うデータは、人の発信情報だけではありません。検索履歴、閲覧履歴、購買履歴、位置情報、センサログなども行動の分析に利用できます。
- エ:不正解
ブログの書き込みのように分析を前提としていないデータでも、目的と方法が適切であれば分析対象になり得ます。分析の目的にかかわらず除外する、は不適切です。
まとめ
ビッグデータ分析では、統計学的な分析手法に加えて、予測や分類などに機械学習を用いることも有効です。また、画像、動画、音声などの非構造化データも分析対象になります。人間の行動分析に使うデータは、人の発信情報だけに限らず、検索履歴や購買履歴、位置情報、センサログなども対象になります。
ストラテジ系 > 経営戦略 > ビジネスインダストリ
大量のデータから未知の状況を予測する場面では、統計学的な手法に加えて、機械学習による予測や分類を用いることも一般的であり、記述は適切です。
動画、画像、音声は非構造化データですが、現在は解析技術があり、分析対象として扱えます。したがって不適切です。
行動分析に使うデータは、人の発信情報だけではありません。検索履歴、閲覧履歴、購買履歴、位置情報、センサログなども行動の分析に利用できます。
ブログの書き込みのように分析を前提としていないデータでも、目的と方法が適切であれば分析対象になり得ます。分析の目的にかかわらず除外する、は不適切です。