ITパスポート試験

機械学習

大量のデータから規則性を学習し、予測や分類を行う技術です。

用語解説

機械学習とは

機械学習(Machine Learning)とは、人間が処理手順や条件分岐のルールを細かく書かなくても、大量のデータを与えることで、コンピュータがデータ中の規則性やパターンを学習し、予測や分類などを行えるようにする技術です。

AI(人工知能)を実現する代表的な手法の一つとされ、現在のAIの多くは機械学習を利用していると考えられます。

機械学習で行うこと

機械学習がよく行う処理は次のとおりです。

  • 分類(例。メールを迷惑メールと通常メールに分ける)

  • 回帰(例。来月の需要を予測する)

  • クラスタリング(例。購入傾向が似た顧客をグループ化する)

学習方法の分類

機械学習の手法は、主に次の3つに分類されます。

手法 説明 具体例
教師あり学習 正解ラベル付きデータで学習します 迷惑メール分類、画像認識
教師なし学習 正解ラベルなしデータから構造や傾向を見つけます 顧客のグループ分け(クラスタリング)
強化学習 試行錯誤と報酬により行動を学習します ゲームAI、ロボット制御

※正解ラベルとは、入力データに対して「正しい答え」として付けた分類結果や数値です。

機械学習の流れ

機械学習の作業は、次の順番で行うのが一般的です。

  1. 目的を決めます(分類か予測かなどです)。

  2. データを集めます(量と質が結果に影響します)。

  3. 前処理を行います(欠損、外れ値、形式の統一などです)。

  4. 学習用データと評価用データに分けます(学習と確認を分離します)。

  5. モデルを学習させます(規則性を獲得します)。

  6. 評価します(正解率などの指標で確認します)。

  7. 運用し、必要に応じて再学習します(状況変化に対応します)。

理解のポイント

  • 機械学習は、データから規則性を学ぶことが中心です。

  • 結果の良し悪しは、データの質と量、前処理、評価方法に強く依存します。

  • 学習後の確認では、学習データではなく未使用のデータで評価することが原則です。

発展知識

関連用語

用語 概要
人工知能(AI) 推論や学習など知的処理の総称です。
深層学習(ディープラーニング) 多層のニューラルネットで学習します。
学習データ モデルが規則性を学ぶためのデータです。
特徴量 予測に使う入力項目を数値化したものです。
過学習 学習データに合わせ過ぎ汎化が落ちます。