読み方 : きかいがくしゅう

機械学習【machine learning】マシンラーニング/ML

概要

機械学習とは、コンピュータプログラムにある分野のデータを繰り返し与えることで内在する規則性などを学習させ、未知のデータが与えられた際に学習結果に当てはめて予測や判断、分類などを行えるようにする仕組み。現代の人工知能AI)研究における最も有力な手法の一つ。
機械学習のイメージ画像

例えば、数字を手書きした画像と、そこに写っている数字をペアにした学習データをたくさん用意し、一定のアルゴリズム(計算手順)に従って次々にこれを処理していくと、画像のパターンから写っている数字を予測する学習モデルを作ることができる。学習済みのシステムに未知の手書き数字の画像を与えると、そこに写っている数字を推論して回答できるようになる。

従来このような仕組みを作ろうとすると、各数字の画像に現れる特徴的なパターンを人間が整理して、判断基準としてプログラムに組み込む必要があるが、機械学習ではデータから特徴を抽出して特定の結果(答え)に紐付ける操作をコンピュータが自動的に行うため、人間は学習させたい内容を表すデータを与えるだけでよい。

教師あり学習 (supervised learning)

機械学習の手法のうち、「例題と答え」という形式に整理された「教師データ」に適合するようにモデルを構築していく方式を「教師あり学習」という。例題を入力すると対応する答えを出力するようにモデルを調整していく。

人間が既に答えを知っているような判断や作業を自動化したい場合に有効な手法で応用範囲も広いが、生のデータを「例題と答えのペア」という形式に(人手によって)整理しなければならない。学習データの質や潜在的な問題点がそのまま精度や結果に反映されてしまう難点もある。

教師なし学習 (unsupervised learning)

人間が基準や正解を与えずに学習データを分析させ、システムが自律的に何らかの規則性や傾向を見出す方式を「教師なし学習」という。与えられたデータ群を何らかの目的をもって解析し、特徴の似たデータのグループ分けなどを行えるようにする。

人間にも正解が分からない課題についての知見を得たい場合や、大量のデータから規則性を探索したい場合などに有効な手法で、データの前処理が少なく現実世界にある多様な大量のデータを素材にできる。ただし、結果が何を意味するかは人間による解釈が必要で、人間にとって有用な結果が得られるよう制御するのが難しく精度も安定させにくいなどの課題がある。

強化学習 (reinforcement learning)

システムの行動に対して評価(報酬)が与えられ、行動の試行錯誤を繰り返して評価を最大化するような行動パターンを学習させる方式を「強化学習」という。機械の制御や競技、ゲームなどを行うAIの訓練に適している。

他の学習手法と異なり、人間がまとまった形で学習データを与えることはせず、システムは現在の状況を入力として行動を選択する。行動の結果は評価(値)としてシステムに伝達され、どのような行動が好ましい結果に繋がるかを繰り返し試行錯誤しながら学習していく。

人工知能・深層学習との関係

人工知能」(AIArtificial Intelligence)とは人間の知的な営みの一部を何らかの形で模倣するITシステム全般を指す総称であり、初期のAI研究では対象についての知識やルール、判断基準などを人間がプログラムの一部として直に記述する手法が一般的だった。

しかし、このような手法では知識の記述に手間がかかり、特定の狭い分野であっても人間のような判断を下せるシステムを実現するには途方も無い時間とコストが必要になってしまう。この限界を打ち破るため、人間は学習の仕方だけをプログラムとして実装し、実際の知識の獲得はデータを大量に与えて自動処理するという機械学習の手法が考案された。

機械学習の具体的な方式にはSVMサポートベクターマシン)やベイジアンネットワーク、決定木デシジョンツリー)学習、データクラスタリングなど様々な手法があるが、人間の脳の神経回路の網状の繋がりに着想を得た「ニューラルネットワーク」(NN:Neural Network)が有力な方式として台頭した。

2010年代になると、ネットワークの階層を従来より深く設定(4層以上)した「ディープニューラルネットワーク」(DNN:Deep Nueral Network)が目覚ましい発展を遂げ、機械学習研究・開発の中核として注目されるようになった。このDNNに基づく機械学習のことを「深層学習」あるいは「ディープラーニング」(deep learning)という。

(2021.10.8更新)

他の用語辞典による「機械学習」の解説 (外部サイト)

資格試験などの「機械学習」の出題履歴

▼ ITパスポート試験
令7 問8】 AIの機械学習で利用するデータの取扱いに関する記述のうち,バイアスの低減やデータの品質を確保するために考えられる対策として,適切なものだけを全て挙げたものはどれか。
令7 問85】 問題を解いて解答群の中から正解を選ぶ,あるAIシステムがある。このシステムは,1回の学習の過程を経るごとに,学習の過程の前後の比較において,誤り率が5%低下する(前回の誤り率の95%になる)。
令6 問65】 AIにおける機械学習の学習方法に関する次の記述中の a〜c に入れる字句の適切な組合せはどれか。教師あり学習は、正解を付けた学習データを入力することによって、[ a ] と呼ばれる手法で未知のデータを複数のクラスに分けたり、[ b ] と呼ばれる手法でデータの関係性を見つけたりすることができるようになる学習方法である。
令3 問20】 画像認識システムにおける機械学習の事例として、適切なものはどれか。
▼ 基本情報技術者試験
令4修12 問74】 生産現場における機械学習の活用事例として,適切なものはどれか。
令3修1 問74】 生産現場における機械学習の活用事例として,適切なものはどれか。
令1秋 問73】 生産現場における機械学習の活用事例として,適切なものはどれか。
平30秋 問3】 AIにおける機械学習の説明として,最も適切なものはどれか。
平30春 問61】 蓄積されたデータに対してパターン認識機能や機械学習機能を適用することによって,コールセンタにおける顧客応対業務の質的向上が可能となる事例はどれか。

本ページを参照・引用している文書・論文など (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。