ディープラーニング 【deep learning】 深層学習
概要
ディープラーニング(deep learning)とは、ニューラルネットワーク(NN:Neural Network)を用いた機械学習システムのうち、中間層(隠れ層)が複数のシステムを利用するもの。広義にはこれをNN以外の手法に応用したもの(深層強化学習など)を含む。画像処理に強く精度が高いため近年急激に注目が高まっている。ニューラルネットワークは動物の脳の仕組みを模した学習する機械の数学的なモデルで、データの入力、単純な計算、出力を連続して行うノードを脳神経(ニューロン)に見立て、これを大量に用意して網状に相互接続した構造となっている。
ノードは層状に配置され、外部から入力層のノード群がデータを受け取り、計算を行って結果を中間層に伝達し、中間層も同様に計算を行って出力層に伝達、出力層から結果が出力される。学習データを用いて計算や伝達に用いるパラメータを調整すると、推論や予測、分類などを行うシステムを構成することができる。
1950年代の研究初期に提唱されたニューラルネットワークはノード群を入力層・中間層・出力層の3層に配置した構造だったが、1990年代に複数の中間層を設けて全体を4層以上の深さにした「ディープニューラルネットワーク」(DNN:Deep Neural Network)が提唱された。これを用いて行う機械学習をディープラーニングという。
初期のDNNは性能がなかなか向上せずあまり注目されてこなかったが、2006年のジェフリー・ヒントン(Geoffrey E. Hinton)氏による「オートエンコーダ」の提案を突破口に劇的な飛躍を遂げた。2010年代以降は代表的な機械学習モデルとして活発に研究・開発が進み、有用なシステムの実用化や社会への実装も進展した。
ディープラーニングは画像認識(画像に何が写ってるのか検知する)において顕著な高性能を示したため画像処理分野での研究や応用が最初に注目され、画像認識や画像生成、文字認識、自動運転のためのセンサー技術などへの適用が進んだ。ディープラーニングを応用したコンピュータ囲碁やコンピュータ将棋のシステムがプロに勝利するなどのニュースを通じて一般への認知度も高まった。近年では機械翻訳や音声認識、音声合成、動画生成などへの応用も進んでいる。
関連用語
他の辞典による解説 (外部サイト)
この記事を参照している文書など (外部サイト)
- 独立行政法人日本芸術文化振興会委託事業 PwCコンサルティング「文化芸術活動におけるデジタル技術の活用による表現活動等の先行事例調査 調査報告書」(PDFファイル)にて引用 (2023年5月)