読み方：ごさぎゃくてんぱほう

誤差逆伝播法【backpropagation】バックプロパゲーション

概要

誤差逆伝播法とは、ニューラルネットワークの学習過程で、出力結果と正解の差である誤差を出力層から入力層方向へ伝播させ、各ノードのパラメータを更新する手法。誤差が小さくなるようなパラメータの更新量を知るために必要な勾配（微分値）を効率よく求めることができる。

目
次

解説
ニューラルネットワーク
勾配降下法
誤差逆伝播法

ニューラルネットワーク

ニューラルネットワークは、脳の神経細胞を模したノードが層状に多数配置された構造を持っている。各ノードは固有のパラメータに基いて比較的単純な計算を行う能力を持ち、上位層の各ノードの計算結果を入力として所定の計算（活性化関数）を行う。

計算結果は下位層の各ノードへそれぞれ固有の重み付けを行った上で出力され、上位層の各ノードから重み付き和を受け取ったノードは、自身の持つ「バイアス」という固有の値を加算して下層の各ノードへ伝達する。最上位の入力層は外部からデータを受け取り、最下位の出力層は外部へデータを出力する。

学習過程では、訓練データの入力値と対応する出力値（正解）を与え、内部の各ノードの持つパラメータ（重みとバイアス）を調整することで、訓練データに適応した状態を作り出す。ある入力値に対する現在のネットワークの出力値と正解の差を「誤差」（あるいは損失）と呼び、誤差が少なくなるように調整を行う。

勾配降下法

最適なパラメータを得るには、誤差を、パラメータを入力する関数の出力であると考え（誤差関数）、この関数の出力が最小になるときのパラメータの値を求めれば良い。誤差関数が多項式などで定式化できるなら、微分した導関数が0になる方程式を解くといった解析的（式の変形や変換）な手法が使えるが、ニューラルネットワークのような複雑な構造では難しい。

このような場合、関数に様々な数値を与えてみて出力を調べ、値が減る方向に少しずつパラメータを更新していく数値的な解法が用いられる。これを「勾配降下法」という。具体的には、数値微分などの手法で現在のパラメータにおける誤差関数の微分値（勾配：接線の傾き）を求め、出力がより小さくなる方向に向かってパラメータに一定の値（学習率）を加減算する。

これを何度も繰り返すと、関数の描く曲線を底に向かって下っていくように、出力が徐々に小さくなっていく。出力が最小となる底にたどり着くと勾配が0に近い値になり、それ以上パラメータの値が変動しなくなるため、繰り返しを打ち切ってパラメータを確定する。