読み方 : グループせいきか
グループ正規化【group normalization】
概要
グループ正規化とは、畳み込みニューラルネットワーク(CNN)の特徴マップの値を一定の範囲に揃える正規化処理の一つで、チャネルをいくつかのグループにまとめ、グループごとに正規化を行うもの。主に画像を扱うモデルで用いられる手法で、画像一枚ごとに複数チャネル単位の正規化を行う。

ニューラルネットワークでは入力層から出力層に向かって一層ずつ下層へ順に値が伝達されていくが、層間でやり取りされる値のスケールがまちまちになることがある。あまりに値に幅があると、特定の特徴量ばかり重視されたり、一部のノードのパラメータの収束が遅くなるなどの不都合が生じる。
グループ正規化はCNNの特徴マップに適用される正規化手法の一つで、学習データを構成する個々のサンプルごとに正規化を行う。層内の各フィルタ(カーネル)の出力をチャネルというが、グループ正規化では正規化を複数チャネルのグループごとに行い、それぞれについて平均0、分散1になるよう調整する。
グループ正規化はインスタンス正規化やレイヤー正規化と同じく単体のサンプルを用いる方式で、バッチ正規化のようにバッチサイズの影響を受けない。グループ数がチャネル数と同じ(チャネルごとに正規化)ならインスタンス正規化に、グループ数を一つにすればレイヤー正規化(全チャネル合わせて正規化)となり、両者の中間的な方式と言える。
正規化一般の性質として、極端な値のばらつきを抑えて学習の安定化、学習速度の向上、過学習の抑止などの効果をもたらす。モデルの特性に応じて最も学習が安定するグループ数を選択することができるが、グループ数というハイパーパラメータが一つ増えるため、最良の値を探索するための時間や計算量を要する難点もある。
(2025.12.7更新)