読み方 : エフィシェントネット
EfficientNet
概要
EfficientNetとは、画像認識を行う畳み込みニューラルネットワークの一つ。米グーグル(Google)社が2019年に発表したモデルで、複合スケーリングという新しい手法を導入し、限られた計算資源で高い性能を引き出すことができる。

従来の畳み込みニューラルネットワーク(CNN)では、精度向上のためにネットワークを単純に深く、あるいは幅広くすることが一般的だったが、これに伴い計算量やパラメータ数が急増する問題があった。EfficientNetでは、深さ、幅、入力解像度という三つの要素を同時にバランスよく拡張する「複合スケーリング」と呼ばれる手法を導入した。
これら三つの要素は互いに依存しており、単一の要素だけを極端に強化しても効率的な性能向上には繋がらない。複合スケーリング手法では、三つの要素を一定の比率でバランスよく同時に拡大する「複合係数」(compound coefficient)を導入し、限られた計算資源の中で最も効率的に性能を高める拡張比率を事前に決定してからモデル構築に取り掛かる。
モデルの基本的な構造には、先行して開発された「MobileNet」および「MnasNet」で得られた知見が引き継がれている。これらはモバイル環境向けに軽量で効率性を重視した方式で、「深さ単位分離可能畳み込み」(Depthwise Separable Convolution)やボトルネック構造などの要素が受け継がれている。モデルの規模に応じて、最小のEfficientNet-B0から最大のB7まで、用途に応じた複数のバリエーションが提供されている。