読み方 : データどうか

データ同化【data assimilation】

データ同化とは?

数値シミュレーションによる予測結果に実際の観測データを統合し、現実との誤差を継続的に修正しながら予測精度を高める手法。気象予報や海洋解析をはじめ、地震研究、交通流解析、環境監視など、時間とともに変化する現象を扱う分野で広く用いられている。
データ同化のイメージ画像

数値シミュレーションは物理法則に基づいて未来の状態を計算するが、初期条件のわずかな誤差が時間の経過と共に拡大し、現実から乖離する性質を持つ。一方、気象衛星やセンサーから得られる観測データは現時点のリアルな状態を示すものの、空間的な偏りや測定誤差が避けられない。データ同化はこの両者を組み合わせ、互いの弱点を補う形で現状の最も確からしい推定値を求める。

具体的には、観測値とモデルの予測値をそれぞれの誤差の大きさに応じて重み付けして統合し、「解析値」と呼ばれる推定結果を算出する。この解析値を次の予測計算の初期値として使うことで、シミュレーションの軌道が修正され、以後の予測精度が向上する。観測データが得られない地点や時刻でも、周辺情報やモデル計算をもとに全体像を補完できる。

代表的なアルゴリズムは「カルマンフィルタ」(Kalman filter)で、逐次的に新しい観測値を取り込んで状態を更新する。大規模・非線形な系には「アンサンブルカルマンフィルタ」や「4次元変分法」(4DVar)が使われる。いずれも確率論や最適化理論を応用した手法であり、扱うデータ量が膨大なためスーパーコンピュータが利用される場合も多い。近年ではセンサーの増加に伴う観測データ量の拡大を背景に、機械学習と組み合わせてモデルの誤差パターンを学習させたり補間精度を高めたりする研究も進んでいる。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。