読み方 : データどうか
データ同化【data assimilation】
データ同化とは?

数値シミュレーションは物理法則に基づいて未来の状態を計算するが、初期条件のわずかな誤差が時間の経過と共に拡大し、現実から乖離する性質を持つ。一方、気象衛星やセンサーから得られる観測データは現時点のリアルな状態を示すものの、空間的な偏りや測定誤差が避けられない。データ同化はこの両者を組み合わせ、互いの弱点を補う形で現状の最も確からしい推定値を求める。
具体的には、観測値とモデルの予測値をそれぞれの誤差の大きさに応じて重み付けして統合し、「解析値」と呼ばれる推定結果を算出する。この解析値を次の予測計算の初期値として使うことで、シミュレーションの軌道が修正され、以後の予測精度が向上する。観測データが得られない地点や時刻でも、周辺情報やモデル計算をもとに全体像を補完できる。
代表的なアルゴリズムは「カルマンフィルタ」(Kalman filter)で、逐次的に新しい観測値を取り込んで状態を更新する。大規模・非線形な系には「アンサンブルカルマンフィルタ」や「4次元変分法」(4DVar)が使われる。いずれも確率論や最適化理論を応用した手法であり、扱うデータ量が膨大なためスーパーコンピュータが利用される場合も多い。近年ではセンサーの増加に伴う観測データ量の拡大を背景に、機械学習と組み合わせてモデルの誤差パターンを学習させたり補間精度を高めたりする研究も進んでいる。