ETL 【Extract/Transform/Load】 ELT
概要
ETL(Extract/Transform/Load)とは、データベースなどに蓄積されたデータから必要なものを抽出(Extract)し、目的に応じて変換(Transform)し、データを必要とするシステムに格納(Load)すること。また、ソフトウェアの持つそのような機能。一般的にはデータウェアハウスを構築する際に外部のデータベースや何らかの情報源からデータを取り出して必要な形式に整えて保存することを指す。このような処理を行う専門のソフトウェアや拡張機能をETLツールという。
抽出元となるのは業務システムに日々蓄積されていく様々な種類や内容、形式のデータで、ETLツールは様々なシステムに対応できるよう、リレーショナルデータベース(RDB)やCSVファイル、表計算ソフトのデータファイル、XMLファイル、ログファイル、テキストファイルなど多様なデータ形式を読み込めるようになっている。
変換・加工の過程では、得られたデータ群から分析のために必要な要素を特定し、分析システム側が利用できる表現形式に変換したり、不要な要素を切り落としたりする。複数の値を組み合わせて新たな値を生成したり、一つの値を複数に分割したりといった処理が行われることもある。複数の情報源からのデータを統合する操作もここで行われる。
格納の工程ではデータウェアハウスなど対象のシステムにデータを流し込む。データの取り込みはリアルタイムには行われず、一週間や一ヶ月といった一定の期間毎に定期的に行ったり、分析業務を始める前にまとめて行うことが多い。
(2018.7.28更新)