読み方 : はんこうぞうかデータ
半構造化データ【semi-structured data】

リレーショナルデータベース(RDB)やCSVファイルのようにあらかじめ決められた構造に当てはめてデータを記録する「構造化データ」(structured data)と、文書ファイルなど決まった構造を持たない雑多なデータの集まりである「非構造化データ」(unstructured data)の中間の形式である。
半構造化データはRDBに対するSQLによる操作のように特定のデータモデルに従ってデータを自動処理することは難しいが、区切り文字やリテラル、タグなどの一定の記法に従って記録されており、データを読み込んでソフトウェア上のデータ構造に対応付けることはできる。
半構造化データの格納形式としては、HTMLに似たマークアップ言語であるXMLで記述されたXMLファイル、JavaScriptのオブジェクト定義構文をデータ記述に応用したJSONファイルなどがある。データベース管理システムで管理する場合はKVS(Key-Value Store)などのいわゆるNoSQL型のシステムを用いる。
関連用語
他の辞典等による「半構造化データ」の解説 (外部サイト)
本ページを参照・引用している文書・論文など (外部サイト)
- 国土交通省 建築BIM推進会議「2024年度 標準化TF 成果報告書
」にて引用 (2024年12月)