半構造化データ 【semi-structured data】

概要

半構造化データ(semi-structured data)とは、項目の形式などについてある程度決まった構造に基づいて記録されたデータ集合。XMLデータJSONデータなどが該当する。

リレーショナルデータベースRDB)やCSVファイルのようにあらかじめ決められた構造に当てはめてデータを記録する「構造化データ」(structured data)と、文書ファイルなど決まった構造を持たない雑多なデータの集まりである「非構造化データ」(unstructured data)の中間の形式である。

半構造化データはRDBに対するSQLによる操作のように特定のデータモデルに従ってデータを自動処理することは難しいが、区切り文字リテラルタグなどの一定の記法に従って記録されており、データを読み込んでソフトウェア上のデータ構造に対応付けることはできる。

半構造化データの格納形式としては、HTMLに似たマークアップ言語であるXMLで記述されたXMLファイルJavaScriptオブジェクト定義構文をデータ記述に応用したJSONファイルなどがある。データベース管理システムで管理する場合はKVSKey-Value Store)などのいわゆるNoSQL型のシステムを用いる。

(2023.10.27更新)

他の辞典による解説 (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる