パーサ 【parser】 パーザ
概要
パーサ(parser)とは、コンピュータプログラムのソースコードやXML文書など、何らかの言語で記述された構造的な文字データを解析し、プログラムで扱えるようなデータ構造の集合体に変換するプログラムのこと。そのような処理のことを「構文解析」「パース」(parse)という。解析対象となるテキストデータが記述された言語の語彙や記法、文法などのルールを元に、記述内容を要素や属性などに分け、それらの間の関係を読み取って木構造(ツリー)などのデータ構造や何らかのデータ記述言語による表記として出力する。
パーサはそれ単体で利用されることはあまりなく、何らかの処理をするための前段階として使われることが多いため、汎用のサブルーチンやモジュール、ライブラリなどとして提供されることが多い。
プログラミング言語などのコンピュータ言語を対象とするものが多いが、日本語や英語など人間が使う自然言語の文章を対象とするものもある。文章を読み込んで形態素解析(分かち書きをしない日本語などの文章を単語に分解する)や構文解析(単語間の関連を確定する)などを行い、何らかの形式のデータ構造として表現する。
(2020.4.28更新)