正規表現 【regular expression】 RE / RegExp / regex

概要

正規表現(regular expression)とは、ある特定のパターンを持つ文字列を指定する表記法の一つ。文字列検索や置換、抽出などをう際の対象の指定などのために用いられる。

通常の文字の並びの中に、「メタキャラクタ」(metacharacter)と呼ばれる特別な意味を与えられた記号などの組み合わせを埋め込む形でパターンの特徴を記述することができる。例えば、「^」というメタキャラクタは行頭を表し、「.」は任意の一文字、「+」は直前の要素の1回以上の繰り返しを意味する。

正規表現を使えば、同じ特徴を持つが細部が異なる文字列を一つの表記で同時に指定することができ、長い文章から特定のパターンに一致する箇所を抽出したり、それらを一括して同じ文字列に置換したりすることができる。例えば、「.et」という正規表現は「任意の一文字」+「et」というパターンを表し、「net」「get」「set」「let」などに一致する。

正規表現の源流となるクリーネ閉包などの概念は1950年代の初期の計算機科学などに求めることができるが、1970年代に初期のUNIXシステム向けに開発されたテキストエディタコンパイラ汎用の文字列検索コマンドgrep)などを通じてその有用性が広く知られるようになり、様々な分野やソフトウェアプログラミング言語などに普及していった。

正規表現の仕様にはPOSIXにより定義された仕様書などは存在するが、広く受け入れられた標準規格などはない状態が続いている。言語やソフトウェアによって独自の拡張が繰り返されており、基本的な共通の記法はあるものの細部の仕様は異なっている。

(2018.11.5更新)

他の辞典による解説 (外部サイト)

この記事を参照している文書など (外部サイト)

  • 別府大学文学部司書課程「情報検索演習外部リンク」(PDFファイル)にて引用 (2012年7月)
この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる