読み方 : おんそ
音素【phoneme】音韻
概要
音素とは、ある言語において意味を区別するために機能する最小の音声単位。個々の発話音そのものではなく、言語内で区別に用いられる音の抽象的な側面を扱い、音声と言語構造を結び付ける概念である。

物理的に発せられる具体的な音声そのものではなく、頭の中で抽象化された音の概念を指す。音素の体系は言語ごとに異なり、どの音の対立が意味を区別するかは個別の言語によって決まる。例えば、英語の「l」と「r」は日本語では同一の音素として処理されることが多いが、英語では異なる音素として区別される。日本語では重要な長音や濁音の区別を重視しない言語もある。
人間がある言葉を発声する際、人による声色の違い、同じ人でも体調や感情の変動、発声時の前後の音との繋がりなどによって物理的には異なる音に変化している。言語として理解する際にはそれらの微細な差異を切り捨て、特定の同じ音に分類している。この物理的な音のバリエーションを「異音」と呼び、それらを一つの意味の単位として括ったものが音素である。
音声処理の観点では、音素は連続的な音声信号を離散的な記号系列へと変換する際の重要な指標となる。音声認識システムでは、入力された波形から特徴量を抽出し、隠れマルコフモデル(HMM)や深層ニューラルネットワークなどを用いて、どの音素が高い確率で出現しているかを推定する。音素は音節や単語を構成する最も基本的な単位であり、これを正確に特定することが重要となる。
なお、「音素」と「音韻」は分野や文脈により同義語とする(あるいは一方は用いない)とする場合と、異なる概念を指す場合がある。意味が異なる場合、音素は物理的な発音の違いに基づく単位で、音韻は特定の言語における音声の単位とする考え方(「『l』と『r』は異なる音素だが日本語では同じ音韻」と整理する)や、音韻は音素の区別に音の強弱や長短、アクセント、トーン(声調)などの区別を加えた要素とする考え方などがある。