ハッシュ関数 【hash function】 ハッシュアルゴリズム / hash algorithm / 要約関数 / メッセージダイジェスト関数 / message digest function

概要

ハッシュ関数(hash function)とは、入力データに一定の手順で計算をい、データの長さによらずあらかじめ決められた固定長の出力値を得る関数。得られたは「ハッシュ値」(hash value)と呼ばれる。

ハッシュ関数は同じ入力からは必ず同じが得られ、どのような長さの入力からも同じ長さのを得る。の長さは実用上は数バイトから数十バイト程度とすることが多い。計算過程で情報の一部が欠落するため、出力値(だけ)を元に入力データの候補を推測することはできても、完全に元通りに復元することはできない。

ハッシュ値は元のデータの特徴を表す短い符号として利用することができ、データの比較や検索を高速化することができる。例えば、複数の大きな容量のファイルの内容が同一であるかを比較する際に、端から順にすべてのデータを照合すれば時間が掛かるが、それぞれハッシュ値を計算しておけば一瞬で比較が完了する。用途や特性により様々な計算手法があり、データ改竄や破損の検知、類似データ探索などにも応用される。

暗号学的ハッシュ関数 (一方向性ハッシュ関数)

ハッシュ関数のうち、暗号電子署名などセキュリティ上の用途に適した性質を持つものを「暗号学的ハッシュ関数」あるいは「一方向性ハッシュ関数」という。

これは入力データと出力値の間に規則性がなく、入力が少しでも異なれば類推不能なまったく異なる出力値となる。ある特定の出力値が得られるような入力を効率よく求めることができない「弱衝突耐性」や、同じ出力値となる別の入力を容易には見つけられない「強衝突耐性」などの性質を備えている。

これらの性質により、パスワードなどの秘密の情報ハッシュ値として伝送あるいは保管すれば、認証などで入力値と登録値が一致するかどうかは元の情報が無くても検証できる一方、攻撃者がハッシュ値を盗み取っても元の情報復元することはできない。また、デジタル署名が施されたメッセージ改竄して同一の署名を付け直すといった攻撃も阻止できる。

標準規格として1990年代に考案された「MD5」(Message Digest 5)や「SHA-1」(Secure Hash Algorithm 1)がよく知られ、長年に渡り様々な分野で利用されてきた。これらは2010年代にはハッシュ値の短さ(MD5は128ビットSHA-1は160ビット)や攻撃手法の研究が進んだことからセキュリティ用途としては十分安全とは言えない状況になっており、「SHA-2」や「SHA-3」など新しい規格への移行が推奨されている。

(2024.2.14更新)

他の辞典による解説 (外部サイト)

この記事を参照している文書など (外部サイト)

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。
ホーム画面への追加方法
1.ブラウザの 共有ボタンのアイコン 共有ボタンをタップ
2.メニューの「ホーム画面に追加」をタップ
閉じる