読み方 : データせっしゅ

データ窃取【data theft】

概要

データ窃取とは、機械学習モデルに対するサイバー攻撃の一種で、学習済みのモデルから学習に用いられたデータを推測・復元して取得する行為。学習データ機密性の高い個人情報企業秘密などが混じっている場合に、これを取り出して悪用しようとする試みである。
データ窃取のイメージ画像

攻撃者がモデルの予測結果や、モデルが持つパラメータにアクセスできる場合に実行される可能性がある。代表的な手法の一つに「モデル反転攻撃」がある。これは、モデルについて既知の情報、例えば特定のクラス(カテゴリ)に対する高い予測確率などを用いて、そのクラスに属する学習データの典型的な特徴や、特定の個人のデータを推測しようとする。

こうした攻撃により、モデルの学習に使われた企業の機密データや、個人の特定や機微に関わる情報(氏名や病歴など)を盗み出すことができる場合がある。特に、医療診断や金融取引など、機密性の高いデータを扱うモデルでは、このデータが復元されて窃取されるリスクが大きな脅威となる。攻撃者は盗み取った個人情報を悪用したり、企業秘密を奪取して競争上の優位性を得るために利用する可能性がある。

データ窃取に対する防御策として有効なのは、モデル出力を意図的に削減したり、不確実性を加えたりする手法である。中でも「差分プライバシー」という手法では、学習データにノイズを意図的に加えることで、個々のデータ点がモデルの学習結果に与える影響を抑え、モデルから特定の個人情報を推測することを困難にする。また、モデルが公開する情報を制限したり、アクセスできる利用者を厳密に認証するといった運用上の対策も重要である。

この記事の著者 : (株)インセプト IT用語辞典 e-Words 編集部
1997年8月より「IT用語辞典 e-Words」を執筆・編集しています。累計公開記事数は1万ページ以上、累計サイト訪問者数は1億人以上です。学術論文や官公庁の資料などへも多数の記事が引用・参照されています。