読み方 : データせっしゅ
データ窃取【data theft】
概要

攻撃者がモデルの予測結果や、モデルが持つパラメータにアクセスできる場合に実行される可能性がある。代表的な手法の一つに「モデル反転攻撃」がある。これは、モデルについて既知の情報、例えば特定のクラス(カテゴリ)に対する高い予測確率などを用いて、そのクラスに属する学習データの典型的な特徴や、特定の個人のデータを推測しようとする。
こうした攻撃により、モデルの学習に使われた企業の機密データや、個人の特定や機微に関わる情報(氏名や病歴など)を盗み出すことができる場合がある。特に、医療診断や金融取引など、機密性の高いデータを扱うモデルでは、このデータが復元されて窃取されるリスクが大きな脅威となる。攻撃者は盗み取った個人情報を悪用したり、企業秘密を奪取して競争上の優位性を得るために利用する可能性がある。
データ窃取に対する防御策として有効なのは、モデル出力を意図的に削減したり、不確実性を加えたりする手法である。中でも「差分プライバシー」という手法では、学習データにノイズを意図的に加えることで、個々のデータ点がモデルの学習結果に与える影響を抑え、モデルから特定の個人情報を推測することを困難にする。また、モデルが公開する情報を制限したり、アクセスできる利用者を厳密に認証するといった運用上の対策も重要である。