読み方 : センシティブぞくせい
センシティブ属性【sensitive attribute】

機械学習モデルは学習データとして与えられたデータに含まれる属性から傾向を学んで予測や判断を行う。社会的あるいは法的に配慮が求められる要素を含んだデータを与えると、特定の集団に不利な結果を出力を生み出す可能性がある。このようなデータに由来する偏りを「アルゴリズムバイアス」という。
センシティブ属性はそのような差別や不利益が生じないよう配慮が求められる項目である。一般的には、年齢、性別、性自認、性的指向、持病や障害の有無および程度、病歴、健康状態(健康診断結果など)、人種、民族、国籍、出身国、宗教、思想・信条(支持政党など)、犯罪歴、犯罪被害事実などが該当する可能性がある。
特徴量の設計時にセンシティブ属性を選別して除外すれば、ある程度はその影響を抑えることができるが、氏名から性別が類推できる場合など、他の変数が代理変数として機能し、実質的に同様の影響を与える場合もある(隠れセンシティブ属性)。
モデルの公平性評価では、センシティブ属性が共通するグループごとに予測結果を比較し、不当な差が生じていないかを検証する手法が用いられることがある。個人情報保護法の「要配慮個人情報」のように、法令やガイドラインにより取得や利用が制限される属性もあり、データ収集やモデル運用の段階での管理体制が求められる。