コンテンツベースフィルタリング 【content-based filtering】
概要
コンテンツベースフィルタリング(content-based filtering)とは、ネットサービスなどで提供する情報を利用者ごとに自動的に最適化する手法の一つで、提供する各内容についてその特徴を表す属性情報を与え、ある内容を見た人に似た特徴を持つ内容を提示する方式。解説 例えば、オンラインショップでは個々の利用者の過去の購入履歴や商品ページの閲覧履歴などを記録しているが、ある商品のページを見た人に、製品カテゴリーやメーカー、価格帯、想定顧客などが近い別の商品を「おすすめ」として表示する。
商品などの提供内容には、あらかじめ同じ項目や基準で属性情報を付与しておく必要がある。内容間の類似度の判定にはコサイン類似度などの統計的な手法が用いられる。リコメンデーションやパーソナライズなどの機能を実装するための有力な手法として広く普及している。
一方、似た属性を持つ別の利用者の履歴を統計的に分析して、好みそうな内容を推薦する手法は「協調フィルタリング」(collaborative filtering)という。コンテンツベースフィルタリングは提供内容の属性情報があれば良いため、履歴情報が十分に蓄積されないと推薦が機能しない「コールドスタート問題」を回避することができる。
ただし、利用者の行動データは利用できないため、属性情報から直接推測することができない利用者共通の嗜好などは見逃してしまう。実際のネットサービスでは、推薦の精度や多様性を向上させるため、一定のルールに基づいてコンテンツベースフィルタリングと協調フィルタリングを併用することも多い。
(2025.10.2更新)