コンテキストウィンドウ【context window】
コンテキストウィンドウとは?

チャットAIなどの会話において、モデルは過去のやり取りをすべて記憶しているわけではない。直近の会話履歴、利用者の入力、システムへの指示などをコンテキストウィンドウに収め、これを入力として次の応答を生成する仕組みになっている。遠い過去のやり取りなど、ウィンドウから外れた情報はモデルからは見えなくなる。
コンテキストウィンドウの大きさは「トークン」(token)という単位で測られる。トークンとはテキストを細かく分割した最小の処理単位であり、システムによって分割の基準や平均の長さは異なる。日本語では概ね1〜2文字、英語では単語の一部または1単語に相当することが多い。モデルによって上限は異なり、数千トークンのものから、100万トークンを超えるものまで存在する。
ウィンドウのサイズが大きいほど、長い文書の要約、複数ファイルにまたがるコード解析、長期にわたる対話の維持といった処理が可能になる。一方、処理するトークン数が増えるほど計算コストも増大するため、用途に応じた適切なサイズの選択が求められる。内容は基本的にシステム側が自動的に管理するが、新しいチャットを開くとリセットされるなど、利用者側でもある程度制御することができる。
なお、コンテキストウィンドウはあくまで「一時的な作業領域」であり、会話が終了すればその内容は保持されない。長期記憶が必要な場合は、履歴データの外部データベースへの保存や、外部の情報を取り込んで生成処理に加える「検索拡張生成」(RAG:Retrieval Augmented Generation)といった別の仕組みを組み合わせる。