noindex
概要
noindexとは、Webサイトの運営者がWeb検索エンジンの動作を制御する手段の一つで、当該Webページを収集・索引付け(インデックス)しないように指示すること。meta要素のname属性を “robots” に、content属性を “noindex” に設定する。多くのWeb検索エンジンの収集プログラム(ロボット/クローラ)は、読み込んだWebページに管理者が制御用の構文を記述している場合は、その記述に従ってページを取り扱うようになっている。
noindexはそのような制御構文の一つで、検索エンジンが読み込んだページを索引付けして検索結果に登場させることをしないよう要請する。HTMLのヘッダ領域(head要素の内部)に <meta name=“robots” content=“noindex”> というmeta要素を挿入する。
逆に、収集・索引付けを行わせたい場合は何も指定しなければよい(このようなmeta要素を記述しなければよい)が、明示的に要請したい場合や、ページを自動生成する際にnoindexでない場合にも何らかの値を出力したほうが都合がよい場合などには “index” という値を指定することもできる。
name属性がrobotsであるmeta属性(robotsメタタグ)はクローラや検索エンジンの動作の制御に用いられ、noindex/index以外にも、ページ中のリンクをたどらない(無効とする)よう要請する「nofollow」や、検索エンジン側にページデータ(キャッシュ)を残さないよう要請する「noarchive」、検索結果にページ本文の一部を表示しないよう要請する「nosnippet」などがある。noindexとnofollowを同時に指定したい場合は content=“noindex,nofollow” とするか content=“none” としてもよい。
(2021.11.10更新)