PageRank 【ページランク】
概要
PageRank(ページランク)とは、Webページ間のリンク構造を解析し、各ページの重要度を算出する手法。また、その手法を用いて算出されたWebページの重要度を表す指数。米検索エンジン大手グーグル(Google)社の創業者であるラリー・ペイジ(Larry Page)氏、セルゲイ・ブリン(Sergey Brin)氏によって1998年に考案された。学術論文が他の論文による引用数により評価を受けることになぞらえ、あるページから別のページへのリンクをある種の支持表明とみなし、より多くのページからリンクされているページは重要度が高いとする。
また、外部から多くのリンクを集めているページからのリンクは、他から言及されていない孤立したページからのリンクよりも価値が高いとみなす。ただし、ページ内に複数のリンクがある場合は、リンク先へ送る支持もリンクの数だけ分散すると考える。
これらを得点のやり取りとみなし、実際のページ間のリンク構造を元に各ページ間で得点の流れを計算した結果が、そのページの持つPageRankスコアであると考える。
極めて単純化した数値で例えると、あるページに得点1を持つ10ページからリンクを張られる(そのページにしかリンクしていないとする)と、そのページには10点が与えられたと考える。そして、そのページに他の2つのページへのリンクがあれば、それらへ5点ずつ与えたと考える。このような得点の流れを繰り返し計算していくと、リンクの集まり度合いに応じて各ページに固有の値が算出される。
Googleをはじめとする現代の検索エンジンの多くは、検索語と各ページの内容の関連度の高さといった内容面での評価と共に、インターネット上のリンク構造から算出したPageRank的な重要度を加味して検索順位を決定していると言われる。
ただし、このような算定方式が公知になったことで、順位を向上させたい事業者などが多数のサイトを開設して人為的にリンクを増やしたり、リンクを売買するといった対策を行うようになり、リンクをページ間の支持投票とみなす本来の趣旨が歪められる結果となってしまった。
このため、現在では人為的リンクと考えられる特徴を検知したら計算から除外したり、ページ内でのリンクの数や出現位置(上部から一定の数や範囲を重要度が高いとみなす、あまりにリンクが多いページは無視する等)や、サイト内での同一リンクの数(多数のページに共通するものは重要度が低いとみなす等)などを参考に、個別にリンクの価値を測った上で算出していると考えられている。