リンク分析アルコリズム

リンクの数や質、関連性を考慮。質の高いリンクを数多く持つページは良いページと判断する 。スパムの増加に対応して、分析方法は年々複雑化して いる
-リンクでページの重要度を判断する手法
リンク分析アルゴリズムとは、張られているリンクの数や質な ど複数の要素によってウェブページの重要度を判断しようという 手法です。このアルゴリズムの代表例が、 Google のPageRank ページランク技術や、Ask.com のEx pertRank (エキスパートラ ンク) といったものです。Yahoo! は当該アルゴリズムに特定の名称、はつけていませんが、基本的に同じしくみを持っています。
名称は異なれど、いずれもリンクを使ってウェブページの重要度を 判断し、検索エンジンの順位を決める際の指標として用いら れています。
基本的に、 次のような考え方に基づいて判断します。
-より多くのウェブページからリンクをもらっているページは 重要である
-人気のあるウェブページからのリンクは、人気のないページからのリンクよりも大きな意味を持つ
-同じ話題を扱うウェブページからのリンクは、そうでないベージからのリンクよりも大きな意味を持つ
もともとリンク分析アルゴリズムは 「よく引用される論文は良 い論文という学術の世界の発想をウェブに持ち込んだものです。 良い情報を持ったウェブページやユーザーに人気のあるウェブページは、他の多くのウェブページからリンクをしてもらえるものです。通常、意味のないウェブページにリンクは張られませんの で、リ ンクをたくさん受けているページは 、ユーザーに価値のあ る情報を提供しているページであると推定できるのです。
検索エンジンがわかればSEO がわかるで、もともとページ内要因によってのみランキングを決めていた検索エンジンが、検索エンジンスパムに対抗するために、そして検索精度を 高めるために リンクを使ったペ ージの評価 をお こなうよ うになっ たことを説明しました。
しかし、検索エンジンがページ外要因を評価していることが知れ渡ると、今度はリンクを不正に操作することでランキングを上 昇させる検索エンジンスパムが登場するようになりました。例え ば、自身で1 000 ものサイトを立ち上げて、相互にリンクしあうこ とでリンクの点数を人工的に作り上げたり、あるいは、不特定多 数のサイ ト運営者をネッ トワーク化して相互に リンクさせるといった手法で した。
これに対抗するために、検索エンジン側もスパムを排除する技術や、より適切に リンクを評価するためにアルゴリズムの改善に 取り組んできました。
総合的に判断するリンク分析アルゴリズムの代表例であるGoogleのPageRank は、 2000年当時はリンクの数と質、つまり、より人気の高い ( =質のいい)ページからより多くの(=数が多い) リンクを受けているページが良いページであるというアルゴリズムを持っていました。 しかし今日の検索エンジンは、リンクの数や質だけでなく、 リンクの 「関連性信頼性」さらに「時間」といっ た観点からも評価をします。
これら 判断指標は各々が独立して点数化 されるのではなくて、 これら指標を組み合わせて総合的に1つ1つのリンクを評価しま す。 例えば 数が多いし「関連性」もあるけれども信頼性は低 いから、この リンクはあまりよくない、といった具合です。