photo by Shawn Collins via flickr (CC BY 2.0)
Google は初めての検索エンジンでしょうか……? 違います。では、Googleは最後の検索エンジンでしょうか……?もしかすると。
この数年ほど、検索エンジンを作ろうという野心的な試みは、西海岸のスタートアップの間でもほとんど耳にしたことがありません。
Instagram検索やTwitter検索などは、リアルタイムな情報やよりリッチな情報を探すための、検索エンジンの代替として使われ始めています。
しかし、それでも、今後、Googleの直接的な競合が生まれるとは(いまのところは)思えません。
いかにしてGoogleはこれほど巨大な存在になったのでしょうか?
そもそも、Google以前のロボット型検索エンジンは、どのような仕組みを取っていたのでしょうか。
当時の検索エンジンをまとめた論文を読んでみましょう。(参照:「
Search Engines for the World Wide Web: A Comparative Study and Evaluation Methodology」Heting Chu, Marilyn Rosenthal1996)
例えば、当時最大級の検索エンジンだったAltavistaについては、こう記載されています。
“1996年1月までに1600万を超えるWebページの全文をインデックスしますが、更新頻度は明らかになっていません。AltaVistaのドキュメントによると、1日に250万のWebページを取り込み、1時間に1GBのテキストをインデックスしています。
検索結果の表示順序や関連性ランクは、一致する単語の位置(例えば、タイトルまたはテキストの本文)、一致する単語の出現頻度、および一致する単語間の距離(すなわち、何ワード離れているか)によって決定されます。”
Altavistaと同じように、当時の検索エンジンの殆どは、Webページの中身を解析し、検索クエリがどの程度出現しているか、という頻度や距離を使って順位づけする仕組みになっていました。
全文検索エンジンの問題は、スパムが非常に容易な点にあります。出現頻度だけで計算するなら、ただひたすら文字を増やせばいいだけですから。これは「ワードサラダ」と呼ばれ、Googleの初期ですら頻発した問題です。
●ページランクとは?
ラリー・ペイジとサーゲイ・ブリンが考案したページランクは、そのような状況を変える上で極めて画期的なテクノロジーでした。
ページランクとは、とても簡単に言えば
・多くのWebページにリンクされているWebページは、質が高い
・質が高いWebページにリンクされているWebページは、同じように質が高い
という仮説を元に、Webページを点数化するアルゴリズムです。このページランクを使えば、以前のように単語をひたすら入れれば上位に表示される、ということはありません。
つまり、より正確な結果が表示できるというわけです。
●ページランクの設計思想
今日のGoogleの設計思想にも繋がる点は、既に1999年に、ラリーによって書かれた論文にて述べられています。(参照:「
The PageRank Citation Ranking Bringing Order to the Web」Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd1999)
“Webページは「今日のランチにジョーは何を食べますか?」という質問から、情報検索に関する論文まで、様々な質問に答え、経験の浅いユーザーのためにも検索順位を操作しなければなりません。”
これを見る限り、ラリーが非常にヴィジョナリーな視点で検索エンジンを捉えていたことがわかります。今日に見られるような音声検索や、AIによる質問への応答につながるのではないでしょうか。
●Googleのテクノロジー
ともあれ、ページランクを含め、Googleの技術は他を圧倒していたようです。
Quoraに、なぜGoogleがAltavistaに勝ったのか? という質問が投稿され、Googleを最初期から利用しているユーザーのコメントが載っています。(参照:「
Why did Altavista search engine lose ground so quickly to Google?」 – Quora)
“誰かがこのスタートアップ、Googleについて教えてくれました。私はやや懐疑的ながら、アニメのようなロゴのあるサイトにアクセスしました。
最初にGoogleで検索したとき、すぐに結果が表示されました。
私はこう思いました。「彼らは本当に検索したわけじゃない。速いと思わせるために、いくつかの結果を投げただけだ」
しかし、結果を見ると、驚くほど関連性の高いページが表示されていました。
私は別の質問をしました。同じように瞬間的に、驚くほど関連性の高い結果が帰ってきました。”
彼によれば、とにかく早く、関連性が驚くほど高かった、ということです。