Google144704-300-300

Googleダンスという言葉を知っていますでしょうか?接続するGoogleサーバによって順位が替わる現象です。実は今も発生しています。過去のGoogleダンスとは少し異なる理由で。

Googleダンス(Google Dance)とは

まだ、Googleのデータセンタの数も非常に少なくインデクスの同期も遅かった2000年頃、Googleの順位は参照するデータセンターによって異なりました。

クロールしたデータとデータセンターの各インデクスに差分が生じていました。この差分を補完する処理に時間が掛かったためデータセンターによって異なる検索結果となっていたのです。スケーラビリティを確保するためにDNSラウンドロビンによるサーバの切り替えも発生していました。

これがGoogleダンスです。最終的には月1回統合されるのですが、統合までに何週間もかかる時期も有りました。(~2003年)。その後 Googleは処理の方式を大幅に刷新しインデクス更新は極めて高速になりました。

Googleダンスは現在でも

そして、今も、それは起きています。但し2000年初期とは全く異なるレベルで。

USC(南カリフォルニア大学)の報告によると、Googleは検索レスポンス用中継サーバの数を200(2012年10月)から1400(2013年6月)以上に増やし、提携ISPの数も100から850以上に増やしました。その結果、僅かに差分が生じるケースが発生しています。しかし、一般には、ほとんど気にする必要の無い変化です。

スクリーンショット 2013-11-23 18.27.24

スクリーンショット 2013-11-23 18.28.10

以下から半年間のサーバー拡張の様子を確認できます。(GIFアニメ)
http://www-bcf.usc.edu/~katzbass/mappinggoogle/animatedmap.gif

Googleがここまで数を増やしたのも、Googleは0.01秒を追求する会社であり速度と収益の関連性に付いて尋常ならぬ執着が有るからです。彼らは常に効率的で快適な検索環境を提供したいと考えています。広告事業の高い収益率を維持するために地元ISPと提携して、よりスケーラビリティに富んだ高速ネットワークを日夜開発しています。

これを前提に、2012年〜現在までのGoogleの検索に対するスタンスやアルゴリズムの変化を考えると「あの時、Googleは、なぜこのようなことを言い始めたのか?」も理解しやすくなりますね。無駄を減らし、限られたリソースの中でリアルタイム検索をどこまでも追求していきたいのでしょう。

余談ですがー
今、「Googleダンス」と検索すると以下のGoogle CM動画がヒットしますね。