Google検索クエリ暗号化(SSL)でキーワード取得は不可能になる


過去の投稿にも書きましたが、Google検索がSSL通信(HTTPS)を標準で採用し、検索キーワードを暗号化しました。暗号化されたキーワードは全てnot providedとなり詳細不明の状態になります。

Googleは検索結果のすべてをSSL化(https)(*1)にリダイレクト(*2)したようです。google.co.uk等も前の記事を書いた時はリダイレクトしなかったのですが、今はされています。マイナーβのブラウザはリダイレクトされませんが、それは極めて例外で99%取れなくなるのは間近だと思います。

■【影響は?】検索語句(検索クエリ)を参照できなくなる。

SSL化してGoogleから流れるデータを暗号化するためユーザと検索語句(検索クエリ)(*3)をひも付ける事が困難になります。
Google Analyticsでは(not provided)と表示されます。他のサードパーティツールであっても状況は同じです。

notprovidedcount.com/によると、その影響範囲は現時点で75%(サンプル統計)。Googleの検索大半はいずれ検索語句(検索クエリ)が供給されなくなると思います。

スクリーンショット 2013-09-24 17.21.51

■【対象は?】google.comやgoogle.co.jpなどでGoogle本体で検索した時

・googleドメインで検索したときのみ影響を受けます。
・ブラウザ毎に対応が異なりましたが、2013/8〜はブラウザの対象を大幅に拡張したようです。

Googleからデータ提供を受けている、Yahoo!JapanやGoogleパートナー(BiglobeやOCNなど)は各運営会社のポリシーによって対応が異なるようです。現時点(2013/9/23時点)では検索語句(検索クエリ)を取得可能です。

■【いつから?】サイトによって状況が違います

・対応がサービス別、ブラウザ別、国別であったため早くから影響を受けているサイトもあれば、急に(not provided)増えたと感じるサイトも有ります。

2011年10月 Googleサービスにログインしたユーザを検索語句(検索クエリ)隠蔽
2012年7月 Firefox
2012年9月 iOS版Safari
2013年1月 Chrome
2013年8月 他のブラウザ群に対応したと思われます

もっと細かく対応しているかもしれませんが、大きな影響が8月末に出ている事から、この辺りでMSIE10(Microsoft Internet Explorer 10)やMSIE9などシェアの大きなブラウザに対応したと思われます。
ネットでも意見は様々ですが、サイトにより受け取り方はかなり違います。

■サイトA
スクリーンショット 2013-09-24 17.47.19
■サイトB
スクリーンショット 2013-09-24 17.47.48
同じ期間でも2つのサイトで傾向が大きく異なります。サイトAは急激な上昇。IE9,IE10が多いECサイト。サイトBはChromeが多数派にになりつつ有るB2B系(IT)です。

なので、「全く変わっていない」というサイトオーナーもいれば、「凄い増えた」と焦っている方もいると思います。

■【なぜ?】強制SSL化の意図

元々、長期の計画では全SSL化を検討していたような節があります。しかし、PRISM(*4)問題で盗聴されている事が明らかになったため、SSL化を急いだと思われます(推測です)。

「Googleが情報の隠蔽を図った」、とか、「Adwordsの価値を高めるためじゃないか?」囁かれていましたが、これを全面否定した上でSSL対応とキーワードの暗号化を認めたようです。

■【今後は?】Googleウェブマスターツールで

キーワードはアクセス傾向としてウェブマスターツールから確認できます。個人とのつながりを消した統計的な情報なら問題ないという判断なのでしょう。ウェブマスターツールの検索語句(検索クエリ)の保存期間を1年にする予定なのも、このSSL化に関係あるかもしれません。

いずれにせよ、検索語句(検索クエリ)とコンバージョンを細密に取得するのは困難になりました。時代を巻き戻すようですが、トラフィックの総体価値とサイト上で再トラッキングする仕掛けから成果を図るしか無いようですね。個人的には困るんですが仕方が無い。


【用語解説】
*1 SSL Secure Socket Layer 暗号化通信を指す。第三者に通信パケットを傍受されても暗号化されているためサーバとユーザ間の情報は隠蔽される。盗聴・傍受による複合化は天文学的な試行回数が必要で不可能に近いとされている。SSL接続はURLがhttps://となる。それを偽装するサイトも有るので過信は禁物。

*2 リダイレクト Redirect 特定のページやサイトを他のサイトに自動的に遷移させる事。HTML等で制御するソフトリダイレクトとサーバで制御するサーバリダイレクトがある。ページが移転した時や、通常通信からSSL通信に切り替える時に使用されるが、悪用されてフィッシングサイトに強制遷移される等するたえ利用は慎重に行った方がいい。

*3 検索語句・検索クエリ 検索する際に検索キーワード入力欄に入力された文字列。検索キーワード等とも呼ばれる。これらはサーバのURL(検索エンジンのドメインURL)等と併せてリファラ(refer)としてサイト側からも確認可能であった。(Googleは今回の処置でリファラを取得不可能にした)。個人の趣味・嗜好と検索キーワードは合致しやすいため、個人の行動を解析・監視するスパイウェアに悪用可能。但し、ネットワーク全体の中で個人を特定するには膨大な解析能力が必要である。今回はアメリカ国家安全保障局(NSA National Security Agency)がテロ対策として多くのネットワークデータを傍受していた事が暴露された。
2013年9月 Adwordsの日本語用語として「検索クエリ」から「検索語句」へと改名されている。

*4 PRISM(プリズム) アメリカ国家安全保障局(NSA)が2007年から行っていた通信の傍受と監視のプロジェクトのコードネーム(略称ではない)。Facebook、Google、Yahoo、Apple、AOL、Skype、YouTube、PalTalk、So.cl等が対象となっている。例えば電子メールや通話内容(Skype)等も記録されていると報じられている。


関連記事

コメント

  • トラックバックは利用できません。

  • コメント (0)

  1. この記事へのコメントはありません。

ページ上部へ戻る