Googleのナレッジグラフは「Wikipedia」に書いてあるようなことでは、トラフィックを運ばなくなると思っていましたが、そうでもない事に最近気付きました。今回は推論まじりに「猫で読み解くGoogleナレッジグラフの限界」を解説ニャー(=^.^=)

これ猫のロシアンブルー(=^.^=)です。
IMG_4346

ロシアンブルーとシャルトリュー

ロシアンブルーで検索するとお決まりのカルーセルとナレッジグラフが出てきます。

スクリーンショット 2014-01-02 21.03.11

絶望的な程に良くできているように見えるナレッジグラフですが、無類のロシアンブルー好きでこんなボードまで作っている私には不完全。0点。

ロシアンブルーに間違いが2カ所

20140102

赤枠内はシャルトリューという品種。すぐに判るのが「カッパー(黄銅色)」と呼ばれる目の色にあります。
「ロシアンブルー」とされている写真は掲載元ブログでは「ロシアンブルーじゃ無いですよ。シャルトリューですよ。」という比較の記事。それでも間違います。

ではシャルトリューはというとこれは、正確。ロシアンブルーとされたシャルトリューが、シャルトリュー側にも。

2014010201

alt=には「シャル様」と入っている事から、altは、このケースでは価値が無い。

検索上の相違点

2つの猫種の言及も全く様相が異なります。
・ロシアンブルー(インデクス446,000)とシャルトリュー(インデクス638,000)は拮抗している。

・ロシアンブルー(月間検索回数22,000)とシャルトリュー(月間検索回数3,600)でシャルトリューは少数派。

・ロシアンブルー(619ブログ)はブログ村でも上位のコミュニティ。シャルトリューは少数派(66ブログ)。

シャルトリュー(少数派)にロシアン(多数派)が混じるならともかく、ロシアン(多数派)にシャルトリュー(少数派)が入る理由は?

文字にすると全く違う猫

ロシアンブルー シャルトリュー
毛並み ダブルコート シングルコート
毛色 ブルー ブルーグレー
目の色 エメラルドグリーン、グリーンイエロー カッパー、イエロー、グリーン
タイプ フォーリン セミコビー

そこでなぜ取り違えたのかを考えてみました。
そもそも、なぜ、この写真なのでしょうか?

ここで1つの推測

写真と文字の近接性、そして、写真内に文字が無いプレーンな写真、そして何より、「ロシアンブルー」や「シャルトリュー」とタイトルに入った記事が希少なのでは無いでしょうか?

近接したテキストにロシアンブルーが無い

少し考えてみると判ることが、「うちの子」「●●ちゃん」で綴った時、Googleは反応しません。そして、そういう表現は多いですね。

ロシアンブルーの場合、飼主は「ロシ」「ロシアン」と略称する傾向にあります。人間が読めば「ロシ」は周辺の写真から「ロシアンブルー」である事を認識可能ですが、Googleは写真と文字を正確に関連付けられていません。

ロシアンで辛うじて「ロシアンブルー?」とGoogleは返しますが、その写真もシャルトリュー。
2014010403

「ロシアンブルー」と明確に綴り、そこに十分(とGoogleが考える)品質の写真があり、それが古くから認識されていたページのサイト内であれば、Googleはそう認識するのです。ロシアンブルーではなくても。

画像認識では分別できない

色も体系もたまたま似ている画像。画像だけでは相違を認識できない。というか猫の顔を認識できません。キャットタワーにいる猫の写真の類似画像検索すると「キャットタワー」の候補を返します。

形状が変化する物体は認識できないようです。ケージに入っているのはだめ。子猫も駄目。明るい色の家具の上にいると家具を認識します。
人間ならシルエットだけで猫だと認識できますが、Googleはまだ出来ません。

写真の質が問われる

「ロシアンブルー」で画像検索してみましょう。(画像をクリックするとGoogle画像検索結果へ)
2014010401

不自然な点に気付かれました?

画像が綺麗すぎるのです。まるでカタログです。Googleは、猫種は判らずとも画像の掲載元と写真のテーストは選別しているのではないでしょうか。

つまり画像を選別するのが大事

「全体が写っていて」「正面を向いていて」「文字が無く」「背景とのコントラストが明確」、確かに意外にないです。なるほど、画像SEOって、実は「写真の選別」と「写真近辺の文字」が重要なのですね。特に被写体が黒っぽい場合、背景とのコントラストの取り方が難しい。

■ポイント:
・背景と対象がハッキリしている写真を選ぶ。
・コントラストと輪郭を調整する。
・写真の前後に関連づけるテキストを入れる。
・写真に飾り文字や宣伝文句を追加しない。
・タイトル(titleタグ)と写真を関連づける。
・対象の方が背景より暗い場合、背景をぼかす。

猫の品種も正確に分類できないのが今のナレッジグラフ。全然ナレッジじゃないから、画像を評価させるときはしっかり調整しましょう!

蛇足

まぁ猫の種別を見分けるのは確かに難しいですね。

ロシアンブルーは主にヨーロッパで好かれていたため、第2次世界大戦で劇的に数を減らした。数を保持するために、「ブリティッシュショートヘア」との交配が行われている。「シャルトリュー」の祖も「ブリティッシュショートヘア」であるため近似するのは当然。さらに幼児期は、「ロシアンブルー」「シャルトリュー」「ブリティッシュショートヘア」「コラット」の4品種は目の色が全てイエローで、分別が難しい。被毛も伴っていないため、よほど強くスタンダードの傾向が出ていないと、それを判別するのは写真では不可能である。

そもそもロシアンブルーは人気品種であり、数が多い。数が多くなると交配は容易だが、スタンダード以外(時にミックス)も増える。スタンダードから少し離れた品種は「コラット」や「シャルトリュー」に極めて似ているため、それを分別するのは写真では難しい。ロシアンブルーに見えても「コラットです」と書かれていればそれを信じる。

なぜなら「わざわざ少数派の名前を出しているくらいだから、そうなんだろう」と思うから。

ロシアンブルーを写真で判別するためには目の色意外にもう一つある。それはシッポの陰影。上記4品種のうち唯一ダブルコートのロシアンブルーはシッポに縞模様が浮き出る事が多い。被毛の状態は写真だけでは見分けがつかないがシッポの縞で判る場合もある。

ということで、ロシアンブルーの飼主は自分の猫様をロシアンブルーってまず、書くといいと思います。