Googleはコンテンツの文面を可能な限り多角度で評価しています。今回はコンテンツに関する検索品質ガイドラインに付いて読み解いていきます。もし、自分のサイトの幾つかが十分な順位を獲得していない「評価が低い」なら十分に内容を理解してリライトしてみましょう。良い結果をもたらすと思います。
まず、Googleは検索クエリに紐づくコンテンツを3つの分類で評価しています。メインコンテンツ(MC/ Main Content)、補助コンテンツ(SC /SUpplementary Content)、広告スペース(AC)です。この記事ではメインコンテンツ(MC)についてのみ言及します。
【目次】Googleが評価するメインコンテンツ指標を理解する
- コンテンツで高評価される2つの指針
- 低品質コンテンツの指針
- コンテンツ品質を6段階定義
- 評価で「役立つ」とされるコンテンツの文字数とは
- Googleの評価者は低品質をどのように見分けているか
- 低品質判定をどのように回避するか
- 低品質判定は慎重に行われている(筆者意見)
- キュレーションはコピーコンテンツか?(筆者意見)
- おわりに
コンテンツで評価する2つの指針
1)誰かに役に立つ事
役立つの定義はいずれかに当たります。
- 論文的である。(十分な時間を掛けて構築された文章)
- 辞書的である。(正確で優れた引用と解説)
- レシピ的である。(そのレシピを使えば目的を達成できる)
- 教育的である。(何らかの学習意図を達成できる)
- 編纂的である。(何らかの目的をもって情報を一元化している)
- 啓示的である。(何らかの切っ掛けを与えるために存在している)
- ニュース的である。(何らかの情報を一早く伝えている)
2)誰かを楽しませる事
クエリは限られますが「くだらない」は低品質とは言わない。
- ユーモアが有り人を喜ばせる。
- 芸術的である。
- 特定のコミュニティに有益である。(趣味・関心)
- コミュニケーションを提供している。
低品質コンテンツの指針
目的の欠如:存在価値が他者に向けられていない(自分のためだけに存在している)ページは低品質である。
多くの場合、自分中心の文章でも備忘録でも、「一定のスキルや人生観により他者に影響を与えます」。意識しなくても自分に近い誰かに価値があります。ここでの目的の欠如とは、「整った文書に見えても、それがリンクビルディングのためだけに使用されている場合」を指します。
有害な目的:明らかに有害なまたは悪意のあるページ。たとえば、”フィッシング詐欺”目的のページ。
目的は、個人情報やクレジットカード情報を盗むことであるため有害です。悪意のあるダウンロード等も、有害なページです。
広告詐欺:一見すると正しい目的のページに見えますが、通常リンクが広告であり、表現と対象が異なっている等、明らかにユーザを騙して、クリックさせる事で収益を得ようとするコンテンツ。
収益目的であっても、内容が他者の役に立つ条件を満たしているなら問題有りません。「全体が低品質でサイトが詐欺的な広告クリックだけのために作られているサイト」を指します。
その他の低品質の定義は以下を確認して下さい。
https://support.google.com/webmasters/answer/35769?hl=ja#3
コンテンツ品質を6段階定義
コンテンツの品質は以下の6段階に分類されます。
- highest(最高)
- high(高)
- medium(中)
- low(低)
- lowest(最低)
- no main content(メインコンテンツが無い)
• highest(最高)/ high(高)
- 専門家(権威性)と認定(公的資格)を持つ人々や組織によって書かれている
- 書式スタイルに倣って時間を掛けて編纂されている。
- 定期的に更新し、時間と労力を掛けて品質を維持している。
- 独自の経験をユーザーと共有するためにコンテンツを作成する時間と労力を費やしている。
ここで言う専門家とはジャンルによって解釈がことなります。医療関係であれば権威あるドクターの論文がhighestです。そして家庭的なテーマであれば私たち自身も含まれます。私たちは自分の生活に於ける”専門家”です。例えば、あなたの飼うペットに関してはあなたも専門家です。例えば、あなたは、あなたの子供の親として専門家です。
これらの知見はソーシャル・ネットワーク上での高品質なコンテンツです。
• low(低)• lowest(最低)
- 誤字脱字が多く、校正されていない乱雑な文章。
- 百科事典やWikipediaの引用、言い回し。
- 文書構造が既に誰かの書いたコンテンツに近似している。
- 判りきった極めて安易な文章。
- 自動生成されたコンテンツ
- 意味が通っていない。(チンプンカンプン/gibberish)
ex:Q&Aどちらもよく出来ているように見えるが質問の答えとは全く関係ない。
ex:突如、まったく関係の無い引用が登場する。
- 完全な記事コピー
- オンラインで文章を買う。(*)
Googleは簡単な構文の合致をある程度自動識別が可能です。僅かな単語の変更や順序の入れ替え、一部の削除程度ならコピーとして判定します。文章ではなく構文構造でも判断可能になりつつある点に注意して下さい。
*オンラインで文章を買う → 文書を売っている(外注)かのように見せかけてリンクを売っている実態を問題としています。ライティングを外注する事自体は問題とならないでしょう。
評価で「役立つ」とされるコンテンツの文字数とは
それは絶対的な文字数に依存しません。扱うテーマによって必要とされるコンテンツのボリュームが異なるからです。例えば「流行のアクセサリ」と「有名な歴史事件」が同じ文字数で評価されているとしたら「違和感」を感じるでしょう。「小説そのもの」と「その書評」もしかり。
長い短いではなく、必ずカテゴリ、ジャンルにあった定型があり、それが最低限記載されている事と、なによりユーザの利便性が最重要です。
Googleの評価者は低品質をどのように見分けているか
・実際に読む。読めないページは低品質。(文字化けなど物理的品質)
・特徴的な言い回しを完全一致で検索し合致ワード先のサイトを確認する。(文章の一致)
・オリジナルと注釈の比率。
・写真・図版のオリジナルを確認する。(画像の完全一致)
・著作者表示を確認する。
*言語の違いは考慮されます。専門言語以外は評価しない(白黒付けない)ようです。
*根拠が揃うまで「疑わしき」は評価が保留されるようです。
*評価は複数人で行われ専門的観点も評価しているようです。
低品質判定をどのように回避するか
不本意にも低品質と見なされる場合があるでしょう。それを回避するためにSEO(Search Engine Optimization)的視点が必要となります。
・文字コードや特殊記号を配慮。
文字コードや特殊記号などは幾つかの機種に依存する。完全に補完できるCMSで無い限り、HTMLにUTFと書いてShift-jisと不正な改行コードが大量に入っている等のケースも多い。「自分しか正しく読めない」状態に陥ってないか確認しましょう。
・参考にはしてもコピペで文章を作らない。
元ネタをコピーして言い回しや一部単語だけ編集するのはコピーです。すでに検索できるサイトからのコピーは、ほんの数行のコピーでも判定されます。悪意が無くても。
・自分で調べて記載する。
GoogleはWikipediaを盲目的に高い評価にしている訳では有りません。Wikipediaの中にも優れたページがあるという程度です。Wikipediaの誤った情報を元にコンテンツを作成すると正しい評価を得られない場合があります。
・RSSフィードを切り出すだけの情報提供は行わない。
機械的なRSSフィードの再掲載は「コピーコンテンツ」です。このようなシステムを提供したいと考えているなら、切り口と分類方法をユニークにする必要があります。
・ありきたりの画像やサムネイルを多用しない。
文字には配慮しても、画像には無頓着な場合があります。用途によって画像は重要ですが単なるアイキャッチのために完全コピー画像を使用するのは止めましょう。
・画像の誤用を避ける
アメリカ西海岸のイメージ写真に南欧の風景写真を使用するのは明らかに誤用です。画像を使う時は最低限の確認をしましょう。
・キュレーションはカテゴリで分類する。
散逸したキュレーション、例えばある時はIT、ある時は料理レシピである場合、それらを同一のサイト、同一のカテゴリで扱うのは不適切かも知れません。カテゴリできちんと大分類を確定させておきましょう。
・外部評価を受け付ける仕組みを提供する。
ソーシャルブックマークやコメントの表示等、外部から評価しやすい仕組みを提供する事も重要です。
・不公平な比較を行わない
競争者が一方的であり、あたかも全体の総意であるかのような表現で特定の商品を薦める(貶める)内容は不適切と判断される恐れがあります。
・著作者と引用元を明確にする
著作者情報はコンテンツ判定に重要な意味を持ちます。引用元の明確さ(提示)も必要です。何れも無い場合、厳しくジャッジされる可能性があります。
低品質判定は慎重に行われている(個人意見)
品質ガイドラインを読む限り複数のチェック・ポイントがあり、ほとんどのコンテンツは、そのどれかをクリアしています。コピーがあるから低品質、オリジナルだから高品質という事では有りません。
品質ガイドラインは事例を多く使用してコンテンツの評価を慎重に行うように促しています。もし、コンテンツに問題がありlow/lowestになるのは相当「ひどい」という事であり、サイト管理者も自覚している部分があるのではないでしょうか?
キュレーションはコピーコンテンツか?(個人意見)
現時点でキュレーションという言葉はコピーコンテンツとの違いを説明するために使用されています。正しいキュレーションの定義に従っていればコピーコンテンツでは有りません。
キュレーションとはー
特定の目的に基づいて情報の整理・再編集を行い新たな価値を定義するもの。語源は図書館館長「Curator(キュレーター)」でです。
Googleが目指す全ての情報を検索可能にする理念と同じにするもので、キュレーションはコピーではなく情報整理役という事になります。
では、自動収集ロボットのコンテンツとキュレーションをGoogleはどのように見分けているのでしょうか?
現時点では見分けが困難な部分が多分にあると思います。初期のパンダアップデートではオリジナル側がペナルティを受けるという場面も有り、未成熟な部分も多分に有ります。外部評価(被リンク数やソーシャル言及数)でしか判別できない部分も残っていると思います。
おわりに
コンテンツの内容評価も重要ですが、判断指標の一つでしかありません。あなたが、チープ、薄いと感じている記事もGoogleからは高い評価を受けている場合があります。時として順位に不満を持つかも知れませんが、それは他の部分の評価で劣っていると考え、研究し、改善する事が重要です。
またコンテンツの最終判断は多くの人が感じる総意へと近づいていきますので、内容がどんなに良くても最初の評価はありきたり(so-so)である場合もあり、特定クエリで高い評価を受けるのには時間が掛かる場合もあります。
人間による評価は自動品質精度を上げるまでの過渡期です。未成熟な故に誤った判定をするかもしれませんが、いずれは正しく評価されるようになるでしょう。その前にペナルティを受けてしまったら勿体ないですよ。