SEO Mythbusting S2エピソード4:URLの正規化とCanonicalタグ
2020年08月18日
SEO

Google WebmastersのYouTubeチャネルで配信されたSEO都市伝説の誤解を解くシリーズ「SEO Mythbusting」のシーズン2、エピソード4を翻訳してお届けします。
(エピソード3はこちら

今回のテーマはURLの正規化とCanonicalタグ、ゲストはBuiltvisibleのテクニカルSEOコンサルタントのRachel Costello氏です。(このエピソードの録画当時はDeepCrawlのテクニカルSEOとコンテンツのマネージャーだったようです)

以下、エピソードの内容をご紹介します。

以下、シーズン2エピソード4の内容をまとめます。一部省略や言い換えをしておりますが、主な意味が失われないようにまとめるようにしております。

Note:英語の動画ではURLの正規化に対しても、Canonicalタグに対しても「Canonical」という表現を使っていますので、こちらの判断で「URLの正規化」と「Canonicalタグ」の使い分けをしています。
URLの正規化とは、同一または同一に近い内容のページが重複して複数のURLで存在する場合、そのうちの1ページのURLを検索エンジンに正規URLとして認識してもらいインデックスしてもらうことです。Canonicalタグとは、URLの正規化のためにサイト側でできる施策・正規化シグナルの1つです。
Search Console ヘルプ:重複したURLを統合する

① URLの正規化はテーマでのグループ化ではない

Costello氏:
多くの人はURLの正規化を同様なテーマのURLのグループ化として誤って捉えているように見受けられます。ページの内容が同一、または同一に近いURLのみが正規化対象になります。
Splitt氏:
その通りです。URLの正規化は重複管理のためのものです。無駄なクロール、レンダリングやインデックスを防ぐため、検索結果に同じページを複数表示しないためにURL重複を除外します。検索結果に同じページが複数回表示されたら良い検索結果ではないですよね。

② 正規化のよくある誤解

Splitt氏:
URLの正規化で最も多い誤解や間違いは何だと思いますか?
Costello氏:
まずは、Canonicalタグが指示であり、Canonicalタグを設定すればその内容がそのまま採用されると勘違いしている人が多いと思います。もう1つの間違いは、リダイレクトの代わりにCanonicalタグを使う人が見受けられます。例えば、ECサイトで商品が在庫切れしたら、そのURLから親のカテゴリページに向けてCanonicalタグを設定するような使い方です。Canonicalタグの内容が採用されるための1つの前提は、ページの内容が同一または同一に近い内容である必要があると認識しています。

③ Canonicalタグは指示なのか?シグナルなのか?

Splitt氏:
興味深いですね。「Canonicalタグが指示である」という勘違いから始めましょう。指示ではなく、シグナルです。
指示:検索エンジンに対しての命令的な設定。
シグナル:検索エンジンへのヒント。利用されない可能性もある。
Splitt氏:
URLの正規化では、同一または同一に近いコンテンツが複数のURLで存在することを認識します。クローラーが重複を認識するには色々なパターンがあります。例えば、複数のページをクロールして、同じコンテンツが存在することを発見して重複を見つける、複数のページへのリンクとその文脈が似ていることから重複を認識するなどがあります。またはCanonicalタグを見て重複ページを発見します。クローラーは重複が発生していることを認識するために、色々なシグナルを使っていて、Canonicalタグはそのうちの1つのシグナルです。同じ内容でないページでCanonicalタグを使っても正規化されません。または複数の重複URLにそれぞれ自URLへのCanonicalタグを設定してもそれぞれが正規URLとして認識されて個別にインデックスされるわけではなく、Googleがその重複URLに対して1つの正規URLを選定します。Canonicalタグはただのシグナルで、URLの正規化のヒントにはなりますが、命令的な指示ではありません。

④ Canonicalをリダイレクトの代わりには使わない

Splitt氏:
おっしゃる通り、Canonicalタグはリダイレクトの代わりに使うべきではありません。
Costello氏:
Canonicalタグをリダイレクト代わりに使う人はおそらくそれをリンクの評価をまとめるための施策として考えています。
Splitt氏:
Canonicalタグの設定は確かにリンク評価をまとめる施策として使えて、例えば何か理由があって同じコンテンツを複数のプラットフォームやウェブサイトなどに転載するシナリオではCanonicalタグを使います。ただ例えば商品の在庫が切れた場合は、ページをそのままにする、そのURLをユーザーに役立つ似たようなページにリダイレクトする、またはステータスコードを404に設定して、Googleに「今はページがないですがまた再公開されるかもしれない」と見せる形が良いと思います。そこにCanonicalタグを使うことは適切ではないですし、クロールバジェットの無駄使いです。Canonicalタグで重複していると指示しても、実際に重複していない場合、GoogleはCanonicalを無視して、ページを通常通りクロールし続けます。逆に重複したページでCanonicalタグを設定していない、または適切でない内容で設定している場合もGoogleはどちらのページも確認しなければならないし、正規URLが安定せず変動することもあります。

⑤ URL正規化・重複除外の要素

Costello氏:
リダイレクト、サイトマップ、被リンクなどURLの正規化に影響するそれぞれのシグナルを把握していない人がいると思います。そしてそのシグナルにどこまで対応すべきかもわからない人がいると思います。例えばAとBの施策をすればGoogleがCanonicalタグの値を採用してくれるか、など。それぞれのシグナルの重要性や優先度などについてもっと知りたいです。個人的な仮説は、自動的に設定されたようなシグナルより手動で実装された施策に重みが置かれるんじゃないかと思いますが、本当に影響があるかわかりません。
Splitt氏:
正規URLの選定、重複の除外はすべて自動化されたプロセスです。例えば、コンテンツのフィンガープリントを取ったり、コンテンツの内容とWebサイト構造との関係を確認したり、Sitemap.xmlの内容を参照したり、様々なシグナルを確認していますが、基本的には技術的な要素です。
フィンガープリント:内容の更新を迅速に通知するための方法
正規URLが一度決まればずっとそのままであるわけではなく、随時そのシグナルのスコアリングを行って、クロールで取得した新しいコンテンツを確認しています。以前重複していたページで片方のコンテンツが変わって重複しなくなったことも考えられるでしょう。そして重複しているページで正規URLを見つけるのに使われるスコアがあまりにも近似値で例えばページAは0.49、ページBは0.51であれば、どれを正規URLとして設定すべきかの判断が難しくなりますし、変動する可能性も出てきます。例えばクロールでフェッチされたデータが少し異なったら、スコアが変動して、それで正規URLがいきなり変わる可能性があります。そのため、なるべくどのページが正規かがはっきりとわかる矛盾しないシグナルを意識してください。全く同じコンテンツが2つ存在していたら、Googleがどれを選ぶべきかわからないですよね。
Costello氏:
Googleがウェブマスターの代わりに正規URLを選ぶような状況に追い込みたくないですね。
Splitt氏:
そしてSearch Consoleを見た際に正規URLが安定しないとウェブマスターも大変でしょう。データを正規URLベースで取得して表示していますので、ページAとページBの間で変動しだすと、データもおかしくなります。

⑥ サイト側の正規化シグナルとユーザーの求める正規URL

Splitt氏:
他にURLの正規化に関して何かよくわからないことがありますか?
Costello氏:
Googleが判断する正規URLを置き換えるための閾値ですね。John Muller氏がAsk Google Webmastersシリーズの動画でサイト側のシグナルと、Googleがユーザーの求めているものを出すという2つの要素があると言っていました。
Splitt氏:
そうですね。例えば、複数の地域で同じ言語の同一のコンテンツのURLがあって、サイト側がどれも正規URLと示していれば、Googleが特定の地域のURLを優先することが考えられます。その際、ユーザーがいる国のURLを優先して検索結果に表示する可能性があります。例えばECサイトでドイツ語のドイツ向けURLとオーストリア向けのURLが存在していて、通貨、金額などが一致している同一コンテンツとなっており、ドイツのURLを正規URLとして設定していたとしても、ユーザーが検索する地域によってドイツのURLを表示するかオーストリアのURLを表示するか出し分けます。
※Ask Google Webmastersの動画を以下記事の「⑦正規URLの選定基準」で和訳しています。
アユダンテコラム:#AskGoogleWebmasters:Google ウェブマスターQ&Aシリーズ 2019年分の日本語まとめ

⑦ Canonicalタグで正規化されたページ内のユニークコンテンツ

Costello氏:
GoogleがCanonicalタグの値を採用した場合、重複ページのユニークなコンテンツは無視されると聞きました。ただそもそもCanonicalタグが採用されるにはページが同一である必要がありますよね。ユニークなコンテンツがあればそもそもCanonicalタグが採用されないのではないでしょうか?
Splitt氏:
コンテンツにどれぐらいの差があるかによります。
ほとんど同じコンテンツで、一文ぐらいの違いであれば、同一コンテンツとして認識する可能性がまだあります。もし重複ページに正規URLにないユニークな文章があれば、その文章は認識されません。重複URLを正規URLのコピーコンテンツと見なしてユニークな文章を認識しません。でも、そのユニークな文章が正規URLの方にあれば、認識されます。
ただ、もし2つのページのコンテンツが大きく違っている、もしくは重複と見なすには違いが多いと認識されたら、Canonicalタグを設定する意味はありません。
コガン:話を整理しますと、
  • 正規URLと重複URLにユニークなコンテンツがあった場合、Canonicalタグが採用されるかどうかはユニークなコンテンツの量によります。
  • ユニークなコンテンツが多い場合、重複ページとして判断されず、Canonicalタグが無視されます。
  • ユニークなコンテンツが少ない場合、Canonicalタグが採用されて、正規URL側のユニークなコンテンツのみ認識されて、重複URL側のユニークなコンテンツは認識されません。
Splitt氏:
また、被リンクも正規化のシグナルとして使われることがありますが、ウェブマスターが間違って一部パラメータなし、一部パラメータありのURLにリンクしてしまうことがあります。そういうときは大体1つの正規URLを選定します。大体パラメータなしのURLを選定しますが、パラメータありのものを選定することもありますし、先程の話の通り、はっきりしたシグナルがないとどのページを正規URLとして選定するべきかがわかりにくくなります。
Costello氏:
そうですね、Canonicalタグを使ってページをテーマでグループ化しようとする人がいますが、そのためのタグではありません。
Splitt氏:
その通りです。CanonicalタグとURLの正規化は重複を防ぐためのものです。

■感想・まとめ

最後の方少し紛らわしい話になりましたが、結論を言いますと、まずはwww有無、パラメータ有無の同一ページや一文ぐらいしか差がない同一に近いページだけにCanonicalタグを使用すること、そしてリダイレクト、サイト内リンク、Sitemap.xmlの内容など他のURLの正規化シグナルも同一にしましょう、というのは抑えるべきポイントだったと思います。

エピソード5はSEOに大きく影響するWebサイトの移転についてです。こちらも和訳しますので是非チェックしてください。

アユダンテの広告チームでは応募の前にカジュアル面談をおすすめしています