イントロ
重複コンテンツとは、1つのURLの複数の場所に存在するコンテンツのことです。検索エンジンは、どのバージョンのコンテンツがより適切で、関連する検索クエリからSERPに読み込むべきかを判断できないため、重複したコンテンツは検索エンジンを混乱させる。最も正確な検索結果を提供するために、当該エンジンは重複するコンテンツの表示を控え、「正しい」コンテンツを最もよく反映するものを選択します。
重複コンテンツ サンプルコーディング
Rel=Canonicalコードサンプル
<head> <link rel="canonical" href="https://123abc.com/blog/" /> </head>
Meta Robotsのコード例
<head> <meta name="robots" content="noindex, follow" /> </head>
重複コンテンツの問題点
- 検索エンジンは、どのコンテンツをインデックスに含めるかを選択するのに苦労している。
- 検索エンジンは、リンクジュースを分けるべきか、1つのページに流すべきか、わからない。
- 検索エンジンは、特定の結果ページに対してどのページがランク付けされるべきかわからない 重複コンテンツは、サイトがランキングやトラフィックを失う原因となりえます。また、検索エンジンが無関係な結果を提供する原因にもなります。
重複コンテンツの例
URL パラメーター
クリックトラッキングや分析コーディングによって、コンテンツが重複することがあります。
印刷用ドキュメント
プリンターフレンドリーバージョンのページが生成され、インデックスが作成された場合、重複コンテンツの問題が発生する可能性があります。
セッションID
すべてのサイト訪問者にそのウェブサイト用のセッション ID が割り当てられ、さらに別のセッション ID が割り当てられて URL に保存される場合に発生します。
トップSEO対策。 重複コンテンツ
検索エンジンは、重複したコンテンツが複数のURLで見つかった場合、そのコンテンツを正規化します。この正規化は、301リダイレクトを作成することで行われます。これは、URLを修正し、rel=canonicalタグを使用します。
301リダイレクトは、コンテンツの重複を解決するための最良の方法です。ページが複数見つかった場合、より強い関連性を持つ1つのページに統合され、このページに遭遇した検索エンジンのランキングにプラスの影響を与えます。
Rel=canonicalは、重複したコンテンツを処理するためのもう一つの選択肢です。このタグは、リンクジュースを分割してページに渡す解決策を作り出し、工数も少なくて済みます。このタグは、デジタル・ページの見出しのHTMLヘッドに追加されます。metaタグは再作成されないが、代わりにrelパラメータが追加される。インデックスに含めない方が良いページには、メタロボットタグに値を追加することができます。これらの値を追加することで、検索エンジンのボットがページをスキャンし、インデックスに2度追加することがなくなります。
**例:**の場合
<link href="https://www.123abc.com/canonical-version-of-page/" rel="canonical" />
パラメータ管理用Googleウェブツール
Googleウェブマスターツールでは、ドメインごとに好みのURLパラメータを設定することができます。この方法には、Google検索エンジンのみで動作するという欠点があります。これらのツールを使用して行った変更は、Bingや他の検索エンジンでの変更には影響しません。
ドメインの優先設定
これらは、すべてのサイトに設定されています。Googleはこの簡単な方法で、SERPのリストでサイトをwwwの見出しで表示するかどうかを決定します。URLは、大文字と小文字の間違いのような小さなミスに悩まされ、重複エラーの原因となることがあります。同じウェブページを3回書き、それぞれ異なる文字が大文字で書かれていた場合、検索エンジンは3つのページをすべて異なるものとしてカウントし、重複コンテンツとして扱います。2つ目と3つ目のURLにrel=canonicalを導入することで、検索エンジンは1つ目のURLに戻り、残りの2つは1つ目と同じコピーのように扱われます。
インデックスコマンドなし(フォロー)
ページネーションに問題がある場合、メタロボットタグにnoindex followの値を設定することで、それらのページに実装することができる。これにより、特定のページが検索エンジンのボットによってクロールされるようになりますが、インデックスに含まれることはなくなります。
その他の重複コンテンツ排除方法
Webサイトの構築において、内部リンクが一貫して構築されていることを確認する。他のサイトと情報を共有する場合、リンク先のコンテンツが元のコンテンツに直接戻ってくることを確認する。類似したコンテンツを極力排除する。類似したページが多い場合は、ページを統合したり、差別化できるようなダイナミックなコンテンツを追加することを検討する。GoogleやBingの削除ツール、またはメタロボットを使用してインデックスからページを削除し、重複するコンテンツをサイトから排除する。
ウェブマスターが、あるウェブサイトの正規版を「www.123abc.com」と判断した場合、内部リンクはすべて「www.123abc.com/example.html」とし、「https//123abc.com/page.html 」(wwwは意図的に外しています)とはしないようにします。別の例として、あるオンラインショップが男の子用ジャケットのページと女の子用ジャケットのページを持っていて、この2つのページが95%同じ内容を共有しているとします。この例では、ウェブデザイナーは、それぞれのURLに関連する追加コンテンツと、それらを個別化する新しい個別のページを含めるために、ペ ージを拡張する必要があります。もう一つの解決策は、ウェブデザイナーが2つのページを組み合わせ、女の子用と男の子用の別々のページではなく、小さな子供用のコートに関する1つのページを作成した場合です。この新しいページは、非常に関連性の高い新しいサイトであるという利点があるでしょう。