Вступ
Дублікат контенту зустрічається більш ніж в одному місці URL-адреси. Дубльований контент збиває з пантелику пошукові системи, оскільки вони не можуть вирішити, яка версі я контенту є більш релевантною і яку завантажувати в пошукову видачу за відповідним пошуковим запитом. Для забезпечення найбільш точних результатів пошуку відповідна пошукова система утримується від показу дубльованого контенту і вибирає той, який найбільше відображає "правильний" контент.
Кодування зразків контенту, що дублюються Кодування зразків контенту
Rel=Зразок канонічного коду
<head> <link rel="canonical" href="https://123abc.com/blog/" /> </head> </head>
Приклад коду Meta Robots
<head> <meta name="robots" content="noindex, follow" /> </head> </head>
Найчастіші проблеми з дублюванням контенту
- Пошукові системи намагаються вибрати, який контент включити до свого індексу
- Пошукові системи не знають, чи слід розділяти посилальний сік або направляти його на одну єдину сторінку.
- Пошукові системи не впевнені, яку сторінку слід ранжувати для певних сторінок результатів Дублюючий вміст може бути причиною втрати сайтами рейтингу та трафіку. Це також може призвести до того, що пошукові системи видаватимуть нерелевантні результати
Приклади дублювання контенту
Параметри URL-адреси
відстеження кліків та аналітичне кодування може призвести до дублювання контенту
Дружні до принтера документи
при створенні дружньої до принтера версії сторінки та індексу вони можуть викликати проблеми з дублюванням контенту.
Ідентифікатор сесії
Це відбувається, коли кожному відвідувачу сайту присвоюється ідентифікатор сеансу для цього веб-сайту, а потім присвоюється інший ідентифікатор сеансу, який зберігається в URL-адресі.
Топ-тактики SEO: Дубльований контент
Пошукові системи канонізують дубльований контент, коли він знаходиться на декількох URL-адресах. Ця канонізація здійснюється шляхом створення 301 перенаправлення. При цьому виправляється URL-адреса і використовується тег rel=canonical.
Редирект 301 - найкращий спосіб вирішити проблему дублювання контенту. Коли сторінки зустрічаються в декількох варіантах, вони об'єднуються в одну більш релевантну сторінку, що позитивно впливає на ранжування для пошукових систем, які зустрічають цю сторінку.
Rel=canonical - ще один варіант роботи з дубльованим контентом. Цей тег створює рішення, яке розділяє посилальний сік і передає його на сторінки і вимагає менше часу на побудову. Цей тег додається до HTML заголовка заголовка цифрової сторінки. Мета-тег не відтворюється, а замість нього додається параметр rel. Для сторінок, які не повинні потрапляти в індекс, в мета-теги робота можуть бути додані значення, які не повинні потрапляти в індекс. Додавання цих значень дозволить пошуковим роботам сканувати сторінки і не додавати їх до індексу двічі.
Наприклад:
<link href="https://www.123abc.com/canonical-version-of-page/" rel="canonical" />
Google Web Tools для управління параметрами
Інструменти для веб-майстрів Google дозволяють доменам встановлювати бажані параметри URL для різних сторінок. Недоліком цього методу є те, що він працює тільки з пошуковою системою Google. Будь-які зміни, зроблені за допомогою цих інструментів, не вплинуть на зміни в Bing або інших пошукових системах.
Налаштування параметрів домену
Вони встановлюються для всіх сайтів. Google використовує цей простий метод, щоб вирішити, чи показувати сайт із заголовком www у списках пошукової видачі. URL-адреси можуть страждати від незначних помилок, таких як помилки в написанні великих літер, які можуть викликати помилки дублювання. Якщо одна і та ж веб-сторінка написана три рази і в кожному з них з великої літери, то пошукова система буде вважати всі три сторінки різними і розглядати їх як дубльований контент. Інструмент реалізації rel=canonical, використаний у 2-му і 3-му URL-адресі, допоможе вказати пошуковим системам на 1-й список, а решта дві сторінки будуть розглядатися як ідентичні копії першої.
Без індексної команди (слідування)
Якщо сайт має проблеми з пагінацією, на таких сторінках можна встановити мета-тег робота зі значенням noindex follow. Це дозволить сканувати ці сторінки пошуковим роботам, але не дозволить їм потрапити до індексів.
Більше методів усунення дубльованого контенту
Переконайтеся, що внутрішні посилання послідовно побудовані на всіх етапах створення будь-якого веб-сайту. При обміні інформацією з іншими сайтами підтверджуйте, що контент, на який зроблено посилання, має пряме посилання на оригінальний контент. Докладайте всіх зусиль, щоб мінімізувати кількість схожого контенту на будь-якому веб-сайті. Якщо сторінка в переважній більшості схожа, розгляньте можливість об'єднання сторінок або додавання чіткого і динамічного контенту, який буде диференціювати сторінки. Позбавте сайт від дубльованого контенту шляхом виключення сторінок з індексів за допомогою інструменту видалення через Google, Bing або за допомогою мета-робота.
Якщо веб-майстер визначив, що канонічною версією сайту є www.123abc.com
, то всі внутрішні посилання повинні вести на www.123abc.com/example.html
, а не на https//123abc.com/page.html
(www не вказано навмисно). Інший приклад, якщо інтернет-магазин має сторінку про куртки для маленьких хлопчиків та іншу сторінку про куртки для маленьких дівчаток, і ці дві сторінки мають 95% однакового контенту. Веб-дизайнеру в цьому прикладі потрібно було б розширити сторінки, включивши додатковий контент, який відповідає кожній URL-адресі, а також нові та окремі сторінки, які б їх індивідуалізували. Іншим рішенням було б, якби веб-дизайнер об'єднав ці дві сторінки та створив одну єдину сторінку про пальто для маленьких дітей замість окремих сторінок для дівчаток та хлопчиків. Перевага нової сторінки полягала б у тому, що вона була б дуже релевантною для нового сайту.