Introducere
Conținutul duplicat se găsește în mai multe locuri pe un URL. Conținutul duplicat derutează motoarele de căutare, deoarece acestea nu pot decide care versiune a conținutului este cea mai relevantă și pe care să o încarce într-un SERP dintr-o interogare de căutare asociată. Pentru a oferi cele mai exacte rezultate de căutare, motorul în cauză se va abține să afișeze conținutul duplicat și îl va alege pe cel care reflectă cel mai bine conținutul "corect".
Codificarea exemplului de conținut duplicat
Rel=Eșantion de cod canonic
<head> <link rel="canonical" href="https://123abc.com/blog/" /> </head>
Meta Robots Code Sample
<head> <meta name="robots" content="noindex, follow" /> </head>
Cele mai frecvente probleme de conținut duplicat
- Motoarele de căutare se luptă să aleagă ce conținut să includă în indexul lor
- Motoarele de căutare nu știu dacă ar trebui să împartă link juice-ul sau să îl canalizeze către o singură pagină.
- Motoarele de căutare nu sunt sigure ce pagină ar trebui să se claseze pentru anumite pagini de rezultate Conținutul duplicat poate fi motivul pentru care site-urile pierd poziții și trafic. De asemenea, poate face ca motoarele de căutare să ofere rezultate irelevante.
Exemple de conținut duplicat
Parametrii URL
urmărirea clicurilor și codificarea analitică pot duce la duplicarea conținutului.
Documente pentru imprimantă
atunci când se generează o versiune prietenoasă pentru imprimantă a unei pagini și indexul, acestea pot cauza probleme de conținut duplicat.
ID-ul sesiunilor
acest lucru se întâmplă atunci când fiecărui vizitator al site-ului i se atribuie un ID de sesiune pentru site-urile respective, iar apoi un alt ID de sesiune este atribuit și stocat în URL.
Tactici SEO de top: Conținut duplicat
Motoarele de căutare canonicalizează conținutul duplicat atunci când acesta se găsește pe mai multe URL-uri. Această canonizare se face prin crearea unei redirecționări 301. Aceasta corectează URL-ul și utilizează tag-ul rel=canonic.
O redirecționare 301 este cel mai bun mod de a rezolva o duplicare de conținut. Atunci când paginile se găsesc în mai multe rânduri, acestea sunt combinate într-o singură pagină cu relevanță mai mare, care are un impact pozitiv asupra clasamentului pentru motoarele de căutare care întâlnesc această pagină.
Rel=canonical este cealaltă opțiune pentru gestionarea conținutului duplicat. Această etichetă creează o soluție care împarte link juice-ul și îl transmite paginilor și necesită mai puțin timp de construcție. Această etichetă se adaugă la capul HTML al titlului paginii digitale. Meta tag-ul nu este recreat, dar în schimb este adăugat un parametru rel. Se pot adăuga valori în tag-urile meta robot pentru paginile care nu ar trebui să fie incluse în index. Adăugarea acestor valori va permite roboților motoarelor de căutare să scaneze paginile și să nu le adauge de două ori în index.
De exemplu:
<link href="https://www.123abc.com/canonical-version-of-page/" rel="canonical" />
Instrumente web Google pentru gestionarea parametrilor
Instrumentele Google Webmaster permit domeniilor să seteze parametrii URL preferați pentru diferite pagini. Această metodă are un dezavantaj, și anume că funcționează numai cu motorul de căutare Google. Orice modificare efectuată cu ajutorul acestor instrumente nu va afecta modificările pe Bing sau pe alte motoare de căutare.
Setări de preferințe de domeniu
Acestea sunt stabilite pentru toate site-urile. Google utilizează această metodă simplă pentru a decide dacă un site este afișat cu un titlu www în listele SERP. URL-urile pot suferi de erori minore, cum ar fi greșelile de capitalizare, care pot cauza erori de dublare. Dacă aceeași pagină web este scrisă de trei ori și în fiecare dintre ele sunt scrise litere diferite cu majuscule, atunci motorul de căutare va considera toate cele trei pagini ca fiind diferite și le va trata ca fiind conținut duplicat. Un instrument de implementare rel=canonical utilizat pe al doilea și al treilea URL ar ajuta motoarele de căutare să îndrepte motoarele de căutare către prima listă și să le trateze pe celelalte două ca pe niște copii identice ale primei.
Nu există comandă de indexare (Follow)
În cazul în care un site are probleme de paginare, pe paginile respective poate fi implementată o etichetă meta robot cu valori noindex follow. Aceasta va permite ca acele pagini specifice să fie răscolite de către roboții motoarelor de căutare, dar le va împiedica să fie incluse în indexuri.
Mai multe metode de eliminare a conținutului duplicat
Asigurați-vă că legăturile interne sunt construite în mod consecvent pe tot parcursul construcției oricărui site web. Atunci când partajați informații cu alte site-uri, confirmați faptul că conținutul legat este direct către conținutul original. Depuneți toate eforturile pentru a minimiza cantitatea de conținut similar pe orice site web. În cazul în care o pagină este copleșitor de asemănătoare, luați în considerare combinarea paginilor sau adăugarea unui conținut distinct și dinamic care să diferențieze paginile. Eliberați site-ul de conținutul duplicat prin eliminarea paginilor din indexuri cu ajutorul unui instrument de eliminare prin intermediul Google, Bing sau cu ajutorul unui meta robot.
În cazul în care un webmaster stabilește că versiunea canonică a unui site web este www.123abc.com,
atunci toate legăturile interne ar trebui să ajungă la www.123abc.com/example.html
și nu la https//123abc.com/page.html
(www este omis în mod intenționat). Un alt exemplu, dacă un magazin online are o pagină despre jachete pentru băieței și o altă pagină despre jachete pentru fetițe, iar aceste două pagini au 95% din același conținut. Designerul web din acest exemplu ar trebui să extindă paginile pentru a include conținut suplimentar relevant pentru fiecare URL și pagini noi și distincte care să le individualizeze. O altă soluție ar fi ca designerul web să combine cele două pagini și să creeze o singură pagină despre jachete pentru copii mici în loc de pagini separate pentru fete și băieți. Noua pagină ar avea avantajul de a fi foarte relevantă noului site.