Intro
Hiljutises LinkedIni postituses vaidlustas Google'i analüütik Gary Illyes traditsioonilise lähenemise, mille kohaselt paigutatakse robots.txt failid juurdomeenile. Ta tutvustas alternatiivset meetodit, mis tsentraliseerib need failid sisu edastusvõrkudesse (CDN), mis pakub paindlikkust ja paremat haldamist.
Peamised järeldused:
- Robots.txt paindlikkus:
-
Robots.txt fail ei pea asuma juurdomeenis (nt example.com/robots.txt).
-
Veebisaitidel võivad robots.txt-failid asuda nii esmasel veebisaidil kui ka CDNis.
- Tsentraliseeritud Robots.txt haldamine:
-
Robots.txt faili CDN-is majutades saavad veebisaidid oma otsingumootori suuniseid tsentraliseerida ja ühtlustada.
-
Näiteks võiks veebileht robots.txt asuda aadressil https://cdn.example.com/robots.txt ja suunata päringud aadressilt https://www.example.com/robots.txt sellesse tsentraalsesse faili.
- Vastavus ajakohastatud standarditele:
- RFC9309-i järgivad roomajad järgivad ümberjuhatust ja kasutavad algse domeeni tsentraliseeritud robots.txt-faili.
Praktilised eelised:
1. Tsentraliseeritud juhtimine:
- Robots.txt reeglite koondamine ühte kohta lihtsustab hooldust ja uuendusi kogu teie veebis.
2. Parem järjepidevus:
- Üks robots.txt reeglite allikas vähendab vastuoluliste direktiivide riski põhisaidi ja CDNi vahel.
3. Suurendatud paindlikkus:
- See meetod on eriti kasulik keerulise arhitektuuri, mitme alamdomeeni või CDNide ulatusliku kasutamisega veebisaitide puhul.
Robots.txt 30 aasta möödumine
Kuna robotite välistamise protokoll (REP) tähistab oma 30. aastapäeva, toob Illyes esile veebistandardite jätkuva arengu. Ta vihjab isegi võimalike tulevaste muudatuste võimalusele, kuidas roomamisjuhiseid hallatakse, andes mõista, et traditsiooniline robots.txt faili nimi ei pruugi alati vajalik olla.
Kuidas seda lähenemisviisi rakendada:
1. Luua tsentraliseeritud robots.txt fail:
- Hosta oma terviklikku robots.txt faili oma CDN-is (nt https://cdn.example.com/robots.txt).
2. Seadistage ümbersuunamised:
- Konfigureerige oma põhidomeen, et suunata robots.txt päringud ümber CDN-isoleeritud faili.
3. Tagage vastavus:
- Veenduge, et teie seadistus vastab RFC9309-le, et nõuetele vastavad roomikud järgiksid korrektselt ümbersuunamist.
Kokkuvõte
Gary Illyesi juhised robots.txt-failide tsentraliseerimise kohta CDNides pakuvad kaasaegset lähenemist crawl-direktiivide haldamiseks. See meetod suurendab paindlikkust, järjepidevust ja haldamise lihtsust, eriti keerulise infrastruktuuriga saitide puhul. Selle strateegia omaksvõtmine võib lihtsustada teie saidi haldamist ja potentsiaalselt parandada teie SEO-püüdlusi.