Какво е пълзящ апарат?
Краулърът е интернет програма, предназначена за систематично сърфиране в интернет. Краулерите се използват най-често като средство, с което търсачките откриват и обработват страници, за да ги индексират и покажат в резултатите от търсенето.
В допълнение към обхождащите програми, които обработват HTML, някои специални обхождащи програми се използват и за индексиране на изображения и видеоклипове.
В реалния свят основните уеб търсачки, които трябва да познавате, са тези, използвани от водещите световни търсачки: Googlebot, Bingbot, Yandex Bot и Baidu Spider.
Добри срещу лоши пълзящи машини
Мислете за добрия обхождащ компютър като за бот, който може да помогне на сайта ви, най-вече като добави съдържанието ви в индекса за търсене или като ви помогне да извършите одит на сайта си. Други отличителни белези на добрия обхождащ робот са, че той се идентифицира, следва вашите указания и регулира скоростта на обхождане, за да не претоварва сървъра ви.
Лошият ползувател е бот, който не добавя стойност за собственика на уебсайта и може да има злонамерени намерения. Лошите обхождащи ботове могат да не се идентифицират, да заобикалят указанията ви, да създават ненужно натоварване на сървърите и дори да крадат съдържание и данни.
Видове пълзящи машини
Съществуват два основни типа обхождащи устройства:
- Постоянно обхождащи ботове: Те извършват обхождане 24 часа в денонощието, 7 дни в седмицата, за да откриват нови страници и да претърсват по-стари (напр. Googlebot).
- Ботове при поискване: Те обхождат ограничен брой страници и извършват обхождане само при поискване (напр. бот Ranktracker Site Audit).
Защо е важно обхождането на уебсайтове?
Основната цел на търсачката е да открие какво има на вашия уебсайт и да добави тази информация към индекса за търсене. Ако сайтът ви не е обходен, съдържанието ви няма да се появи в резултатите от търсенето.
Претърсването на уебсайтове не е само еднократно събитие - това е постоянна практика за активните уебсайтове. Ботовете редовно претърсват уебсайтове, за да откриват и добавят нови страници в индекса за търсене, като същевременно актуализират информацията за съществуващите страници.
Въпреки че повечето обхождащи програми се свързват с търсачките, има и други видове обхождащи програми. Например ботът Ranktracker Site Audit може да ви помогне да видите какво не е наред с вашия уебсайт по отношение на SEO.
Как работят пълзящите машини?
Накратко казано, уеб обхождащ робот като Googlebot открива URL адресите на вашия уебсайт чрез карти на сайта, връзки и ръчно подаване на данни чрез Google Search Console. След това той ще следва "разрешените" връзки на тези страници.
Това става, като се спазват правилата на robots.txt, както и атрибутите "nofollow" на връзките и на отделните страници.
Някои уебсайтове - тези с повече от 1 милион страници, които се актуализират редовно, или тези с 10 000 страници съдържание, което се променя ежедневно - може да имат ограничен "бюджет за обхождане". Това се отнася до времето и ресурсите, които ботът може да посвети на даден уебсайт в рамките на една сесия.