O que é indexabilidade?
Indexabilidade é a capacidade de uma página da Web de ser indexada pelos mecanismos de pesquisa. Somente páginas indexáveis podem aparecer nos resultados de pesquisa.
Para indexar uma página da Web, os mecanismos de pesquisa, como o Google, precisam:
- Descubra o URL da página
- Rastreá-lo (baixar seu conteúdo)
- Processá-lo (entender e extrair informações importantes das páginas rastreadas)
Só então a página poderá aparecer nos resultados da pesquisa.
Se os rastreadores da Web não puderem fazer seu trabalho e rastrear uma página em seu site, essa página não poderá ser indexada adequadamente. E, sem a indexação, a página do seu site não poderá gerar nenhum tráfego de pesquisa porque permanecerá invisível para os mecanismos de pesquisa.
Por que a indexabilidade é importante?
A indexação permite que os mecanismos de pesquisa exibam as páginas do seu site nas SERPs. Sem indexação, você não pode direcionar nenhum tráfego de pesquisa orgânica para o seu site.
Às vezes, faz mais sentido tornar determinadas páginas não indexáveis. Por exemplo, páginas não indexáveis são preferíveis quando se trata de páginas de destino, páginas de baixa qualidade ou páginas "Obrigado pela assinatura". Afinal de contas, você não quer que essas páginas apareçam nos resultados de pesquisa.
No entanto, supondo que você queira que os URLs sejam classificados, é preciso garantir que essas páginas sejam rastreáveis e indexáveis.
O que torna uma página indexável?
Para ser vista como "indexável", a página deve atender aos seguintes critérios:
1. A página deve ser rastreável
Para que uma página da Web seja indexada, os rastreadores do mecanismo de busca devem ser capazes de acessar e rastrear seu conteúdo primeiro. Um aspecto que afeta diretamente a "rastreabilidade" de uma página da Web é o arquivo robots.txt.
O arquivo robots.txt é um pequeno arquivo localizado no diretório raiz do seu site. Sua função é fornecer instruções aos rastreadores da Web e informar a eles quais páginas do seu site não devem ser rastreadas. Caso contrário, os bots rastrearão qualquer página que encontrarem no site; eles fazem isso por padrão.
Há casos em que colocar essas "restrições" faz sentido. Ainda assim, é essencial garantir que você não esteja bloqueando, sem saber, as páginas que deseja que sejam indexadas.
2. A página não deve ter uma tag "Noindex"
Uma tag "noindex" é uma diretiva na página que instrui o mecanismo de pesquisa a não indexar uma página específica. Basicamente, ela impede que uma página apareça nas SERPs.
Às vezes, é aconselhável "noindexar" determinadas páginas, como páginas de destino, páginas de login, páginas de baixa qualidade ou de baixa qualidade, ou páginas de agradecimento, e mantê-las "privadas".
No entanto, se você fizer mau uso ou, digamos, esquecer de remover essa diretiva da página que deseja indexar, perderá tráfego de pesquisa orgânica.
Você pode rastrear seu site com a ferramenta Auditoria do site do Ranktracker para garantir que nenhuma das páginas que você deseja indexar tenha uma tag "noindex".
3. A página deve ser canônica
Uma tag canônica (rel="canonical") em um código de página define a versão principal para páginas duplicadas, quase duplicadas e semelhantes. Isso significa que somente as páginas canônicas podem ser indexadas, enquanto suas versões não canônicas serão excluídas.
A menos que você adicione a tag canônica a uma página, o Google se baseará em sinais como backlinks internos e externos, o mapa do site XML e os redirecionamentos para decidir qual URL "representará" esse cluster em seu índice.
Isso significa que, se você quiser que sua página apareça nos resultados de pesquisa, ela não deve declarar nenhuma outra página como sua versão canônica. A boa prática de SEO é ter tags canônicas de autorreferência para páginas indexáveis.
Como ajudar o Google a indexar sua página
Veja o que você pode fazer para ajudar o Google a indexar as páginas do seu site:
1. Envie Sitemaps para o Google
Um mapa do site é basicamente uma lista (normalmente no formato XML) que contém todas as páginas do seu site.
A função do mapa do site é informar ao Google sobre as páginas que você deseja que sejam indexadas em seu site.
Antes de enviar um mapa do site, verifique se ele reflete o estado atual do seu site e corrija quaisquer erros, como links quebrados, páginas órfãs e similares.
Você pode enviar seus sitemaps para o Google usando o Google Search Console.
2. Envie páginas individuais por meio da ferramenta de inspeção de URL
Se quiser solicitar a indexação ou reindexação de apenas alguns URLs individuais, você pode usar a Ferramenta de inspeção de URL no Google Search Console.
A ferramenta de inspeção de URL é uma ferramenta de diagnóstico encontrada no Google Search Console que oferece informações sobre a versão indexada do Google da sua página da Web e permite testar os URLs ao vivo e visualizar a versão renderizada da página, entre outras coisas.
Ele também permite que você envie páginas individuais para o Google.
Se quiser solicitar a indexação de um novo URL - ou o rastreamento e a reindexação de URLs atualizados -, você pode solicitar ao Google que faça isso selecionando o botão "Solicitar indexação". Se não houver erros em seu URL ativo, o Google adicionará sua página à fila de rastreamento.
No entanto, observe que há um limite de quantos URLs você pode solicitar indexação por dia.
3. Forneça links internos para uma descoberta melhor/mais rápida
Outra maneira de incentivar o rastreamento e, por sua vez, acelerar a indexação do site é usar links internos.
Ao vasculhar a Internet, os rastreadores do Google seguem um caminho formado por links. Portanto, quando uma página do seu site for vinculada a outra, esses rastreadores seguirão o caminho existente e descobrirão novos conteúdos.
As páginas sem links internos são chamadas de "páginas órfãs".
É por isso que é fundamental garantir que você tenha fornecido links internos de e para suas páginas mais importantes. É verdade que isso geralmente ocorre naturalmente quando você cria um site bem organizado.
No entanto, não custa nada verificar se há páginas órfãs - ou seja, páginas que não têm links internos apontando para elas - em seu site. Você pode fazer isso com a ferramenta Auditoria do site do Ranktracker.
Em uma observação relacionada, você deve garantir que esses links internos que apontam para páginas indexáveis não tenham uma tag "nofollow", pois o Google não rastreia links nofollow.
Perguntas frequentes
Qual é a função do arquivo Robots.txt na indexabilidade?
O arquivo robots.txt fornece instruções aos rastreadores da Web sobre quais páginas ou seções do seu site não devem ser rastreadas, afetando a capacidade de rastreamento e, consequentemente, a indexação das suas páginas.
Como posso verificar se minhas páginas estão indexadas?
Você pode verificar se suas páginas estão indexadas usando o Google Search Console. A ferramenta fornece insights sobre o status indexado de seus URLs.
Qual é o impacto das páginas órfãs na indexabilidade?
As páginas órfãs, que não têm links internos apontando para elas, têm menos probabilidade de serem descobertas e indexadas pelos mecanismos de pesquisa. Garantir que todas as páginas importantes estejam bem vinculadas em seu site melhora a indexação delas.
Ao garantir que suas páginas sejam rastreáveis, livres de tags "noindex" e devidamente canonizadas, você pode aumentar as chances de elas serem indexadas e aparecerem nos resultados dos mecanismos de pesquisa. Auditorias regulares e links internos estratégicos podem contribuir ainda mais para esse objetivo.