SEO

Rastreabilidade (Crawlability)

Também: Crawlability, rastreamento de site, rastreabilidade do site

Rastreabilidade é a facilidade com que um rastreador de mecanismo de busca consegue encontrar uma página e ler seu conteúdo, determinada pela presença de links que apontam para ela, pelas regras do robots.txt, pelos códigos de status HTTP e pelo fato de o texto estar disponível no HTML que o rastreador efetivamente analisa.

Uma página pode estar no ar para visitantes e ainda ser invisível para um rastreador. O rastreador precisa encontrar a URL por meio de um link ou sitemap, ter permissão para acessá-la (robots.txt, a diretiva noindex e os códigos de status HTTP determinam isso) e, em seguida, extrair texto real da resposta. Se qualquer uma dessas etapas falhar, o conteúdo não entra no índice, independentemente de sua qualidade. A rastreabilidade é a condição para tudo que vem depois: uma página que não pode ser encontrada e lida não aparece nos resultados de busca, não gera rich snippet e não é citada por nenhum sistema.

A etapa de renderização é onde as lojas modernas perdem espaço sem perceber. Conteúdo inserido por JavaScript depois que a página carrega, como um Widget de avaliações puxado de um script de terceiros ou um iframe, muitas vezes não está presente no HTML inicial. Alguns rastreadores processam JavaScript com atraso ou não processam, então essas avaliações ficam invisíveis: o cliente as vê, o rastreador não. Iframes são uma armadilha específica, porque seu conteúdo fica em uma URL separada e raramente é atribuído à página principal.

Considere uma loja Shopify que vende cosméticos naturais. A página de produto exibe 240 avaliações com média de 4,7 estrelas, carregadas por um aplicativo de avaliações que insere as estrelas e os comentários dos clientes na página depois que o navegador executa o script. Para o cliente, a página parece completa. Para o rastreador que acessa a resposta bruta, o conteúdo principal é o nome do produto, o preço e uma descrição curta: as 240 avaliações simplesmente não existem no documento. O lojista imagina que a prova social está funcionando para a busca quando, na camada que o rastreador enxerga, ela não existe.

O teste honesto é buscar o HTML bruto (via exibir código-fonte ou uma requisição curl) e procurar o texto das avaliações. Se não estiver lá, não está na visão do rastreador tampouco. Isso importa além da busca tradicional. Motores de resposta como ChatGPT, Perplexity e Google AI Overviews montam respostas com base em texto que conseguem recuperar e analisar, e a maior parte dessa recuperação depende do mesmo HTML rastreável, não de uma renderização completa de cada página pelo navegador. Quando um comprador pergunta a um assistente qual cosmético natural tem melhor custo-benefício para pele oleosa, o modelo só consegue usar a linguagem das avaliações que conseguiu ler. Avaliações presas em um Widget exclusivamente do lado do cliente não contribuem em nada para essa resposta.

Tornar as avaliações existentes legíveis, verificáveis e citáveis por buscadores e IA é a lacuna que o BeyondReviews fecha, renderizando esse conteúdo no lado do servidor para que as palavras estejam no HTML que o rastreador analisa na primeira requisição, em vez de mantê-las dentro de um script que só o navegador executa.

Termos relacionados

Para se aprofundar