Como corrigir erros de cobertura do índice no Search Console

Indexação e rastreamento são dois processos altamente importantes para sites e mecanismos de busca. Para que um site apareça nos resultados da pesquisa, ele deve primeiro ser rastreado por um bot do mecanismo de pesquisa e, em seguida, será colocado na fila para indexação. Como SEO, é importante que você rastreie e indexe seu site e verifique se não há erros que possam afetar a aparência do site nos resultados da pesquisa.

O Google Search Console é o melhor amigo da comunidade de SEO. Ele nos permite enviar nossos sites ao Google e informá-los da existência de nosso site. É a ferramenta que nos permite ver através dos olhos do Google. Podemos ver imediatamente quais páginas estão sendo exibidas nos resultados da pesquisa ou se as alterações ou melhorias refletidas.

Uma das melhores coisas do Google Search Console é que ele nos mostra erros de indexação que podem afetar negativamente a classificação de um site. O relatório de cobertura do Search Console mostra todas as páginas indexadas pelo Google com base no mapa do site que você enviou, bem como em outras páginas que não foram enviadas no seu site, mas foram rastreadas. A correção de erros nessas páginas é crucial.

Erro de servidor 5xx

Como corrigir erros de cobertura do índice no Search Console

O que é 5xx: Os erros ocorrem quando o servidor de um site não pode manipular ou processar uma solicitação feita pelo google-bot quando estava rastreando a página. Esse erro não apenas causa problemas no rastreamento do site, mas também é difícil para os usuários acessá-lo.

O que é 5xx no Search Console: Os erros geralmente são causados ​​por um problema no seu servidor. Pode estar inoperante, sobrecarregado ou configurado incorretamente. Também pode ser causado por um problema na configuração DNS do site ou no sistema de gerenciamento de conteúdo. 

Para corrigir esse problema, seria melhor consultar seu desenvolvedor da web ou verificar se sua hospedagem tem algum problema.

Erro de redirecionamento no Search Console

Os redirecionamentos são normais para qualquer site. Ele está sendo usado para redirecionar páginas ou postagens antigas que podem não ser mais úteis para novas. Também pode ser usado para redirecionar URLs que não são mais encontrados.

Os URLs devem ter apenas um redirecionamento 301. Quando um URL é redirecionado para outro URL que também é redirecionado para outro, ele cria uma cadeia de redirecionamento e esse é o problema usual que causa esse erro.

Erros de redirecionamento ocorrem se uma cadeia de redirecionamento é muito longa, é um loop, atingiu o limite máximo de redirecionamento (para o Chrome são 20 redirecionamentos) ou um dos URLs da cadeia está vazio.

Verifique se todos os seus redirecionamentos estão apontando para URLs ativos e use apenas um redirecionamento 301 uma vez para evitar cadeias de redirecionamento.

URL enviado bloqueado por Robots.txt 

Como corrigir erros de cobertura do índice no Search Console

Os URLs enviados no mapa do site do seu site indicam que esses URLs são importantes e devem ser rastreados e indexados. Se alguns desses URLs também estiverem bloqueados no seu arquivo robots.txt, isso causará confusão no bot do Google.

Para corrigir esse erro, verifique primeiro se os URLs que você está bloqueando são páginas importantes ou não. Se essas páginas forem importantes e forem bloqueadas acidentalmente no seu arquivo robots.txt, basta atualizá-la e remover esses URLs do arquivo. Verifique se esses URLs não estão mais bloqueados usando o testador robots.txt na versão antiga do Google Search Console .

Se você intencionalmente bloqueou um URL que é enviado no seu mapa do site, remova esse URL do seu mapa do site. Se você estiver usando o WordPress, obtenha primeiro a página ou o número da postagem do URL que você está removendo do mapa do site. Para fazer isso, vá para Postagens ou páginas e clique em Editar na postagem ou na página que você deseja remover. Verifique a barra de URL e você verá o ID da postagem.

Como corrigir erros de cobertura do índice no Search Console

Obtenha o ID da postagem e acesse as configurações do seu sitemap. Estou usando os Sitemaps XML do Google e acho muito fácil de usar. Em Itens Excluídos , você encontrará Postagens Excluídas. Digite o ID da postagem que você deseja excluir do mapa do site e clique em Salvar.

Como corrigir erros de cobertura do índice no Search Console

 

URL enviado com a marcação ‘noindex’

Este erro é semelhante ao URL enviado bloqueado pelo erro Robots.txt. Como um URL enviado no mapa do site significa que você deseja que o Google o indexe, colocar uma tag ‘noindex’ não faz sentido.

Verifique se esses URLs são páginas importantes. Colocar uma tag ‘noindex’ significa que você não deseja que o Google mostre essas páginas nos resultados da pesquisa. Se um produto ou página de destino tiver uma tag acidental ‘noindex’, isso é uma má notícia para você.

Se os URLs abaixo do erro não forem mais importantes, remova-os do mapa do site semelhante ao mencionado acima.

Se os URLs forem importantes, remova a tag noindex deles. Se você estiver usando o Yoast SEO, vá para a página ou postagem marcada como noindex. Role para baixo até ver a caixa do Yoast SEO e clique no ícone de engrenagem .

Como corrigir erros de cobertura do índice no Search Console

Verifique se a opção em Permitir que os mecanismos de pesquisa mostrem esta postagem nos resultados da pesquisa? Deve ser “Sim”. 

Se você estiver usando o SEO Ultimate, o processo é semelhante. Vá para a postagem ou página e role para baixo até a caixa SEO Ultimate. Em Diversos, verifique se a caixa “Noindex” está desmarcada.

Como corrigir erros de cobertura do índice no Search Console

URL enviado parece ser um Soft 404

Um erro 404 soft significa que um URL enviado em seu sitemap não existe mais, mas está retornando como um sucesso ou código 200. Os erros 404 soft são ruins para os usuários e o google-bot.

Como ainda é considerada uma página, os usuários podem vê-la nos resultados da pesquisa, mas tudo o que verão é uma página em branco. Ao mesmo tempo, desperdiçará seu orçamento de rastreamento.

Verifique os URLs considerados pelo Google como soft 404. Se essas páginas foram excluídas ou inexistentes, verifique se elas retornam um erro 404 (não encontrado). Mas se eles ainda forem relevantes, use um redirecionamento 301 para uma página ativa.

URL enviado retorna solicitação não autorizada (401)

Um erro 401 ocorre quando um URL enviado é rastreado pelo Google, mas o Google não é autorizado. Isso geralmente acontece quando os webmasters impõem medidas de segurança para outros bots ou spammers ruins. Para corrigir esse erro, você precisa executar uma pesquisa de DNS e verificar o Googlebot.

URL enviado não encontrado (404)

Uma página que está retornando um erro 404 significa que a página foi excluída ou não existe. Na maioria das vezes, se você excluir uma postagem ou uma página, ela será removida automaticamente do mapa do site. No entanto, alguns erros podem ocorrer e um URL excluído ainda pode ser encontrado no seu mapa do site.

Se a página ainda existir, mas foi movida para outra página, o redirecionamento 301 corrigirá o erro. Para o conteúdo excluído permanentemente, deixá-lo como 404 não é um problema.

Observe que o redirecionamento de 404s para a página inicial ou para outras páginas que não estão relacionadas a ela pode ser problemático para os usuários e o Google.

O URL enviado tem um problema de rastreamento

Os URLs enviados que estão sob esse erro significam que há um erro não especificado que não se enquadra nos outros erros mencionados que impedem o Google de rastrear o URL.

Use a ferramenta Inspeção de URL para obter mais informações sobre como o Google vê essa página da web e fazer melhorias a partir daí. 

Aviso: indexado embora bloqueado por Robots.txt

Como corrigir erros de cobertura do índice no Search Console

Este não é um erro, mas um aviso. É a única categoria que se enquadra na guia Aviso do relatório Cobertura. Isso acontece quando um URL é bloqueado pelo Robots.txt ainda está sendo indexado pelo Google.

Geralmente, o Google respeita o Robots.txt, mas quando um URL não permitido é vinculado internamente, o Google ainda pode rastrear esse URL não permitido.

A tag noindex e o arquivo robots.txt têm usos muito diferentes. Ainda existem algumas confusões entre eles. Se você deseja remover esses URLs dos resultados da pesquisa, remova-os do arquivo robots.txt para que o Google possa rastrear a tag ‘noindex’ neles. O arquivo robots.txt é mais usado para controlar seu orçamento de rastreamento.