Hoje em dia existe uma grande variedade de conteúdos na Internet. Às vezes, você publica algo que não deveria – por exemplo, você publica uma postagem no blog com raiva e se arrepende mais tarde ou acidentalmente vaza dados confidenciais; Na maioria dos casos, simplesmente remover o conteúdo ou restringir o acesso impedirá que ele apareça nos resultados de pesquisa. No entanto, se você estiver desesperado para remover algum conteúdo indesejado que já foi indexado pelo Google, poderá usar nossa ferramenta de remoção de URL, que remove conteúdo de nossos resultados de pesquisa, desde que atenda a determinados critérios (discutidos abaixo). Publicaremos uma série de postagens no blog ensinando como remover com sucesso vários tipos de conteúdo e como evitar erros comuns. Nesta primeira postagem do blog, discutirei alguns cenários básicos: exclusão de um único URL, exclusão de um diretório ou site inteiro e adição novamente de conteúdo excluído.
Excluir um único URL
De modo geral, para que uma solicitação de remoção seja bem-sucedida, o proprietário do URL em questão (seja você ou outra pessoa) deve fornecer consentimento para que o conteúdo seja removido. Para um único URL, existem três maneiras de indicar consentimento:
Bloqueie páginas por meio do arquivo robots.txt para evitar que sejam pesquisadas
O bloqueio de páginas por meio da meta tag noindex impede que sejam indexadas
Indica que a página atual não existe retornando um código de status 404 ou 410
Antes de enviar uma solicitação de exclusão, você pode primeiro verificar se o URL foi bloqueado:
robots.txt: use a função Buscar como Googlebot ou Testar robots.txt nas Ferramentas do Google para webmasters para verificar se o acesso ao URL foi negado.
Meta tag noindex: você pode usar Fetch as Googlebot para garantir que a meta tag apareça entre as tags. Se quiser visualizar uma página que não pode ser verificada usando as Ferramentas do Google para webmasters, você pode abrir o URL em seu navegador, clicar em Visualizar > Recursos da Web e certificar-se de que a meta tag esteja entre as tags.
Códigos de status 404/410: você pode usar Fetch as Googlebot ou uma ferramenta como Live HTTP Headers ou web-sniffer.net para confirmar se o URL está realmente retornando o código correto. Às vezes, uma página “excluída” pode exibir “404” ou “Página não encontrada”, mas retornar um código de status 200 no cabeçalho. Portanto, é uma boa ideia verificar novamente usando uma ferramenta de verificação de cabeçalho apropriada.
Se você removeu conteúdo indesejado de uma página da Web, mas não bloqueou a página usando os métodos acima, ainda não poderá remover completamente o URL dos nossos resultados de pesquisa. Isso é comum se o conteúdo for postado em um site que não é de sua propriedade, e falaremos sobre como lidar com isso na segunda parte de nossa série sobre remoção de URLs.
Se um URL atender a alguma das condições acima, você poderá visitar http://www.google.com/webmasters/tools/removals , inserir o URL que deseja excluir e selecionar a opção "O webmaster bloqueou esta página" para remover ele foi excluído. Observação: você deve inserir o URL que contém o conteúdo, não o URL que o Google pesquisa pelo conteúdo. Por exemplo, você deve inserir
http://www.example.com/embarrassing-stuff.html
em vez de
http://www.google.com/search ? q=embaraçoso+coisas
Este artigo também detalha como garantir que você insira o URL correto. Lembre-se de que não poderemos remover seu conteúdo indesejado se você não nos informar o URL exato que está incomodando.
Exclua um diretório ou site inteiro
Para excluir com êxito um diretório ou site inteiro, o acesso ao diretório ou site deve ser negado no arquivo robots.txt do site. Por exemplo, para excluir o diretório http://www.example.com/secret/ , o arquivo robots.txt precisa conter:
Agente do usuário: *
Proibir: /secreto/
O diretório raiz retorna um código de status 404, mas isso não é suficiente porque mesmo que o diretório retorne um código de status 404, ainda é possível exibir os arquivos abaixo. Usar o robots.txt para bloquear um diretório (ou um site inteiro) pode garantir que todos os URLs do diretório (ou site) sejam bloqueados. Você pode usar as funções Buscar como Googlebot ou Testar robots.txt nas Ferramentas do Google para webmasters para testar se o diretório está completamente bloqueado.
Somente proprietários de sites verificados podem solicitar a exclusão de um site ou diretório inteiro nas Ferramentas do Google para webmasters. Para solicitar a exclusão de um diretório ou site, primeiro insira o site relevante e clique em Configuração do site > Acesso do rastreador > Excluir URL. Se você estiver na raiz do site e desejar excluir o URL, precisará confirmar que deseja excluir o site inteiro. Se você estiver inserindo um subdiretório, deverá selecionar a opção “Excluir diretório” no menu suspenso.
Adicione conteúdo novamente
Você pode cancelar uma solicitação de remoção do seu site a qualquer momento, incluindo solicitações enviadas por outras pessoas. Para fazer isso, você deve ser um proprietário de site verificado nas Ferramentas do Google para webmasters. Depois de verificado, você pode ir para Configuração do site > Acesso ao rastreador > Excluir URL (ou > Enviar por outros) e clicar no botão "Cancelar" ao lado da solicitação que deseja cancelar.
Ainda tem dúvidas? Fique ligado nas atualizações enquanto continuamos nossa série de postagens no blog sobre como remover conteúdo dos resultados de pesquisa do Google.