Um dos tópicos mais quentes e importantes do momento é o fenômeno fantasma do Google. Em circunstâncias normais, ao enviar um site para a Internet, você descobrirá que o site aparece no índice antes da atualização regular mensal. Às vezes, este site pode obter uma classificação elevada, mas o terrível é que depois de alguns dias ou uma semana, este site desaparecerá repentinamente. Este fenômeno fantasma incomoda os novatos na Internet e representa um problema para os especialistas experientes em Internet. Na verdade, esse fenômeno é fácil de entender.
O Google tem dois tipos de rastreadores da web: o rastreador principal e o novo rastreador. O rastreador principal é o principal responsável por descobrir novas páginas da web. Uma página da web será descoberta pelo rastreador principal imediatamente após o estabelecimento do novo índice. Se demorar um mês para que uma página da web seja indexada, a página da web se tornará inválida. Por exemplo, o site www.njxtfpcom tem um fenômeno fantasma do Google.
Existem outros determinantes não baseados em consulta a serem considerados ao construir um novo índice. Esses determinantes estão relacionados ao ranking das páginas web. Para aproveitar ao máximo essas páginas e não perder tempo esperando pela próxima atualização do algoritmo de indexação, o Google deve tomar algumas medidas simples para adivinhar as classificações e adivinhar quais novos conteúdos são difíceis de serem aproveitados pelos visitantes.
Embora o Google esteja especulando, o seguinte é verdade:
1) A classificação na página de destino fantasma não pode ser equiparada à classificação na página de índice.
2) As páginas iniciais do Ghost devem ser movidas do banco de dados antes que um novo banco de dados seja criado a cada mês. No entanto, esta é apenas uma remoção temporária.
Se você tiver essa página de destino em seu índice, seu objetivo principal deve ser classificar a página no Google New Pages. Se quiser fazer isso, você precisa atualizar o conteúdo do site regularmente e regularmente, de preferência todos os dias, em determinados intervalos.
Por que você deseja ser classificado na nova página do Google? Porque os sites classificados em novas páginas têm maior probabilidade de serem rastreados e o índice é mais fácil de atualizar? Mas a classificação na nova página não é a classificação real, e a classificação na nova página apresenta forte instabilidade. Demora um pouco para que as novas classificações de páginas se transformem em classificações reais.
Estudo de caso: o mesmo encontro
(1) Cinco dias atrás, carreguei um novo pequeno site na Internet. Desta vez, em vez de vincular este site aos meus outros sites como antes, adicionei o URL ao Google adicionando l.html . Esperei em silêncio que este site fosse descoberto. Três dias depois, usando as principais palavras-chave do site para pesquisar, o site pode ser classificado entre os dez primeiros resultados de pesquisa, e os registros mostram que 130 visitantes visitaram o site. Porém, um dia depois, o site desapareceu. Desta vez, ele não apenas caiu entre os dez primeiros, mas também saiu de todo o diretório do Google. Não havia nada de errado com o site em si. Não houve trapaça, links ocultos, duplicação de conteúdo e preenchimento de palavras-chave.
Pensei bem nas deficiências deste site. Talvez o motivo do desaparecimento da classificação tenha sido porque o site não tinha links de entrada, talvez porque o site tivesse uma janela pop-up. Talvez, talvez, existam inúmeras possibilidades esperando por mim.
(2) As pessoas costumam nos fazer perguntas sobre esse tipo de questão. Para atender às necessidades de diferentes questionadores, escrevemos um artigo na esperança de ser útil.
Quando um spider de pesquisa do Google rastreia uma nova página da web, o que acontecerá com a nova página da web?
Uma nova página não é incluída no diretório inicial do Google até:
1. A página da web é rastreada pelo spider de pesquisa do diretório inicial do Google.
2. Depois que a página da web é rastreada pelo spider de pesquisa do diretório principal do Google, ela deve ser atualizada por um período de tempo.
Somente quando os dois itens acima forem atendidos e a nova página da web for realmente rastreada pelo diretório principal do Google, a classificação da nova página da web poderá ser convertida em uma classificação real.
O Google tem duas formas de rastreamento
1. Rastreamento principal
2. Novo rastreamento
Uma nova página da web é rastreada primeiro por um spider de "novo rastreamento". Mas há exceções. Durante o período imediatamente após a conclusão das atualizações mensais do Google, uma página da web geralmente é rastreada por um spider de “rastreador primário”. As atualizações mensais geralmente ocorrem entre os dias 20 e 28 de cada mês e podem durar vários dias.
Para distinguir as diferenças entre os dois spiders, podemos primeiro observar um conjunto de endereços IP.
1. Spider "Rastreamento Principal" = 216.239.46.*
2. Spider "Novo rastreamento" = 64.68.82.*
Para explicar melhor o fenômeno fantasma do Google que ocorre com novas páginas, vamos supor que a página seja rastreada primeiro por um spider de “novo rastreamento”. Entre dois meses de atualizações do Google, o spider do “novo rastreamento” chega para rastrear novas páginas da web. Durante o rastreamento principal, novas páginas da web podem ser rastreadas por meio de links. O mesmo acontece durante um novo rastreamento.
Embora esta página não tenha sido atualizada e não esteja incluída no diretório principal do Google, após o rastreamento, os spiders de busca começam a medir o conteúdo e a qualidade da página e a incluí-la nos resultados da pesquisa. Esta medição é muito instável, suscetível a influências externas e muda frequentemente.
Essas páginas irão flutuar quando as atualizações mensais regulares chegarem. Atualizações mensais regulares são flutuações do Google. No entanto, é preciso lembrar que o spider do “rastreador principal” não leu a página, portanto a página não foi incluída no índice principal. Assim, quando a atualização mensal terminar, a nova página ainda será considerada uma nova página, mas logo o spider do "rastreador principal" lerá a nova página, e ela não será incluída no índice principal até a atualização do próximo mês. Isso demora um pouco. Antes disso, o Google não exibia nenhum link de entrada e a classificação desta página era, portanto, variável e instável.
Vamos resumir:
Se uma nova página da web for rastreada primeiro por um spider de "novo rastreamento" e depois por um spider de "rastreamento principal", a página da web precisará ser atualizada duas vezes por mês. Ou seja, levará dois meses para que esta nova página seja incluída no índice principal. Somente depois de incluída no índice principal poderá obter uma classificação estável.
Durante este período, novas páginas web podem aparecer ou desaparecer nas páginas de resultados de pesquisa do Google. Esta instabilidade é completamente normal. Este problema surge.
Existe outra situação. Se uma nova página da web for rastreada primeiro pelo spider de "rastreamento principal" (isso geralmente acontece no final de janeiro), a página da web só precisará esperar um mês antes de poder entrar no "índice principal".
Os designers e proprietários de sites terão dificuldade em realizar seu trabalho se não compreenderem o processo do Google para rastrear novas páginas da web. A classificação da página pode disparar, ficando entre os dez primeiros, o que deixa as pessoas em êxtase, ou pode despencar, caindo do top 200, o que faz as pessoas se sentirem desanimadas. Ao compreender as regras do processo de rastreamento de novas páginas da Web do Google, os heróis da Internet não ficarão mais confusos e ser alvo não será mais um mero sonho.