A obrigação do mecanismo de busca de identificar a página com precisão não é um presente.

Autor：Eve Cole Data da Última Atualização：2012-08-22 10:34:20

Em 13 de abril de 2010, no Baidu Tieba Webmaster Club, ZAC, um conhecido especialista chinês em SEO, perguntou na postagem "Fazer perguntas em nome de outras pessoas que o conteúdo original não pode ser identificado": "A classificação do meu próprio conteúdo original muitas vezes não é tão bom quanto o conteúdo reimpresso ou plagiado. O que o webmaster pode fazer para prevenir ou melhorar o conteúdo original do meu site, e o Baidu também o atualiza todos os dias. não pode ser pesquisado. Eu persisti quase 4 vezes. É meu trabalho original, mas o Baidu ainda me deixou cair em mais de 500 lugares!

Há dois anos, o webmaster representante da ZAC conversou com Lee, que representava o Baidu, sobre a questão da inclusão original.

Mais de dois anos se passaram e a situação declarada na pergunta acima não mudou, e até piorou. Várias páginas de conteúdo original valioso "pseudo-originais copiadas e coletadas" são facilmente recomendadas para pesquisa de internautas pela pesquisa na web do Baidu por meio de indexação de palavras-chave. No entanto, o site de lançamento de conteúdo original perdeu reputação. Isto tolera objetivamente a proliferação do chamado SEO baseado na “cópia e coleta de pseudo-originais” que visa as deficiências do Baidu.

Não é de surpreender que, no evento "Webmaster Clinic Open Day" do Baidu em 10 de agosto deste ano, a questão da identificação da originalidade se tornou uma pergunta que os webmasters e SEOERs continuaram fazendo ao engenheiro de pesquisa do Baidu, Lee.

Também sem surpresa, a resposta do engenheiro de pesquisa do Baidu, Lee, foi uma réplica de sua resposta de dois anos atrás: "Bem, só podemos dizer que a estratégia do Baidu ainda não é perfeita e estamos melhorando o algoritmo de identificação original perfeito".

As pessoas que acompanham as notícias do Baidu podem facilmente descobrir que a resposta de Baidu Lee "Estamos projetando um conjunto relativamente completo de algoritmos de identificação originais" é totalmente uma resposta às "Medidas contra sites de baixa qualidade" da equipe antifraude de pesquisa na web do Baidu em 2 de julho. "As medidas contra sites de baixa qualidade (originais falsos e sites não originais) entraram em vigor" - Todos ainda se lembram que naquela época, "As medidas contra sites de baixa qualidade entraram em vigor" diziam grandiosamente: "Para fornecer alta qualidade, Para webmasters de recursos originais, porque reduzimos ou até eliminamos as classificações de sites de baixa qualidade, você obterá mais tráfego do Baidu."

Mas menos de dois meses depois, a resposta do engenheiro de pesquisa do Baidu, Lee, negou completamente a declaração da equipe antifraude de pesquisa na web do Baidu, o que foi realmente chocante.

Além disso, quando confrontado com a questão de identificar “conteúdo original” duas vezes após dois anos, Baidu Lee adotou o método de “olhar em volta e falar sobre isso” para lidar com isso superficialmente: Dois anos atrás, a resposta de Lee foi “Da perspectiva de experiência do usuário, algumas reimpressões podem não ser piores que o original... são apenas reimpressões domésticas, muitas das quais são cortadas do começo ao fim, o que deixa o autor original mais prejudicado." É mais voltado para o problema de irregularidades domésticas reimpressão; este ano, a resposta de Baidu Lee é: "(Baidu recebeu Mais de 80% das reclamações que afirmam ser originais são inválidas, e há até um grande número de sites que afirmam que antigos médicos de medicina chinesa podem curar doenças terminais em 3-5 dias Todo o conteúdo é ilegível e eles afirmam ser sites de alta qualidade."

É inegável que tudo o que Lee disse são fatos, mas o acúmulo de detalhes reais não equivale ao todo real. A existência dessas situações comuns não significa que não exista conteúdo original de alta qualidade na indústria chinesa da Internet, nem. isso significa que o Baidu não consegue identificar o motivo do lançamento original. Como diz o ditado: “Se você não tem um diamante, não mexa na porcelana”. A declaração de Baidu Lee só pode provar que a capacidade do Baidu de identificar o conteúdo original e remover páginas duplicadas não melhorou em nada.

Deve-se enfatizar que, depois de compreender que a fraca capacidade de identificar páginas originais é o ponto fraco de todos os motores de busca, muitos autores originais de base adicionaram uma declaração de direitos autorais no final do artigo para marcar o URL inicial e, ao mesmo tempo, eles são guiados pelo método de "sincronização de conteúdo" de envios de sites da indústria de alta qualidade e webmasters republicados - Embora a maioria dos links obtidos sejam links de texto simples, o engenheiro de pesquisa do Baidu, Lee, disse: "Vamos esclarecer a questão: os links podem entrar. a forma de texto simples (sem tags) seja reconhecida e processada? A resposta "Sim, os spiders dos mecanismos de pesquisa precisam descobrir e rastrear links na Internet em tempo hábil. Não importa em que formato o link está", o que lhes deu confiança.

O que decepciona esses webmasters é que um grande número de sites autorizados de submissão e reimpressão na indústria não "reimprimem do início ao fim", como disse Baidu Lee, e as páginas da web de submissões de alto peso ou sites de reimpressão são geradas e incluídas pelos mecanismos de pesquisa significativamente antes de " No caso de sites de "cópia e coleta de pseudo-originais", ainda há um grande número de páginas originais de primeira página que são ignoradas pelo Baidu. As classificações de "cópia e coleta de pseudo-originais" os sites permanecem altos - muitas dessas páginas ainda interceptam aleatoriamente parte do artigo e não expressam totalmente o tema do artigo. Não podem atender ao padrão de "melhor experiência do usuário" anunciado pelo Baidu.

Deve-se notar que embora a identificação de páginas originais sempre tenha sido um ponto fraco dos motores de busca, nem todos os motores de busca têm um desempenho tão ruim quanto o Baidu diante de muitos URLs de alto peso que apontam para páginas de lançamento originais. Como disse Wang Tong, um conhecido SEOER doméstico, em face da proliferação de "cópia e coleta de pseudo-originais" na Internet chinesa, para a página de lançamento original com o guia URL da declaração de direitos autorais (além do lançamento tempo, universalidade do link e peso da página do site do link, etc. Padrão), o Google não sofreu um fracasso completo como o Baidu, que afirma "conhecer melhor o chinês" - as principais pesquisas relacionadas ao blockbuster são ocupadas por páginas pseudo-originais copiadas e coletadas, e a primeira página original desaparece sem deixar vestígios.

Isso mostra que o Baidu, que “conhece melhor o chinês”, deve concluir o trabalho de identificação original e a remoção de páginas duplicadas (para identificar páginas de informações de alta qualidade e páginas complementares importantes para recomendações importantes) antes de recomendar URLs para pesquisar internautas por meio de indexação de palavras-chave. Não foi concluído - a razão é que o nível técnico é muito baixo e há uma necessidade urgente de recuperar o atraso, e a declaração de Baidu Lee está constantemente em busca de desculpas para o Baidu.

Além disso, em comparação, o melhor desempenho do Google na identificação do endereço inicial original prova que o Baidu não se preocupa com a página inicial original, apenas se preocupa com conteúdo mais original - mas não tem o devido conhecimento de direitos autorais. Há muito tempo, a principal razão para o atraso do algoritmo original do site é “impossível ou não”.

Não é de admirar que, assim que Wang Tong, um conhecido SEOER doméstico, disse que "o ajuste 628 do Baidu é reprimir sites originais", muitos webmasters e SEOERs ficaram tristes.

Na verdade, se a tecnologia de identificação da primeira página original puder ser bastante melhorada, isso pode ajudar a melhorar significativamente a capacidade anti-trapaça do mecanismo de pesquisa, frustrar diretamente as tramas de SEOERs que enganam os mecanismos de pesquisa de várias maneiras para obter lucro e fornecer uma plataforma para aqueles que estão seriamente comprometidos com motores de busca de alta qualidade. Confiança em conteúdo original de qualidade.

Somente quando o Baidu respeitar o trabalho de muitos webmasters de sites originais de pequeno e médio porte com ações práticas e os incentivar a continuar a usar sua inteligência e talentos para realizar trabalhos originais poderemos orientar mais webmasters e SEOERs obcecados em "copiar e coletar pseudo-originais" para dedicar sua energia ao conteúdo original que "melhor reflete o valor central do site". Para o Baidu, embora esta etapa seja difícil, é uma grande mudança que é benéfica para o desenvolvimento futuro dos motores de busca.

Além disso, devo lembrar à pesquisa na web do Baidu que não é um presente do Baidu para muitos webmasters de base resolver o “problema de coleta de conteúdo original” relatado pelos webmasters o mais rápido possível com um algoritmo mais razoável (sites conhecidos não irritam o Baidu em todos), o Taobao bloqueia diretamente o Baidu), mas é uma "obrigação básica" que o Baidu deve cumprir de acordo com a atual Lei de Direitos Autorais e outras leis relevantes. As pessoas do Baidu não conseguem se sentir muito bem consigo mesmas.

Para onde ir, o caminho está aos seus pés, tudo depende da escolha do próprio motor de busca (Este artigo foi publicado originalmente por gouyn12. Todos os direitos reservados. Você é responsável pelo artigo. Por favor indique a fonte original do artigo no forma de um link ao reimprimi-lo : http://www.gouyn12.com/cnnet/327.html ).

(Editor: Chen Long) O espaço pessoal do autor gouyn12