A maioria dos webmasters já sabe que conteúdo duplicado pode ter um impacto negativo nas classificações de um site. Mas como verificar se um determinado site tem esse problema e como reduzi-lo ou evitá-lo?
Desde o início, o conteúdo duplicado pode ser dividido em duas categorias principais:
Conteúdo duplicado devido à estrutura do site
Conteúdo duplicado devido a roubo de conteúdo
Sobre conteúdo duplicado causado pela estrutura do site
Algumas estruturas de sites causam inerentemente conteúdo duplicado. Os exemplos incluem:
páginas compatíveis com PTINT
Ter conteúdo geralmente semelhante em várias páginas que podem ser acessadas por meio de diferentes endereços de URL
Existem unidades muito semelhantes na página, como uma série de revestimentos de cores diferentes com descrições semelhantes em uma categoria de comércio eletrônico
A página faz parte de um programa de associação de um aplicativo de rastreamento e o programa está configurado incorretamente
Várias páginas têm títulos duplicados ou valores de metatag duplicados
Use o ID da sessão no endereço URL
Problemas de padronização
Para encontrar conteúdo duplicado causado pela estrutura do site, você pode usar a string de consulta site:www.yingyuxuexi.org.cn para verificar os endereços URL de sites que foram indexados pelos mecanismos de pesquisa. Todos os principais mecanismos de pesquisa (Google, Yahoo!, Microsoft Live Search) oferecem suporte a esse recurso. Normalmente, as páginas "adequadas para impressão" aparecerão rapidamente se forem indexadas.
O Google frequentemente coloca o que considera conteúdo duplicado em um “índice suplementar”. Há uma marca de material suplementar na parte inferior dos resultados do mecanismo de pesquisa e esse conteúdo é colocado. Claro, o Google agora escondeu este logotipo. Se um site tiver muitas páginas aparecendo no índice suplementar, isso pode significar que essas páginas são conteúdo duplicado – pelo menos, assim pensa o Google. Se possível, pesquise os endereços URL dessas páginas e procure alguma das situações acima. Observe especialmente as páginas que acompanham os resultados. Problemas de conteúdo duplicado são particularmente fáceis de criar se você não tomar cuidado, por isso é útil analisá-los de uma perspectiva amigável aos mecanismos de pesquisa.
Sobre conteúdo duplicado devido a roubo de conteúdo
O roubo de conteúdo cria um problema totalmente diferente. Assim como os ladrões podem roubar bens imóveis, eles também podem roubar conteúdo. Sem dúvida esta é a razão pela qual é chamado de roubo de conteúdo. Isto cria problemas para os motores de busca, que, por trabalharem arduamente para filtrar conteúdo duplicado dos resultados de pesquisa (e de diferentes websites), por vezes têm ideias erradas sobre o que é conteúdo original e oficial.
Em alguns casos, este é um problema oculto e pode ter um impacto desastroso nas classificações. Se você foi vítima de roubo de conteúdo e deseja agir, comece enviando uma carta de cessação e desistência à pessoa que usa o conteúdo ilegal. Você pode usar as informações de contato fornecidas pelo site ou as informações de contato no registro WHOIS do nome de domínio. Se isso falhar, entre em contato com os principais mecanismos de pesquisa para alertá-los sobre roubo de conteúdo.
Aqui estão os endereços URL pelos quais os principais mecanismos de pesquisa são responsáveis:
Google: http://www.google.com/dmca.html
Yahoo!: http://docs.yahoo.com/info/copyrighffcopyright.html
Basicamente, desde que um site insista em atualizar constantemente o conteúdo original, mecanismos de busca como Baidu, Google e Yahoo já podem identificar bem a fonte original do conteúdo original. O que o webmaster precisa fazer é atualizar o conteúdo do site de alta qualidade todos os dias.
Autor: Street Dancer-HipHop-A maior plataforma de comunicação para dançarinos da China Fonte: http://www.jiewuzhe.com