Todos devem saber sobre conteúdo duplicado Como o nome sugere, significa que o conteúdo do site é repetido, ou é também chamado de página web duplicada, ou seja, página web com conteúdo duplicado. Devido ao ambiente da Internet na China, a coleta de plágio é bastante popular, especialmente depois que muitos CMSs foram lançados nos últimos anos, mais e mais webmasters registraram um nome de domínio, carregaram um programa CMS e começaram a coletar e construir sites. Na verdade, essa abordagem não é aconselhável. Em primeiro lugar, os usuários ficarão enojados com a grande quantidade de conteúdo repetido. Os mecanismos de pesquisa também são baseados na experiência do usuário.
Alguns sites podem usar URLs diferentes para acessar a mesma página devido a problemas com seus próprios programas. Mencionei isso em meu artigo anterior sobre padronização de URLs. A padronização de URLs é muito importante, então não vou discutir isso aqui. mencionando que a padronização de URLs pode ser considerada uma obrigação para toda otimização de SEO. Os mecanismos de pesquisa não gostam de conteúdo duplicado. O programa determinará automaticamente qual é a versão original e, em seguida, ignorará outras páginas. Mas para os motores de busca, um consome recursos de banda larga e o outro é uma perda de tempo. Para administradores de sites, múltiplos URLs não apenas dispersarão peso e reduzirão classificações, mas também enfrentarão o risco de serem punidos pelos mecanismos de busca. E você precisa saber que, afinal, um spider é apenas um programa, e a URL padronizada que ele escolhe por si só pode não ser o que desejamos. Em relação à questão da punição pela cópia de páginas de conteúdo, tem havido um debate na indústria de SEO, que é a questão da punição e da não punição. Pessoalmente, acho que você ainda será punido. Embora o Google tenha declarado claramente no guia oficial para webmasters que páginas da web com conteúdo duplicado não serão punidas, mas por favor, não crie um grande número de páginas da web com conteúdo duplicado, pois isso não é propício. para a classificação do site. O Baidu também deixou claro: se a maior parte do conteúdo da sua página for duplicada com o conteúdo existente na Internet, seu site provavelmente será abandonado pelo Baidu. E quando esses URLs duplicados são incluídos, quando o mecanismo de pesquisa retorna essas páginas da web com conteúdo duplicado ao pesquisador, isso afetará seriamente a experiência do usuário, porque o mecanismo de pesquisa é baseado na experiência do usuário como seu núcleo, e não quer o resultados de pesquisa listados como iguais. Ele está disposto a listar apenas uma cópia do conteúdo duplicado e, para outras páginas de conteúdo duplicado, os mecanismos de pesquisa farão o downgrade da página ou a excluirão diretamente do índice.
Quando li "Website Traffic Speed Up Second Edition" hoje em dia, descobri que outra situação para páginas da web com conteúdo repetido é que os vendedores e agentes de produtos copiam informações do produto do site do fabricante, então para o fabricante está tudo bem, porque os fabricantes geralmente concordam; mas isso cria um problema: muito conteúdo duplicado aparece em diferentes páginas da web, o que não agrada aos mecanismos de pesquisa. Para tornar seus produtos mais familiares aos clientes, esses sites podem fornecer algumas versões mais adequadas para impressão. Se esses URLs não forem processados, as páginas de conteúdo também serão copiadas.
Outra situação é a armadilha de aranha mencionada em um artigo de anteontem. Ou seja, alguns sites de comércio eletrônico usarão IDs de sessão para fornecer IDs diferentes a diferentes usuários. páginas de conteúdo. Para obter detalhes, você pode ler este artigo sobre como evitar armadilhas de aranha. Quando um mecanismo de pesquisa determina se deve copiar uma página da web, ele terá um conjunto de mecanismos de algoritmos relacionados para processá-la. Isso envolve diferentes algoritmos de mecanismo de detecção de conteúdo duplicado de diferentes mecanismos de pesquisa. Devido aos diferentes pesos dos sites, os mecanismos de pesquisa podem considerar a fonte original real como uma cópia e a copiada como a fonte original. Isso é especialmente verdadeiro para sites com peso muito alto no Baidu, como este meu artigo, mesmo que seja. for incluído pelo Baidu depois de eu publicá-lo, se for reimpresso pela Sina, o Baidu ainda poderá julgar que fui reimpresso.
Além da parte de conteúdo da página web, as páginas de conteúdo duplicadas também possuem títulos repetidos, estruturas repetidas, modelos repetidos, etc. Agora todo mundo que faz SEO sabe que o título de uma página web é muito importante, então quando você nomeia um título para uma página da web, tente ir ao Baidu e ao Google e pesquisar se já existe um título como este ou semelhante a este. Tente não repetir o título. Em relação à duplicação estrutural, os mais comuns incluem alguns sistemas CMS, programas de construção de sites, programas de fórum, etc. Como esses programas são amplamente utilizados, suas estruturas de URL geralmente apresentam grandes áreas de duplicação. tanto quanto possível. Então, o que é duplicação de modelos Hoje em dia, o limite para construir um site está cada vez menor. Muitas pessoas carregam um programa, aplicam um modelo padrão e esquecem-no. modelo. Baixe-o. O modelo padrão é geralmente usado amplamente. Sua estrutura de layout e o código HTML ou CSS no modelo geralmente causam duplicação. em outras palavras, para os profissionais de SEO, para melhorar melhor o desempenho do SEO, é recomendável modificá-lo.
Existem também sites espelho, mencionados neste blog. Você pode pesquisá-los, mas não vou descrevê-los aqui. Não entraremos em mais detalhes sobre o problema das páginas com conteúdo copiado causado pela reimpressão e plágio de artigos. Outra coisa a evitar é que o conteúdo do site seja muito pequeno. Por exemplo, alguns sites têm muito pouco conteúdo substantivo em suas páginas de conteúdo. Além disso, cada página inevitavelmente possui partes comuns, como a barra de navegação, a parte inferior da página. etc. Se a quantidade de conteúdo substantivo for menor que esse conteúdo, ela também poderá ser julgada como uma página de conteúdo duplicado pelos mecanismos de pesquisa. Há também um detalhe. Alguns sites possuem páginas em branco por negligência ou outros motivos. Se houver um grande número de páginas em branco, serão confundidas com conteúdo duplicado.
Também existe um site de tipo de serviço ou produto. Ao operar por região, alguns produtos ou tipos de serviço têm intervalos menores ou são iguais. Esse tipo de página modifica apenas a região e outras informações de parâmetros, mas outras grandes a maior parte do conteúdo. ainda é o mesmo. Existem também sites de notícias comuns que usam feeds RSS para gerar conteúdo da web, e esses conteúdos também estão sujeitos a inundações. Alguns sites geram arquivos estáticos reais antes de serem revisados, e essas páginas HTML reais não são excluídas após a revisão. Se a estrutura do site for alterada, mas o conteúdo permanecer inalterado, os arquivos HTML nesses diretórios reais não devem ser excluídos. também causará um alto grau de duplicação do conteúdo da web. Da mesma forma, configurações inadequadas de resumo também podem levar à duplicação de páginas de conteúdo. Para melhorar a experiência do usuário, cada vez mais sites, especialmente sites de notícias, agora permitem funções de resumo de artigos. Esses resumos não apenas fornecem aos usuários uma navegação conveniente, mas também podem causar mal-entendidos. . Acho que conteúdo duplicado, e outra situação incomum é http e https, etc. É fundamental trabalhar nos detalhes para otimização do site, e o conteúdo duplicado no site afetará até certo ponto a classificação do site. Fonte deste artigo: Shenzhen SEO Fonte http://www.zhsem.com/ Indique ao reimprimir, obrigado!
O espaço pessoal do autor Xiao Wuming