-
Há dois anos comecei a entrar em contato com SEO. A mania de aprender da época me fez visitar vários fóruns e blogs nacionais, e utilizar todos os métodos que não sabia se eram úteis ou inúteis na minha prática. Mas com o passar do tempo, aprendizado profundo. Fiquei desconfiado de vários métodos que circulavam na Internet. Quando os métodos conhecidos de envio de links, redação de artigos leves, empilhamento de palavras-chave, etc. se esgotaram, eu estava no limite e ainda não conseguia vencê-los. em classificações e tráfego. Ao mesmo tempo, estava exausto e também tive que refletir sobre os métodos operacionais mais profundos e eficazes de SEO. Depois de inúmeras reviravoltas, voltei ao meu antigo campo de "programação e desenvolvimento front-end". ". Parecia que da noite para o dia, de repente ficou claro o que estou fazendo agora. Não é o melhor SEO?
Para ser honesto, meu estudo está relativamente encerrado. Não atingi o estado de “o melhor SEO é não ter SEO”, nem tenho uma experiência prática de SEO muito boa. Integrado ao SEO, se eu fosse dar uma definição de SEO agora, seria: rede + hardware + programa + estrutura do site + padrões web + conteúdo + pessoas Muitas pessoas na Internet estão discutindo o conceito de “o conteúdo é rei”. ", mas muitos outros fatores são ignorados. Se esses fatores forem explicados em detalhes. Estima-se que um livro muito grosso possa ser publicado. Este artigo deseja apenas compartilhar com vocês o impacto dos padrões WEB no SEO.
O texto começa:
Para entender a relação entre os padrões da web e SEO, você deve primeiro entender o que são "padrões da web". Acho que você verificou muitos documentos explicativos na Internet, mas ainda se sente um pouco confuso e não quero. para aprender com a Internet. Vou copiar um parágrafo para você, mas no final ainda não consigo entender. Para entender os padrões da web, você precisa começar construindo uma página da web básica:
Por exemplo: Se eu quiser escrever a página web mais simples, devo usar tags html. Por exemplo: se quiser enfatizar o texto, tenho que usar a tag <strong>. tenho que adicionar uma tag <font color="color" >, quero começar um novo parágrafo, então tenho que usar a tag < > não posso usar a tag sem sentido <jacu> para enfatizar o texto, porque há. não existe tal tag e o navegador não pode analisá-la, então a W3C (World Wide Web) Association, uma organização) se levantou e disse aos profissionais da Internet em todo o mundo: "Todo mundo tem algumas opiniões, vamos unificar esses rótulos, quais podem ser usados e quais não podem ser usados; e então todos darão a esses rótulos uma explicação unificada e razoável, para que todos possam entender para que servem esses rótulos." Após inúmeras discussões. Como resultado, o padrão HTML 1.0 foi finalmente introduzido. Após modificações e atualizações subsequentes, mais padrões da web tornaram-se gradualmente disponíveis, como o HTML 2.0. .html 4.01, o xmhtml1.0/1.1 mais comumente usado nas páginas da web de todos, e o padrão xmhtml 2.0 que ainda não foi lançado oficialmente As atualizações padrão são todas compatíveis com versões futuras. Quando criamos páginas da web, geralmente há no topo. da página da web Tal frase:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" " http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
Na verdade, isso define o modelo do seu documento, que é explicado usando o padrão xhtml 1.0.
Mais tarde, porém, o layout da página da web tornou-se cada vez mais complexo. Era impossível criar uma página bonita e bonita apenas contando com essas tags HTML. imagem em 20px, ou eu queria espaçar o texto em 5px, é realmente difícil de conseguir contando apenas com HTML. Neste momento, o W3C não conseguia mais ficar parado, então se levantou e gritou: “Vamos definir algo mais para alcançar esta função, o padrão CSS 1.0 foi lançado”. Usando isso, você pode facilmente obter deslocamento de conteúdo, espaçamento e outros efeitos. Após o desenvolvimento, chegamos ao CSS 2.0 e CSS 3.0. Todos devem seguir este padrão ao definir estilos com CSS.
Mais tarde, as pessoas descobriram que confiar apenas em HTML e CSS ainda não era perfeito. Falta interação de interface homem-computador e não pode obter efeitos dinâmicos. Seria ainda melhor se pudéssemos mover as coisas na página da web, então o w3c introduziu o padrão emascript, que estipula a interface do modelo de objeto de documento. Gramática etc Por exemplo, o javascript comumente usado está em conformidade com o padrão emascript.
OK, agora tudo parece estar perfeito. Com padrões html, padrões css e padrões emascript, podemos finalmente criar lindas páginas da web. Reunimos esses padrões para formar padrões da web.
Por exemplo, um pedaço de HTML é escrito assim
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" " http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
<html>
<cabeça>
<title>demonstração</title>
</head>
<corpo>
<p><font color="#ff0000">Conteúdo de texto</font><p>
<img src="x.jpg" />
<dl>
<dt><h1>Título</h1></dt>
<dd>Conteúdo</dd>
<dd>Conteúdo</dd>
<dl>
<b>Conteúdo</b>
</body>
Então esse código está de acordo com os padrões da web? Vamos analisar esses códigos novamente. Na primeira linha, você define que o tipo do seu documento é xhtml 1.0, o que significa que todas as suas tags html devem ser escritas de acordo com esse padrão. do corpo Em uma tag <p>, a tag font foi descontinuada neste padrão, e o atributo color também foi descontinuado nesta tag, portanto, este parágrafo não está em conformidade com o padrão da web. Vejamos o <img>. tag novamente. É O atributo align define o alinhamento da imagem, mas o atributo alt está faltando No padrão xhtml 1.0, img deve definir o atributo alt Portanto, este código não está em conformidade com o padrão 1.0. , dt define o título. A tag <h1> é aninhada, conforme definido por xhtml 1.0. O aninhamento de tags <h1> não é permitido em tags <dt>, portanto também não atende ao padrão 1.0. Veja a última tag <b>, graças a Deus. Esta tag finalmente está em conformidade com os padrões da web. Mas w3c disse isso. Manteremos o significado deste rótulo por enquanto. Porém, ainda é recomendado que você utilize a tag <strong>, que é mais semântica. Posteriormente, no novo padrão, podemos cancelar a tag <b> como uma tag padrão. Em relação às restrições do padrão HTML, verifique os documentos correspondentes.
Falando nisso. Acho que todo mundo entende. Esta página nem mesmo está em conformidade com o padrão xmhtml 1.0, então definitivamente não está em conformidade com o padrão da web. Quanto à conformidade com o padrão da web, tudo depende da versão que você definiu. o navegador, porque mencionamos acima Como eu disse, todos os padrões são compatíveis com versões futuras, mas eles simplesmente não estão em conformidade com os padrões que você define agora. Então, como faço para que esse código esteja em conformidade com meus padrões da web? Existem apenas duas maneiras. 1. Reduza o padrão do seu modelo de documento (isso pode causar mais problemas) 2. Modifique novamente seu código, como colocar a cor no atributo style, img mais atributo alt Em comparação, estamos mais dispostos a escolher o segundo. tipo.
Existe uma explicação na Internet: padrão web = div + css O layout da tabela não pode ser usado. Depois de ler o artigo acima, não é difícil entendermos. Este conceito é puramente confuso e generalizante. Não se pode dizer que as páginas da web com layout de tabela não estejam em conformidade com os padrões da web. A tag <table> sempre foi a tag padrão em todas as versões. Embora todos nós utilizemos divs para layout, precisamos entender: as práticas recomendadas por outros não são iguais aos padrões.
Como mencionado anteriormente, os padrões da web dependem da versão que definimos ao escrever html/css/js. Por exemplo, se meu html usa o padrão xhtml 1.0, então meu html também deve estar em conformidade com o padrão xhtml 1.0. Mas não parece ser o caso. Quase 99,999% das páginas da Internet não conseguem passar na verificação. Sempre há erros de um tipo ou de outro. .org pode passar na verificação. Sim, amigos interessados podem testá-lo. Neste ponto, nosso artigo parece ter chegado a um beco sem saída. Como muitas páginas da web não atendem aos padrões da web, elas também podem obter boas classificações e tráfego. padrões da web Qual é a conexão com SEO Temos que começar com estrutura e análise de HTML.
Web design enfatiza a separação entre estrutura (html) e apresentação (css). Podemos entender seus conceitos desta forma. A estrutura é uma casa. É uma estante feita de concreto armado e tijolos, e a atuação é a decoração e modificação da estrutura. É como decoração, instalação de pisos e reboco e pintura das paredes da casa. Sem estrutura, o desempenho não tem valor real de desempenho, e é por isso que <font color="#ccc" size="12">text</font> ou Tais tags ou propriedades, porque para a estrutura, é mais como um desempenho, ele deve ficar na camada de apresentação, ou seja, CSS. Se aplicarmos a tag font na página estrita xhtml 1.0, na verdade ela também pode ser analisada corretamente, pois como dissemos no primeiro artigo, os padrões são compatíveis com versões futuras. .
Vamos entender como os navegadores e mecanismos de pesquisa analisam nosso HTML. Por que falamos sobre navegadores aqui? Porque, na minha opinião, os mecanismos de pesquisa e os navegadores usam aproximadamente o mesmo método ao analisar o HTML. que eventualmente analisará a página inteira em uma árvore DOM com nós estritos de relacionamento pai-filho. E então apresentá-lo ao usuário, por exemplo, quando escrevo o seguinte código:
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" " http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
<html xmlns=" http://www.w3.org/1999/xhtml ">
<cabeça>
<título>título</título>
</head>
<corpo>
<div id="topo">
<h1>Este é o título<h1>
<img src="xx.jpg"/>
<p>Este é um <strong>texto</strong><p>
</div>
<div id="contêiner">
<h2>Este é outro título</h2>
<p>Este é outro <strong>texto</strong></p>
</div>
</body>
</html>
Você pode ver que este é um pedaço de html sob o padrão de transição xhtml 1.0. Existem muitos erros (os erros incluem: a tag <h1> na primeira div não tem tag de fechamento. img não tem atributo alt. A tag <p>. também não tem tag de fechamento). Mas se você colocar esse código no navegador e executá-lo, poderá ver o efeito correto. A tag P também funciona, e a imagem pode ser exibida. Ficamos muito surpresos porque esse código nem tem a tag correta, mas porque pode ser analisado corretamente no navegador. Se assumirmos que esse código não está errado, ele. está correto. A estrutura do dom deve ser conforme mostrado abaixo (Figura 1)
Carregar e baixar anexo (16,49 KB) às 16h58 de anteontem
Por que o navegador consegue analisar corretamente o código incorreto? E parece ser capaz de “adivinhar” a verdadeira intenção do código de erro. O princípio é que o navegador use o modo de análise de dicionário e o modo de agrupamento (html tidy) ao construir a árvore de tags. Simplificando, o navegador irá combinar todas as tags e atributos com as informações do dicionário integrado. Se a correspondência for normal, ela será analisada diretamente. Basta ativar o modo de finalização. O modo de finalização irá analisar seu código errado e corrigi-lo. Por exemplo, as tags <h1> e <p> no final serão automaticamente alteradas para a tag de fechamento, ou se você escrever uma. Par de tags <jiacu> texto</ jiacu>. Isso não pode ser igualado e não pode ser reparado. Isso limpará diretamente o par de tags inválido, deixando apenas o texto dentro. Claro, ao navegar e analisar HTML em uma árvore DOM, isso não alterará seu código-fonte HTML. É apenas uma ação de análise. Portanto, muitas vezes, se não verificarmos os erros de HTML em nossas páginas, não encontraremos esses erros. . Porque o navegador corrigiu isso automaticamente para nós. De modo geral, os navegadores garantem total compatibilidade com erros de HTML. Corrija-o se puder ajudá-lo. Se as tags ou atributos redundantes puderem ser apagados, eles serão apagados. Se não puderem ser apagados e corrigidos, as tags serão removidas automaticamente para você garantir a exibição normal.
No entanto, o “modo de organização” não é onipotente. Não podemos esperar que o navegador nos ajude a corrigir todos os erros, tantas vezes quando nossas páginas estão aninhadas cada vez mais fundo, com cada vez mais tags e cada vez mais conteúdo, às vezes, quando o. o navegador não pode corrigir as tags, a única coisa que ele pode fazer é "remover todas as tags de um bloco de erro e manter apenas o conteúdo".
Do ponto de vista de um mecanismo de busca, antes de analisar o conteúdo, sua premissa é a mesma de um navegador, o que requer a construção de uma árvore DOM completa. Somente quando essa árvore estiver concluída o mecanismo de busca poderá determinar a relação de contexto na página, bem como. quais tags ponderadas (como <strong>, <h1>) são usadas na página, bem como suas posições de distribuição, etc. No entanto, os motores de busca dão mais ênfase ao conceito de “bloco de conteúdo” ao analisar, ou seja, uma tag por bloco. Ainda o exemplo de html acima. Quando o mecanismo de busca estava construindo esta árvore DOM, ao analisar a tag <h1> no primeiro div, descobriu que havia um erro. Ao analisar a tag P, ele encontrou outro erro. construir corretamente esta árvore A DOM, isso ativará o modo de acabamento, mas o modo neste momento pode não ajudar a corrigir erros, mas em "blocos". Procure o bloco superior (nó) do bloco de erro (nó) (se ainda houver um erro no nível superior, continue procurando o nível superior. Se não houver erro no bloco de nível superior, então todos os sub). -blocos e subblocos neste bloco de nível superior serão pesquisados. Todas as tags erradas no subbloco serão removidas, ou seja, todas as tags erradas dentro de <div id="top"> serão removidas. A árvore construída é mostrada na Figura 2 acima (revisão 2011.4.5: há um pequeno erro na Figura 2. Há uma tag img abaixo da tag div à esquerda).
Desta forma, vemos que as tags <h1> e <strong> que escrevemos cuidadosamente desapareceram após a análise e o "peso" de todo o bloco mudou. De acordo com o princípio da análise HTML, podemos facilmente inserir algumas delas. conclusão:
1. Quando o nível do nó da página aumenta cada vez mais, devemos ter cuidado especial com os erros no nível do rótulo. Quanto mais próximo do nó superior, mais cuidadosos devemos ter. Por exemplo, devemos escrever menos tags finais. fatal para SEO.
2. Não importa o layout usado, quanto menos níveis de aninhamento de nós, melhor. Em primeiro lugar, pode reduzir a carga sobre os mecanismos de pesquisa ao analisar os nós. , A ponderação das palavras-chave é importante.
3. Quando os atributos do rótulo puderem ser substituídos por css, mova-os para css tanto quanto possível.
4. Tanto os navegadores quanto os mecanismos de busca permitem erros de HTML, mas o HTML padrão é obviamente mais fácil de obter melhores classificações sob as mesmas condições externas.
Levei quase quatro horas para escrever este artigo. Algumas partes não são muito completas.
Fonte do artigo: Lightyear Forum (indique o link da fonte e o autor ao reimprimir)
Autor do artigo: newyhj