Jelaskan hubungan antara standar web dan SEO secara menyeluruh

Penulis：Eve Cole Waktu Pembaruan：2011-04-06 15:01:19

-
Dua tahun lalu, saya mulai terjun ke dunia SEO, kegemaran belajar saat itu membuat saya mengunjungi berbagai forum dan blog dalam negeri, dan menggunakan segala cara yang saya tidak tahu apakah berguna atau tidak berguna dalam praktik saya. Namun seiring berjalannya waktu, Pembelajaran mendalam. Saya menjadi curiga dengan berbagai metode yang beredar di Internet. Ketika metode terkenal seperti mengirimkan tautan, menulis artikel ringan, menumpuk kata kunci, dll. sudah habis, saya berada di ujung tanduk, saya masih tidak bisa mengalahkannya dalam peringkat dan lalu lintas. Pada saat yang sama, saya kelelahan. Saya juga harus merenungkan metode operasi SEO yang lebih dalam dan lebih efektif. Setelah melewati banyak tikungan dan belokan, saya kembali ke bidang lama saya yaitu "pemrograman dan pengembangan front-end ". Tampaknya dalam semalam, tiba-tiba menjadi jelas apa yang saya lakukan sekarang. Bukankah ini SEO terbaik?

Sejujurnya, studi saya relatif tertutup. Saya belum mencapai tingkat "SEO terbaik tanpa SEO", dan saya juga tidak memiliki pengalaman praktis SEO yang sangat baik . Terintegrasi ke dalam SEO, jika saya memberikan definisi SEO sekarang, itu akan menjadi: jaringan + perangkat keras + program + struktur situs + standar web + konten + orang ", tapi Banyak faktor lain yang diabaikan. Jika faktor-faktor tersebut dijelaskan secara rinci. Diperkirakan buku yang sangat tebal bisa diterbitkan. Artikel ini hanya ingin berbagi dengan Anda dampak standar WEB terhadap SEO.

Teks dimulai:

Untuk memahami hubungan antara standar web dan SEO, Anda harus terlebih dahulu memahami apa itu "standar web". Saya rasa Anda sudah memeriksa banyak dokumen penjelasan di Internet, tetapi Anda masih merasa sedikit bingung dan tidak mau untuk belajar dari Internet. Saya akan menyalin satu paragraf untuk Anda, tetapi pada akhirnya saya masih belum dapat memahaminya. Untuk memahami standar web, Anda harus mulai dengan membangun halaman web dasar:

Misal: Jika saya ingin menulis halaman web yang paling sederhana, saya harus menggunakan tag html. Contoh: jika saya ingin mempertegas teks, saya harus menggunakan tag <strong> harus menambahkan tag <font color="color">, saya ingin memulai paragraf baru, jadi saya harus menggunakan tag <>. Saya tidak bisa menggunakan tag <jacu> yang tidak ada artinya untuk menekankan teks, karena ada tidak ada tag seperti itu sama sekali, dan browser tidak dapat menguraikannya, jadi Asosiasi W3C (World Wide Web), sebuah organisasi) berdiri dan berkata kepada praktisi Internet di seluruh dunia: "Setiap orang memiliki pendapat, mari kita satukan label-label ini, yang mana dapat digunakan dan mana yang tidak dapat digunakan; dan kemudian setiap orang akan memberikan label-label ini penjelasan yang terpadu dan masuk akal, sehingga semua orang dapat memahami untuk apa label-label ini digunakan." Setelah diskusi yang tak terhitung jumlahnya. Hasilnya, standar HTML 1.0 akhirnya diperkenalkan. Setelah modifikasi dan pembaruan selanjutnya, lebih banyak standar web secara bertahap tersedia, seperti HTML 2.0. .html 4.01, xmhtml1.0/1.1 yang paling umum digunakan di halaman web semua orang, dan standar xmhtml 2.0 yang belum dirilis secara resmi. Pembaruan standar semuanya kompatibel ke depan dari halaman web Kalimat seperti itu:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" " http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">

Ini sebenarnya mendefinisikan model dokumen Anda, yang dijelaskan menggunakan standar xhtml 1.0.

Namun kemudian, tata letak halaman web menjadi semakin kompleks. Tidak mungkin membuat halaman yang indah dan indah hanya dengan mengandalkan tag HTML ini gambar sebesar 20px, atau saya ingin memberi spasi pada teks 5px, sangat sulit dicapai hanya dengan mengandalkan HTML. Saat ini, W3C tidak bisa duduk diam lagi, jadi ia berdiri dan berseru: "Mari kita tentukan sesuatu yang lebih untuk mencapai fungsi ini." Setelah diskusi yang tak terhitung jumlahnya, standar CSS 1.0 dirilis. Dengan menggunakan ini, Anda dapat dengan mudah mencapai offset konten, spasi, dan efek lainnya. Setelah pengembangan, kami mendapatkan CSS 2.0 dan CSS 3.0. Setiap orang harus mengikuti standar ini ketika mendefinisikan gaya dengan CSS.

Belakangan, orang-orang menyadari bahwa hanya mengandalkan html dan CSS saja masih belum sempurna. Ia tidak memiliki interaksi antarmuka manusia-komputer dan tidak dapat mencapai efek dinamis. Akan lebih baik lagi jika kita bisa membuat segala sesuatunya di halaman web bergerak, jadi w3c memperkenalkan standar emascript, yang menetapkan antarmuka model objek dokumen. Tata bahasa dll. Misalnya, javascript yang umum digunakan sesuai dengan standar emascript.

Oke, sekarang semuanya tampak sempurna. Dengan standar html, standar css, dan standar emascript, kami akhirnya dapat membuat halaman web yang indah. Kami mengumpulkan standar-standar ini untuk membentuk standar web. Jadi, halaman web seperti apa yang sesuai dengan Standar web:

Misalnya sepotong html ditulis seperti ini

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" " http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
<html>
<kepala>
<judul>demo</judul>
</kepala>
<tubuh>
<p><font color="#ff0000">Konten teks</font><p>

<img src="x.jpg" />
<dl>
<dt><h1>Judul</h1></dt>
<dd>Konten</dd>
<dd>Konten</dd>
<dl>
<b>Konten</b>
</tubuh>

Jadi apakah kode ini sesuai dengan standar web? Mari kita analisis lagi kode-kode ini. Pada baris pertama, Anda menentukan bahwa jenis dokumen Anda adalah xhtml 1.0, yang berarti bahwa semua tag html Anda harus ditulis sesuai dengan standar ini badan Dalam tag <p>, tag font sudah tidak digunakan lagi dalam standar ini, dan atribut warna juga tidak digunakan lagi dalam tag ini, jadi paragraf ini tidak sesuai dengan standar web tag lagi. Atribut align mendefinisikan perataan gambar, tetapi atribut alt tidak ada. Dalam standar xhtml 1.0, img harus mendefinisikan atribut alt. Jadi kode ini tidak sesuai dengan standar 1.0 , dt mendefinisikan judul, Tag <h1> bersarang, seperti yang didefinisikan oleh xhtml 1.0. Tag <h1> tidak diperbolehkan bersarang di tag <dt>, jadi juga tidak memenuhi standar 1.0. Lihat tag <b> terakhir, alhamdulillah. Tag ini akhirnya memenuhi standar web. Tapi w3c telah mengatakannya. Kami akan mempertahankan arti label ini untuk saat ini. Namun, tetap disarankan agar Anda menggunakan tag <strong> yang lebih semantik. Pada standar baru nanti, kita mungkin membatalkan tag <b> sebagai tag standar. Mengenai batasan standar HTML, silakan periksa dokumen terkait.

Omong-omong. Saya pikir semua orang mengerti. Halaman ini bahkan tidak memenuhi standar xmhtml 1.0, jadi jelas tidak memenuhi standar web. Mengenai apakah sesuai dengan standar web, semuanya tergantung pada versi yang Anda tentukan browser, karena kami telah menyebutkan di atas Seperti yang saya katakan, semua standar kompatibel, tetapi standar tersebut tidak sesuai dengan standar yang Anda tetapkan sekarang. Jadi bagaimana cara membuat kode ini sesuai dengan standar web saya? Hanya ada dua cara. 1. Turunkan standar model dokumen Anda (ini mungkin menyebabkan lebih banyak masalah) 2. Ubah kembali kode Anda, seperti memasukkan warna pada atribut style, atribut img plus alt jenis.

Ada penjelasannya di Internet: standar web = div + css.Layout tabel tidak bisa digunakan. Setelah membaca artikel di atas, tidak sulit bagi kita untuk memahaminya. Konsep ini benar-benar membingungkan dan menggeneralisasi secara berlebihan. Tidak dapat dikatakan bahwa halaman web dengan tata letak tabel tidak memenuhi standar web. Tag <table> selalu menjadi tag standar di semua versi. Meskipun kita semua menggunakan div untuk tata letak, kita perlu memahami: praktik yang direkomendasikan oleh orang lain tidak sama dengan standar.

Seperti disebutkan sebelumnya, standar web bergantung pada versi yang kita tentukan saat menulis html/css/js. Misalnya, jika html saya menggunakan standar xhtml 1.0, maka html saya juga harus mematuhi standar xhtml 1.0. Namun tampaknya tidak demikian. Hampir 99,999% halaman web di Internet tidak dapat lolos verifikasi .org bisa lolos verifikasi. Ya, teman-teman yang tertarik bisa mengujinya. Pada titik ini, artikel kami sepertinya menemui jalan buntu. Karena begitu banyak halaman web yang tidak memenuhi standar web, mereka juga dapat mencapai peringkat dan lalu lintas yang baik standar web Apa hubungannya dengan SEO? Kita harus mulai dengan struktur html dan parsing.

Desain web menekankan pemisahan struktur (html) dan presentasi (css). Kita dapat memahami konsepnya dengan cara ini. Strukturnya adalah sebuah rumah. Merupakan rak yang terbuat dari beton bertulang dan batu bata, dan kinerjanya adalah dekorasi dan modifikasi struktur seperti dekorasi, pemasangan lantai dan plesteran serta pengecatan dinding rumah. Tanpa struktur, kinerja tidak memiliki nilai kinerja sebenarnya, itulah sebabnya <font color="#ccc" size="12">teks</font> atau tag atau properti tersebut, karena untuk struktur, ini lebih seperti kinerja, itu harus tetap di lapisan presentasi, yaitu CSS. Jika kita menerapkan tag font pada halaman ketat xhtml 1.0, sebenarnya itu juga dapat diurai dengan benar, karena seperti yang kami katakan di artikel pertama, standarnya kompatibel ke depan. .

Mari kita pahami bagaimana browser dan mesin pencari mengurai html kita. Mengapa kita berbicara tentang browser di sini? Karena menurut saya, mesin pencari dan browser menggunakan metode yang kurang lebih sama saat mengurai html. Saat meng-crawl halaman web, penguraian HTML dimulai. yang pada akhirnya akan mengurai seluruh laman menjadi pohon DOM dengan simpul hubungan induk-anak yang ketat. Dan kemudian menyajikannya kepada pengguna, misalnya ketika saya menulis kode berikut:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" " http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd ">
<html xmlns=" http://www.w3.org/1999/xhtml ">
<kepala>
<judul>judul</judul>
</kepala>
<tubuh>
<div id="atas">
<h1>Inilah judulnya<h1>
<img src="xx.jpg"/>
<p>Ini adalah <strong>teks</strong><p>
</div>
<div id="wadah">
<h2>Ini adalah judul lain</h2>
<p>Ini adalah <strong>teks</strong></p> yang lain
</div>
</tubuh>
</html>

Anda dapat melihat bahwa ini adalah bagian html di bawah standar transisi xhtml 1.0. Ada banyak kesalahan (kesalahan termasuk: tag <h1> di div pertama tidak memiliki tag penutup. img tidak memiliki atribut alt. Tag <p> juga tidak memiliki tag penutup). Namun jika Anda meletakkan kode ini di browser dan menjalankannya, Anda dapat melihat efek yang benar. Tag P juga berfungsi, dan gambarnya dapat ditampilkan. Kami sangat terkejut mengapa kode ini bahkan tidak memiliki tag yang benar, tetapi mengapa kode ini dapat diurai dengan benar di browser sudah benar. Struktur dom harus seperti yang ditunjukkan di bawah ini (Gambar 1)

Unggah dan unduh lampiran (16,49 KB) pada pukul 16:58 kemarin lusa
Mengapa browser dapat mengurai kode yang salah dengan benar? Dan sepertinya bisa "menebak" maksud sebenarnya dari kode kesalahan tersebut. Prinsipnya adalah browser menggunakan mode analisis kamus dan mode pemeriksaan (html rapi) saat membuat pohon tag. Sederhananya, browser akan mencocokkan semua tag dan atribut dengan informasi yang ada di kamus bawaan. Jika kecocokannya normal, maka akan langsung diurai. Aktifkan saja mode finishing. Mode finishing akan menganalisis kode Anda yang salah dan memperbaikinya. Misalnya, tag <h1> dan <p> di akhir di atas akan otomatis diubah menjadi tag penutup, atau jika Anda menulis a. pasangan tag <jiacu> teks</ jiacu>. Hal ini tidak dapat ditandingi sama sekali dan tidak dapat diperbaiki. Ini akan langsung menghapus pasangan tag yang tidak valid, hanya menyisakan teks di dalamnya. Tentu saja, ketika menelusuri HTML ke dalam pohon DOM, itu tidak akan mengubah kode sumber HTML Anda. Ini hanya tindakan penguraian. Oleh karena itu, sering kali jika kami tidak memverifikasi kesalahan HTML di halaman kami, kami tidak akan menemukan kesalahan ini .Karena browser telah memperbaikinya secara otomatis untuk kita. Secara umum, browser memastikan kompatibilitas penuh dengan kesalahan dalam HTML. Perbaiki jika itu dapat membantu Anda. Jika tag atau atribut yang berlebihan dapat dihapus, tag atau atribut tersebut akan dihapus. Jika tidak dapat dihapus dan diperbaiki, tag akan dihapus secara otomatis untuk memastikan tampilan normal.

Namun, "mode pengorganisasian" tidak mahakuasa. Kita tidak dapat mengharapkan browser untuk membantu kita memperbaiki semua kesalahan, sering kali ketika halaman kita disarangkan semakin dalam, dengan semakin banyak tag dan semakin banyak konten, Terkadang, ketika browser tidak dapat memperbaiki tag, satu-satunya hal yang dapat dilakukan adalah "menghapus semua tag dalam blok kesalahan dan hanya menyimpan kontennya."

Dari sudut pandang mesin pencari, sebelum menganalisis konten, premisnya sama dengan browser, yang memerlukan pembuatan pohon DOM yang lengkap. Hanya ketika pohon ini selesai, mesin pencari juga dapat menentukan hubungan konteks di halaman Tag berbobot (seperti <strong>, <h1>) mana yang digunakan di laman, serta posisi distribusinya, dll. Namun, mesin pencari lebih menekankan konsep "blok konten" saat parsing, yaitu satu tag per blok. Masih contoh html di atas. Saat mesin pencari membuat pohon DOM ini, ketika mengurai tag <h1> di div pertama, ditemukan ada kesalahan. Saat mengurai tag P, terjadi kesalahan lain buat pohon DOM ini dengan benar, ini akan mengaktifkan mode penyelesaian, tetapi mode saat ini mungkin tidak membantu Anda memperbaiki kesalahan, tetapi dalam "blok". Cari blok superior (node) dari blok error (node) (jika masih ada error di level atas, lanjutkan mencari level atas). -blok dan sub-blok di blok tingkat atas ini akan dicari. Semua tag yang salah di sub-blok akan dihapus, artinya, semua tag yang salah dalam <div id="top"> akan dihapus pohon yang dibangun seperti terlihat pada Gambar 2 di atas (revisi 2011.4.5: Ada kesalahan kecil pada Gambar 2. Ada tag img di bawah tag div sebelah kiri).

Dengan cara ini, kita melihat bahwa tag <h1> dan <strong> yang kita tulis dengan hati-hati telah hilang setelah penguraian, dan "bobot" seluruh blok telah bergeser. Menurut prinsip penguraian HTML, kita dapat dengan mudah menariknya kesimpulan:

1. Ketika level node halaman menjadi semakin banyak, kita harus sangat berhati-hati terhadap kesalahan level label. Semakin dekat ke node teratas, kita harus semakin berhati-hati. Misalnya, kita harus menulis lebih sedikit tag akhir fatal bagi SEO.

2. Apapun tata letak yang Anda gunakan, semakin sedikit tingkat sarang node, semakin baik. Pertama, dapat mengurangi beban mesin pencari saat mengurai node. Kedua, lebih mudah bagi mesin pencari untuk menentukan hubungan (konteks) antar node , Bobot kata kunci itu penting.

3. Bila atribut label sudah bisa diganti dengan css, pindahkan ke css sebanyak mungkin.

4. Baik browser maupun mesin pencari mengizinkan kesalahan html, tetapi html standar jelas lebih mudah untuk mendapatkan peringkat yang lebih baik dalam kondisi eksternal yang sama.

Saya membutuhkan waktu hampir empat jam untuk menulis artikel ini. Beberapa bagian tidak terlalu menyeluruh. Saya akan membagikannya di artikel ketiga.

Sumber artikel: Lightyear Forum (harap sebutkan tautan sumber dan penulisnya saat mencetak ulang)

Penulis artikel: newyhj