Saya telah mengerjakan situs web dan promosi produk akhir-akhir ini, dan ada banyak hal yang saya tidak mengerti, tetapi di antara hal-hal yang saya promosikan, banyak kata benda yang sangat menarik bagi saya. Yang pertama adalah SEO, dalam proses memahami SEO, saya menemukan "tautan eksternal". Saat saya belajar tentang tautan eksternal, saya menemukan "spider crawling". Saya menerima begitu banyak informasi sekaligus tidak sederhana.
Dan hari ini saya ingin berbicara dengan Anda tentang kata "laba-laba merayap". Saya yakin saya bukan orang pertama yang menyebutkannya, karena saya terlambat, tetapi saya berharap uraian saya dapat membantu lebih banyak orang memahami kata ini. Lagi pula, banyak perkenalan profesional yang cukup profesional, dan karena terlalu profesional, Rasanya tidak bisa dimengerti.
Pertama, mari perkenalkan penyertaan Baidu. Ada banyak sekali situs web di dunia online, dan situs web tersebut berisi halaman web yang tak terhitung jumlahnya, sama seperti kita, dengan populasi lebih dari 6 miliar jiwa. Ya, beberapa orang sangat berpengaruh di dunia, seperti Jackie Chan, Bruce Lee, Michael Jackson, dll., tetapi orang tak dikenal seperti kita begitu rendah hati. Mereka yang telah memberikan kontribusi besar kepada dunia dengan sendirinya akan menjadi terkenal, jadi dengan kata lain, mereka yang "berkontribusi" di Internet akan dimasukkan oleh Baidu. Jika Prestise disertakan berarti Anda dapat muncul di berita utama pencarian Baidu, dan berita utama selalu menarik banyak perhatian. Justru karena semua orang ingin bersaing untuk posisi inilah lahirlah SEO (optimasi mesin pencari).
Kemudian konten yang dikumpulkan dimasukkan ke dalam perpustakaan secara tertib, dan perpustakaan ini memiliki nama baik "database" di dunia online. Adapun prinsip database, saya tidak akan menjelaskan secara detail memahami Ini adalah sesuatu yang menyimpan atau mencatat data dalam format tertentu. "Spider Crawl" menggunakan hal ini. Izinkan saya memberi tahu Anda tentang "laba-laba" lagi. Tentu saja ini bukan laba-laba yang kita lihat setiap hari. Sederhananya, ini adalah program komputer tidak bisa hanya dipahami sebagai proses aritmatika sehari-hari. Artinya setara dengan proses perencanaan suatu acara). Baru-baru ini, tampaknya Baidu telah mengubah algoritma pencariannya, tetapi biarkan semua orang perlahan-lahan memahami cara mengubahnya.
"Perayapan laba-laba" sedikit lebih kiasan. Ada perayapan vertikal dan perayapan horizontal, yang merupakan penjelajahan mendalam dan penjelajahan luas dalam istilah komputer kita. Konten yang dilintasi adalah situs web atau halaman web besar dan kecil. Setelah melintasi, laba-laba secara aktif mengunduh halaman web dan kemudian mendownloadnya. Halaman web yang dikembalikan dihitung melalui berbagai program sebelum ditempatkan di area pencarian. Baru kemudian akan terbentuk peringkat yang stabil, kemudian akan dimasukkan ke dalam database Baidu dan akhirnya ditampilkan di halaman web Baidu. Dan di sini, Baidu mengirim tidak hanya satu "laba-laba", tetapi beberapa, mungkin sepuluh, atau ratusan, ribuan, atau bahkan puluhan ribu, atau ratusan ribu. Singkatnya, pasti ada banyak, dan mengirimkan laba-laba Ini dia istilah komputer: thread. Jelas sekali, banyak laba-laba adalah banyak utas, dan hanya ketika beberapa utas melakukan pencarian, efisiensinya akan tinggi. Ketika beberapa "laba-laba" melakukan pencarian bersama-sama, itu adalah pencarian yang luas. Ketika satu "laba-laba" mengikuti aturan tertentu, itu adalah pencarian yang mendalam. Pencarian untuk halaman web adalah yang pertama dalam hal kedalaman dan terlebih dahulu luasnya. Ketika laba-laba Baidu merayapi halaman tersebut, ia merayapi dari situs awal (yaitu, situs awal mengacu pada beberapa situs portal) dengan penjelajahan yang lebih luas terlebih dahulu untuk merayapi lebih banyak URL, dan kedalaman. perayapan pertama. Tujuannya adalah untuk merayapi halaman web berkualitas tinggi. Strategi ini dihitung dan dialokasikan berdasarkan penjadwalan. Baidu Spider hanya bertanggung jawab untuk perayapan. Prioritas bobot mengacu pada prioritas perayapan halaman dengan lebih banyak koneksi terbalik Strategi penjadwalan, secara umum, 40% adalah kisaran normal untuk perayapan web, 60% dianggap baik, dan 100% tidak mungkin. Dalam proses pembelajaran, saya menemukan sebuah artikel yang memperkenalkan keamanan perayapan laba-laba, yang memperkenalkan bahwa laba-laba umumnya lebih suka melintasi situs web tersebut dan secara otomatis akan menghindari kerentanan jaringan agar tidak terjerumus ke dalamnya ingat pendahuluan dalam artikel ini: jelajahi situs web statis terlebih dahulu, karena mungkin ada loop tak terbatas di situs web dinamis, sehingga laba-laba tidak dapat keluar setelah masuk. Namun, proses pencarian laba-laba secara umum akan memeriksa keamanan situs web terlebih dahulu dan menemukannya tindakan destruktif dapat dihindari. Menurut saya hal ini layak untuk dipertimbangkan. Dalam proses membangun website dinamis, Anda harus ketat dengan kode program Anda untuk menghindari kerentanan website. Pada akhirnya, tidak ada laba-laba yang berani masuk.
Sekian perkenalan hari ini, masih banyak kekurangannya, semoga dapat dikoreksi! Silakan bawa cetakan ulangnya ke: Asia Ceramics Mall: www.asiachinachina.com
(Penanggung jawab redaksi: momo) Ruang pribadi penulis Asia Ceramics Mall