1. คว้า
การรวบรวมข้อมูลเป็นกระบวนการที่ Googlebot ค้นพบหน้าเว็บใหม่และอัปเดตเพื่อเพิ่มหน้าเว็บลงในดัชนีของ Google
เราใช้คอมพิวเตอร์หลายเครื่องเพื่อดึงข้อมูล (หรือ "รวบรวมข้อมูล") หน้าเว็บจำนวนมากบนเว็บไซต์ของเรา โปรแกรมที่ดำเนินการรับข้อมูลเรียกว่า Googlebot (หรือที่เรียกว่าหุ่นยนต์หรือซอฟต์แวร์รวบรวมข้อมูล) Googlebot ใช้อัลกอริทึมในการรวบรวมข้อมูล: โปรแกรมคอมพิวเตอร์จะกำหนดเว็บไซต์ที่จะรวบรวมข้อมูล ความถี่ และจำนวนหน้าเว็บที่จะดึงข้อมูลจากแต่ละไซต์
ขั้นตอนการรวบรวมข้อมูลของ Google ขึ้นอยู่กับรายการ URL ของหน้าเว็บ ซึ่งสร้างขึ้นในระหว่างขั้นตอนการรวบรวมข้อมูลครั้งก่อน และได้รับการขยายอย่างต่อเนื่องด้วยข้อมูล Sitemap ที่ผู้ดูแลเว็บให้มา ขณะที่ Googlebot เข้าชมเว็บไซต์แต่ละแห่ง Googlebot จะตรวจจับลิงก์ในแต่ละหน้าและเพิ่มลงในรายการหน้าที่จะรวบรวมข้อมูล ไซต์ใหม่ การเปลี่ยนแปลงไซต์ที่มีอยู่ และลิงก์ที่ใช้งานไม่ได้จะถูกบันทึกและใช้เพื่ออัปเดตดัชนีของ Google
Google ไม่อนุญาตให้มีการชำระเงินสำหรับการรวบรวมข้อมูลไซต์ของคุณบ่อยขึ้น เราแยกความแตกต่างระหว่างธุรกิจการค้นหาและบริการ AdWords ที่แสวงหาผลกำไร
2. การจัดทำดัชนี
Googlebot ประมวลผลหน้าเว็บแต่ละหน้าที่รวบรวมข้อมูลเพื่อรวบรวมคำทั้งหมดที่พบและตำแหน่งของคำเหล่านั้นในแต่ละหน้าเป็นรายการที่มีการจัดทำดัชนีขนาดใหญ่ นอกจากนี้ เรายังประมวลผลข้อมูลในแท็กเนื้อหาและคุณลักษณะที่สำคัญ เช่น แท็ก TITLE หรือแอตทริบิวต์ ALT Googlebot สามารถจัดการเนื้อหาได้หลายประเภท แต่ไม่ใช่ทั้งหมด ตัวอย่างเช่น เราไม่สามารถประมวลผลเนื้อหาของไฟล์สื่อสมบูรณ์หรือหน้าเว็บไดนามิกบางไฟล์ได้
3. ให้ผลลัพธ์
เมื่อผู้ใช้ป้อนข้อความค้นหา คอมพิวเตอร์ของเราจะค้นหาดัชนีของเราสำหรับหน้าที่ตรงกัน และส่งคืนผลลัพธ์ที่เราเชื่อว่าเกี่ยวข้องกับการค้นหาของผู้ใช้มากที่สุด ความเกี่ยวข้องถูกกำหนดโดยปัจจัยมากกว่า 200 รายการ หนึ่งในนั้นคือ PageRank ของหน้าเว็บที่กำหนด PageRank คือการวัดความสำคัญของหน้าเว็บต่อลิงก์ขาเข้าจากหน้าอื่นๆ พูดง่ายๆ ก็คือ ลิงก์แต่ละรายการจากไซต์อื่นที่ชี้ไปยังหน้าต่างๆ ในไซต์ของคุณประกอบกันเป็น PageRank ของไซต์ของคุณ ลิงก์บางลิงก์ไม่ได้มีคุณค่าเท่ากัน: Google มุ่งมั่นที่จะปรับปรุงประสบการณ์ผู้ใช้อย่างต่อเนื่องโดยการแจ้งสแปมลิงก์และพฤติกรรมอื่นๆ ที่อาจส่งผลเสียต่อผลการค้นหา ลิงก์ที่กำหนดตามคุณภาพของเนื้อหาที่คุณให้ไว้คือลิงก์ที่ดีที่สุด
เพื่อให้เว็บไซต์ของคุณมีอันดับที่ดีในหน้าผลการค้นหา สิ่งสำคัญคือต้องแน่ใจว่า Google รวบรวมข้อมูลและจัดทำดัชนีเว็บไซต์ของคุณอย่างถูกต้อง หลักเกณฑ์สำหรับผู้ดูแลเว็บของเราสรุปแนวทางปฏิบัติที่ดีที่สุดบางประการที่สามารถช่วยคุณหลีกเลี่ยงปัญหาทั่วไปและปรับปรุงการจัดอันดับเว็บไซต์ของคุณ
คุณลักษณะการค้นหาที่เกี่ยวข้อง คำแนะนำการสะกดคำ และคำแนะนำของ Google ได้รับการออกแบบมาเพื่อช่วยให้ผู้ใช้ประหยัดเวลาในการค้นหาโดยการแสดงคำที่เกี่ยวข้อง การสะกดผิดที่พบบ่อย และข้อความค้นหาทั่วไป เช่นเดียวกับผลการค้นหา google.com ของเรา คำหลักที่ใช้ในคุณลักษณะเหล่านี้ถูกสร้างขึ้นโดยอัตโนมัติโดยโปรแกรมรวบรวมข้อมูลเว็บและอัลกอริธึมการค้นหาของเรา เราจะแสดงคำแนะนำเหล่านี้เฉพาะเมื่อเราคิดว่าจะช่วยประหยัดเวลาของผู้ใช้ หากไซต์มีอันดับสูงกว่าสำหรับคำหลักบางคำ นั่นเป็นเพราะว่าเราได้พิจารณาตามอัลกอริทึมแล้วว่าเนื้อหานั้นเกี่ยวข้องกับข้อความค้นหาของผู้ใช้มากกว่า