Spider เป็นโปรแกรมที่มีประโยชน์มากบนอินเทอร์เน็ต เสิร์ชเอ็นจิ้นใช้โปรแกรม Spider เพื่อรวบรวมเว็บเพจลงในฐานข้อมูล บริษัทต่างๆ ใช้โปรแกรม Spider เพื่อติดตามเว็บไซต์ของคู่แข่งและติดตามการเปลี่ยนแปลง ใช้บนคอมพิวเตอร์ นักพัฒนาใช้โปรแกรมสไปเดอร์เพื่อสแกนเว็บของตนเองเพื่อตรวจสอบลิงก์ที่ไม่ถูกต้อง... โปรแกรมสไปเดอร์มีการใช้งานที่แตกต่างกันสำหรับผู้ใช้ที่แตกต่างกัน ดังนั้นโปรแกรมสไปเดอร์ทำงานอย่างไร
สไปเดอร์เป็นโปรแกรมกึ่งอัตโนมัติ เช่นเดียวกับสไปเดอร์จริงที่เดินทางบนเว็บ (ใยแมงมุม) โปรแกรมสไปเดอร์ก็เดินทางบนเว็บที่เชื่อมโยงด้วยเว็บในลักษณะเดียวกัน สาเหตุที่โปรแกรมสไปเดอร์เป็นแบบกึ่งอัตโนมัติก็คือมันจำเป็นต้องมีลิงค์เริ่มต้น (จุดเริ่มต้น) เสมอ แต่การดำเนินการในภายหลังนั้นจะถูกกำหนดด้วยตัวเอง โปรแกรมสไปเดอร์จะสแกนลิงค์ที่มีอยู่ในหน้าเริ่มต้น จากนั้นจึงเข้าถึงลิงค์เหล่านี้ เพื่อชี้ไปที่หน้าต่างๆ แล้ววิเคราะห์และติดตามลิงก์ที่อยู่ในหน้าเหล่านั้น ตามทฤษฎีแล้ว โปรแกรมสไปเดอร์จะเข้าชมทุกหน้าบนอินเทอร์เน็ตในที่สุด เพราะเกือบทุกหน้าบนอินเทอร์เน็ตมักถูกอ้างอิงโดยหน้าอื่นๆ ไม่มากก็น้อยเสมอ
บทความนี้จะแนะนำวิธีการใช้ภาษา C# เพื่อสร้างโปรแกรมสไปเดอร์ ซึ่งสามารถดาวน์โหลดเนื้อหาของเว็บไซต์ทั้งหมดไปยังไดเร็กทอรีที่ระบุได้ อินเทอร์เฟซที่รันอยู่ของโปรแกรมจะแสดงในรูปที่ 1 คุณสามารถสร้างโปรแกรมสไปเดอร์ของคุณเองได้อย่างง่ายดายโดยใช้คลาสหลักหลายคลาสที่ให้ไว้ในบทความนี้
สำหรับข้อมูลเพิ่มเติม โปรดอ่าน: http://info.codepub.com/2008/03/info-18319.html
ขยาย