ฉันเขียนบทความเมื่อสัปดาห์ที่แล้วเพื่อให้เว็บไซต์ของคุณซิงโครไนซ์กับข้อมูลข่าวของ Sina ชาวเน็ตบางคนเริ่มสนใจ ดังนั้นฉันจึงตัดสินใจแบ่งปันระบบหลอกดั้งเดิมที่กล่าวถึงกับคุณ และแนะนำหลักการของการนำไปปฏิบัติ ซึ่งครอบคลุมถึงระบบนี้ด้วย ในเวิร์คช็อป Sisyphus ของฉัน
ท้ายที่สุดแล้วเครื่องมือค้นหายังคงเป็นเครื่องจักร โดยการเปลี่ยนชื่อ แทนที่คำบางคำ สับเปลี่ยนบางบท แทรกลิงก์บางส่วน ฯลฯ ก็สามารถบรรลุวัตถุประสงค์ของความคิดริเริ่มหลอกได้ ปัจจุบันมีเครื่องมือหลอกดั้งเดิมที่คล้ายกันอยู่ แต่ยังคงต้องมีการดำเนินการด้วยตนเอง สร้าง ดังนั้นฉันต้องการสร้างระบบหลอกอัตโนมัติแบบอัตโนมัติโดยไม่ได้รับการดูแล เมื่อรวมกับโปรแกรมรวบรวมอัตโนมัติ กระบวนการรวบรวม -> คลังสินค้า -> หลอกต้นฉบับสามารถเกิดขึ้นได้ และไม่มีใครสามารถจัดการกระบวนการทั้งหมดได้และมีเซ็กส์แบบเรียลไทม์
ใกล้บ้านมากขึ้น วิธีที่ดีกว่าในการเปลี่ยนคำโดยไม่กระทบต่อความหมายของบทความคือการใช้คำพ้องความหมายเพื่อแทนที่คำเหล่านั้น ดังนั้น ฉันคิดว่าขั้นตอนแรกคือการสร้างอรรถาภิธานหลังจากค้นหาฐานข้อมูลดังกล่าวบนอินเทอร์เน็ตแล้วก็ไม่มีประโยชน์ ฉันตัดสินใจค้นหาเว็บไซต์ที่เกี่ยวข้อง หลังจากรวบรวม ฉันพบว่า Kingsoft PowerWord สามารถตอบสนองความต้องการของฉันได้เป็นอย่างดี
จากนั้นคำสำคัญจะถูกแทนที่ แล้วจะแทนที่ได้อย่างไรและควรแทนที่คำใด ความคิดของฉันคือแบ่งกลุ่มบทความออกเป็นหลายวลีก่อนแล้วจึงค้นหาคำที่มีความยาวมากกว่าตัวอักษรจีนสองตัวในพจนานุกรม ใช่แล้วแทนที่มัน ฉันใช้ python เพื่อใช้กระบวนการนี้ นอกจากนี้ เพื่อเร่งความเร็วคำพ้องความหมาย คุณสามารถใช้ที่เก็บข้อมูลคีย์-ค่าได้ รหัสคีย์บางส่วนมีดังนี้:
def getnewword (ข้อความ รายการ):
cxn. ดำเนินการ ("เลือก id จาก tool_words โดยที่ name='%s' จำกัด 1"%text)
ผลลัพธ์=cxn. ดึงข้อมูล()
ถ้าประเภท (ผลลัพธ์) ไม่ใช่ NoneType:
cxn. ดำเนินการ ("เลือกชื่อจาก tool_wordslike โดยที่ wid=%d เรียงลำดับตาม rand() จำกัด 1"%result[0])
result4=cxn. ดึงข้อมูล()
ถ้า type(result4) ไม่ใช่ NoneType:
รายการ[ข้อความ]=ผลลัพธ์4[0]
def cuttest (ข้อความ ธง):
รายการ={}
wlist = seg. ตัด(ข้อความ)
รายการ ย้อนกลับ()
ผลลัพธ์ = ""
สำหรับ tmp ใน wlist:
ถ้าเลน(tmp)>1:
ถ้าแฟล็ก==1:
รับคำใหม่ (tmp รายการ)
ถ้าแฟล็ก==1:
ผลลัพธ์ = ""
สำหรับ k ในรายการ iterkeys():
ผลลัพธ์+=k+","+รายการ[k]+";"
อื่น:
ผลลัพธ์+=tmp+";";
ส่งคืนผลลัพธ์
แต่ท้ายที่สุดแล้วระบบหลอกดั้งเดิมก็เป็นโปรแกรมเช่นกัน เป็นไปไม่ได้เลยที่จะรับประกันความไม่เหมาะสมของความหมายและความราบรื่นของประโยคเป็นหลัก บนเว็บไซต์ของฉันค่อนข้างตลกหลังจากการกลับใจใหม่ http://www.xxfsw.com/show24047.html นักวิชาการชาวรัสเซีย Ginzburg ผู้ได้รับรางวัลโนเบลสาขาฟิสิกส์ถึงแก่กรรม พูดไม่ออก แน่นอนว่านอกเหนือจากการแทนที่คำพ้องความหมายแล้ว ยังมีการกลับคำ การแทรกลิงก์ ฯลฯ สิ่งเหล่านี้ค่อนข้างใช้งานง่าย ดังนั้นฉันจะไม่ลงรายละเอียดให้ทุกคนเลือกตามสถานการณ์การใช้งานในภายหลัง ฉันยังคิดถึงวิธีการบางอย่างในการทำให้เครื่องมือค้นหาแสดงผลได้สำเร็จ การใช้เนื้อหาหลอกจะทำให้ผู้ใช้ได้รับเนื้อหาที่เป็นต้นฉบับหลอก ซึ่งบรรลุเป้าหมายโดยไม่กระทบต่อประสบการณ์ของผู้ใช้ นี่คือสิ่งที่ Baidu ตรวจพบด้วยตนเองหรือไม่
หลังจากเกิดปัญหาทั้งหมดนี้ Baidu Spider ก็มาที่เว็บไซต์ของคุณและต้องตกใจ: อ๊ะ ฉันไม่เคยเห็นเนื้อหาของบทความนี้มาก่อน ฉันยอมรับแล้ว