لقد كتبت مقالًا الأسبوع الماضي للحفاظ على مزامنة موقع الويب الخاص بك مع بيانات أخبار سينا. أصبح بعض مستخدمي الإنترنت مهتمين، لذلك قررت أن أشارككم النظام الأصلي الزائف المذكور فيه وأقدم مبدأ تنفيذه، وقد تمت تغطية هذا النظام أيضًا في ورشة سيزيف الخاصة بي.
بعد كل شيء، لا يزال محرك البحث مجرد آلة. من خلال تغيير العنوان، واستبدال بعض الكلمات، وخلط بعض الفصول، وإدراج بعض الروابط، وما إلى ذلك، يمكنه تحقيق غرض الأصالة الزائفة. توجد حاليًا أدوات أصلية زائفة مماثلة الإنترنت، لكنها لا تزال تتطلب التشغيل اليدوي، لذلك أريد إنشاء نظام أصلي زائف تلقائي بالكامل وغير خاضع للرقابة، بالاشتراك مع برنامج التجميع التلقائي، يمكن تحقيق عملية التجميع->التخزين->الأصلي الزائف. ، ولا يمكن لأحد أن يدير العملية برمتها ويمارس الجنس في الوقت الفعلي.
وبالقرب من المنزل، فإن الطريقة الأفضل لتغيير الكلمات دون التأثير على دلالات المقالة هي استخدام المرادفات لاستبدالها، لذلك اعتقدت أن الخطوة الأولى هي بناء قاموس المرادفات بعد البحث عن قاعدة البيانات هذه على الإنترنت دون جدوى. قررت العثور على موقع ويب ذي صلة، وبعد التجميع، وجدت أن Kingsoft PowerWord يمكنه تلبية متطلباتي جيدًا. ومن خلال المجموعة، قمت بإنشاء مكتبة مفردات تحتوي على عشرات الآلاف من أجزاء البيانات.
ثم يتم استبدال الكلمات الرئيسية، فكيف يتم استبدالها وأي منها يجب استبدالها؟ فكرتي هي تقسيم المقالة أولاً إلى عدة عبارات، ثم البحث عن الكلمات التي يزيد طولها عن حرفين صينيين في المعجم نعم، ثم استبدله، أستخدم لغة بايثون لتنفيذ هذه العملية. بالإضافة إلى ذلك، من أجل تسريع المرادفات، يمكنك استخدام تخزين القيمة الرئيسية. بعض الرموز الرئيسية هي كما يلي:
بالتأكيد getnewword(نص، قائمة):
com.cxn. تنفيذ ("حدد المعرف من tool_words حيث الاسم = حد '%s' 1"%text)
result=cxn. جلب ()
إذا كان النوع (النتيجة) ليس بلا نوع:
com.cxn. تنفيذ ("حدد اسمًا من tool_wordslike حيث wid =٪ d ترتيب حسب حد rand () 1"٪result[0])
result4=cxn. جلب ()
إذا كان النوع (result4) ليس بلا نوع:
قائمة[نص]=نتيجة4[0]
مواطنه Cuttest (النص، العلم):
القائمة = {}
wlist = سيج. قطع (نص)
wlist. يعكس()
النتيجة = ""
لـ tmp في wlist:
إيفلين(تمب)>1:
إذا العلم ==1:
الحصول على كلمة جديدة (تمب، قائمة)
إذا العلم ==1:
النتيجة = ""
ل k في القائمة. مفاتيح متكررة ():
result+=k+","+list[k]+";"
آخر:
result+=tmp+";";
نتيجة العودة
ولكن بعد كل شيء، فإن النظام الأصلي الزائف هو أيضًا برنامج، ومن المؤكد أنه من المستحيل ضمان عدم ملاءمة الدلالات وسلاسة الجمل، ويتم توفيره بشكل أساسي لهؤلاء الخبراء الذين هم مقالب القمامة على موقع الويب الخاص بي كان مضحكا للغاية بعد التحويل http://www.xxfsw.com/show24047.html ، توفي الأكاديمي الروسي جينزبرج، الحائز على جائزة نوبل في الفيزياء، ونتيجة لذلك، تحولت وفاته إلى موت عاجز عن الكلام. بالطبع، بالإضافة إلى استبدال المرادفات، هناك أيضًا عكس الفقرات وإدراج الروابط وما إلى ذلك. وهي سهلة التنفيذ نسبيًا، لذلك لن أخوض في التفاصيل لاحقًا ، فكرت أيضًا في بعض الطرق لتحقيق العرض لمحركات البحث. سيؤدي استخدام المحتوى الأصلي الزائف إلى تزويد المستخدمين بمحتوى أصلي زائف، وهذا يحقق الهدف دون التأثير على تجربة المستخدم هذا وما إذا كان سيتم اكتشافه يدويًا بواسطة Baidu.
ومنذ ذلك الحين، وبعد كل هذه المشاكل، جاء موقع Baidu Spider إلى موقعك وكان مصدومًا: عفوًا، لم أطلع على محتوى هذه المقالة من قبل، لقد قبلتها!