Ich habe letzte Woche einen Artikel geschrieben, um Ihre Website mit Sinas Nachrichtendaten zu synchronisieren. Daher habe ich beschlossen, das darin erwähnte Pseudo-Originalsystem mit Ihnen zu teilen und das Prinzip seiner Implementierung vorzustellen in meiner Sisyphos-Werkstatt.
Schließlich ist eine Suchmaschine immer noch eine Maschine, die den Zweck der Pseudo-Originalität erreichen kann, indem sie den Titel ändert, einige Wörter ersetzt, einige Kapitel einfügt Das Internet erfordert jedoch immer noch eine manuelle Generierung, daher möchte ich ein vollautomatisches, unbeaufsichtigtes automatisches Pseudo-Originalsystem erstellen. In Kombination mit dem automatischen Erfassungsprogramm kann der Prozess der Erfassung -> Lagerung -> Pseudo-Original realisiert werden , und der gesamte Prozess kann von niemandem verwaltet werden und hat Sex in Echtzeit.
Eine bessere Möglichkeit, Wörter zu ändern, ohne die Semantik des Artikels zu beeinträchtigen, besteht darin, sie durch Synonyme zu ersetzen. Nachdem ich erfolglos nach einer solchen Datenbank gesucht hatte, dachte ich, der erste Schritt sei der Aufbau eines Thesaurus. Nach dem Sammeln habe ich beschlossen, dass Kingsoft PowerWord meine Anforderungen sehr gut erfüllen kann. Durch die Sammlung habe ich eine Vokabelbibliothek mit Zehntausenden von Daten erstellt.
Dann werden die Schlüsselwörter ersetzt. Wie und welche werden ersetzt? Meine Idee ist, den Artikel zunächst in mehrere Phrasen zu unterteilen und dann im Thesaurus nach Wörtern zu suchen, die länger als zwei chinesische Zeichen sind Ja, dann verwende ich Python, um diesen Prozess zu implementieren. Um die Synonyme zu beschleunigen, können Sie außerdem Schlüsselwertspeicher verwenden. Einige Schlüsselcodes lauten wie folgt:
def getnewword(text, list):
cxn. execute("wähle die ID aus tool_words aus, wobei name='%s' limit 1"%text)
result=cxn. fetchone()
wenn Typ(Ergebnis) nicht NoneType ist:
cxn. execute("wählen Sie den Namen aus tool_wordslike where wid=%d order by rand() limit 1"%result[0])
result4=cxn. fetchone()
wenn type(result4) nicht NoneType ist:
list[text]=result4[0]
def cuttest(text, flag):
list={}
wlist = seg. ausschneiden(Text)
wlist. umkehren()
result=""
für tmp in wlist:
iflen(tmp)>1:
wenn Flag==1:
getnewword(tmp,list)
wenn Flag==1:
result=""
für k in der Liste. iterkeys():
result+=k+","+list[k]+";"
anders:
result+=tmp+";";
Ergebnis zurückgeben
Aber schließlich ist das Pseudo-Originalsystem auch ein Programm. Es ist sicherlich unmöglich, die Unangemessenheit der Semantik und die Glätte der Sätze zu garantieren. Haha, ich erinnere mich an diesen einen Artikel Auf meiner Website war es ziemlich lustig, dass der russische Akademiker Ginzburg, der Nobelpreisträger für Physik, starb sprachlos. Neben dem Ersetzen von Synonymen gibt es natürlich auch die Umkehrung von Absätzen, das Einfügen von Links usw. Diese sind relativ einfach zu implementieren, daher werde ich nicht näher auf die Implementierungssituation eingehen Ich habe auch über einige Methoden nachgedacht, um die Anzeige in Suchmaschinen zu erreichen, um den Benutzern vorpseudo-originale Inhalte bereitzustellen. Ich weiß jedoch nicht, wie gefährlich dies ist Dies ist und ob es von Baidu manuell erkannt wird.
Seitdem kam Baidu Spider nach all dem Ärger auf Ihre Seite und war schockiert: Ups, ich habe den Inhalt dieses Artikels noch nie gesehen, ich habe ihn akzeptiert!