Ob ein Wort oder eine Phrase zu einem Schlüsselwort in einem Artikel werden kann, hängt im Allgemeinen hauptsächlich von ihrer Fähigkeit ab, die zentrale Idee des Artikels widerzuspiegeln. Die Korrelation zwischen Schlüsselwörtern und Artikeln dient hauptsächlich dazu, zu veranschaulichen, wie gut ein ausgewähltes Wort oder eine ausgewählte Phrase die zentrale Idee oder das Thema des Artikels für einen bestimmten Artikel widerspiegeln kann. Die Extraktion von Schlüsselwörtern wird durch die Position des Wortes im Artikel, die Häufigkeit des Auftretens und die semantischen Eigenschaften des Wortes beeinflusst. Wie ermitteln Suchmaschinen also die Korrelation zwischen Schlüsselwörtern und Artikeln? Hier geht der Autor von einigen seiner eigenen Meinungen aus und hat einige Ideen, die genutzt werden sollten, um andere zu inspirieren und die Orientierung aller zu erhalten.
Ich persönlich bin der Meinung, dass Suchmaschinen Schlüsselwörter und die Art der Artikel anhand der folgenden Schritte analysieren sollten:
Erstens: Die Suchmaschine reinigt zunächst die zu analysierenden Webseiten.
Bei der Webseitenbereinigung werden vor allem eine große Anzahl nutzloser Werbung, Navigationsleisten und anderer Lärm von Webseitenvorlagen sowie bedeutungslose Inhalte wie JavaScript-Skripte, CSS-Tags und andere Inhalte auf der Webseite entfernt. Welchen Algorithmus die Suchmaschine verwendet, wissen wir nicht, aber meine persönliche Schätzung ist, dass sie die Webseiten in verschiedene Blöcke unterteilt, die Blöcke mit thematischen Inhalten bestimmt, indem sie die Wichtigkeit der Webseitenblöcke misst, und dann As extrahiert Der Inhalt dieses Blocks und die Frage, wie Suchmaschinen die Bedeutung der Webseitengeschwindigkeit bestimmen, sind ein anderes Thema.
Zweitens: Führen Sie eine Wortsegmentierungsverarbeitung für den extrahierten Inhalt durch
Persönlich denke ich, dass die Suchmaschine möglicherweise eine Art Algorithmus verwendet hat, um den Inhalt grob in Wörter zu segmentieren und zunächst N-Segmentierungsergebnisse mit der höchsten Wahrscheinlichkeit zu erhalten. Anschließend wird die Rollenanmerkungsmethode verwendet, um nicht registrierte Wörter zu identifizieren und deren Wahrscheinlichkeiten zu berechnen Wörter werden zum segmentierten Wortdiagramm hinzugefügt und dann als gewöhnliche Wörter behandelt. Anschließend wird eine dynamische Programmierung durchgeführt, um N Segmentierungsanmerkungsergebnisse mit maximaler Wahrscheinlichkeit auszuwählen. und notieren Sie es.
Drittens: Entfernen Sie bedeutungslose Wörter aus den vorläufigen Ergebnissen der Wortsegmentierung.
Im zweiten Schritt analysiert die Suchmaschine die Ergebnisse der Wortsegmentierung und entfernt einige nicht wesentliche Wörter wie Modalpartikel und Adjektive sowie einige Wörter. Außerdem ist sie der Ansicht, dass die durch Einzelwortwörter ausgedrückten Informationen nicht vollständig genug sind und herausgefiltert werden sollten . Die Entfernung von Stoppwörtern erfolgt durch die Erstellung einer Stoppwortliste. Auf diese Weise bleiben nach dem Entfernen dieser bedeutungslosen Wörter bedeutungsvolle Wörter übrig, die einer Analyse wert sind.
Viertens: Bestimmen und analysieren Sie das Gewicht von Schlüsselwörtern
Nach Abschluss der Wortsegmentierung und Reinigung des Artikels müssen alle Schlüsselwörter des Artikels analysiert werden. Die Idee des Autors besteht darin, dass die Suchmaschine den Text als IV-dimensionalen Merkmalsvektor darstellt und jede dimensionale Komponente aus Schlüsselwörtern und besteht ihre Gewichte. Es wird allgemein angenommen, dass die Bestimmung der Gewichtung von Schlüsselwörtern in einem Text hauptsächlich aus drei Teilen besteht: Worthäufigkeit, Position und Wortbedeutung beeinflussen gemeinsam die Entscheidung. Der Einfluss der Worthäufigkeit und -position auf Wörter oder Phrasen kann durch bestimmte Algorithmen bestimmt werden, und Wortbedeutungsgewichtungen werden ebenfalls mithilfe fester Algorithmen analysiert und berechnet. Die Suchmaschine verwendet einen festgelegten Algorithmus zur Berechnung und Analyse der oben genannten Schlüsselwörter. Um das Endergebnis zu erhalten.
Der Autor geht davon aus, dass die Suchmaschine das Endergebnis nach der Analyse durch die oben genannten Schritte erhält. Der Autor spricht hier über seine spezifische Analysemethode der Suchmaschine, die nur seine persönliche Meinung darstellt:
Erstens: Suchmaschinengewichtung basierend auf der Keyword-Position
In einem Dokument spielt die Position eines Schlüsselworts eine wichtige Rolle bei der Bestimmung der Gewichtung eines Schlüsselworts auf der Seite für Suchmaschinen. Beispielsweise wird der Domänenname von Suchmaschinen als der festste Faktor der Website angesehen. Beispielsweise hat ein Domänenname, der das Schlüsselwort „DVD“ enthält, einen inhärenten Vorteil, wenn Benutzer nach dem Schlüsselwort „DVD“ suchen. Der Titel ist die wertvollste Ressource der Website. Suchmaschinen glauben, dass der Titel in der Titelleiste des Browsers angezeigt wird, da er die wichtigste und prägnanteste Zusammenfassung der Datei ist. Die richtige Hervorhebung des Anteils der Schlüsselwörter im Titel trägt sehr zur Verbesserung des Rankings bei.
Zweitens: Suchmaschinen basieren auf der Häufigkeit von Schlüsselwörtern
Die Gesamtzahl der verschiedenen Schlüsselwörter auf der Webseite ist ein sehr wichtiger Aspekt. Persönlich denke ich, dass die Position und die Worthäufigkeit von Schlüsselwörtern zwar einen großen Einfluss auf die Gewichtung von Schlüsselwörtern haben, eine hohe Worthäufigkeit jedoch nicht darüber entscheidet, ob das Wort als Schlüsselwort geeignet ist. Um ein einfaches Beispiel zu nennen: Wir optimieren „Vereinigte Staaten“ in einem Artikel. Die Häufigkeit des Wortes ist sehr hoch und die Position, an der es erscheint, ist ebenfalls sehr wichtig. Allerdings kann diesem Wort immer noch kein höheres Gewicht gegeben werden, da „Vereinigte Staaten“ vorhanden sind Staaten“ kommt auch in anderen Dokumenten häufig vor. In diesen Dokumenten kommt „Vereinigte Staaten“ auch häufig vor und seine Position ist ebenfalls wichtig. Daher sollten Wörter, die eine hohe Häufigkeit haben, aber nicht als Schlüsselwörter geeignet sind, weniger gewichtet werden.
Drittens: Der Abstand zwischen wichtigen Schlüsselwörtern im Dokument
Bei der persönlichen Analyse sollte auch der Abstand zwischen wichtigen Schlüsselwörtern im Dokument ein wichtiger Aspekt sein, um die Relevanz von Schlüsselwörtern und Artikeln zu messen.
Der Autor geht davon aus, dass die Suchmaschine nach Durchführung der oben genannten Verarbeitungsreihe dem Artikel eine bestimmte Punktzahl für dieses Schlüsselwort verleiht. Wenn ein Benutzer nach einem bestimmten Schlüsselwort sucht, besteht eine hohe Wahrscheinlichkeit, dass der Artikel mit einer hohen Punktzahl an erster Stelle steht viel größer. Dies schließt den Einfluss externer Links natürlich aus. Die oben genannten sind einige persönliche Ansichten zu Suchmaschinen, die nicht unbedingt korrekt sind. Schließlich liegt das Urheberrecht des Artikels bei: Guangzhou Abortion Hospital: http://www.gzrlw.net/ . Sie können es gerne nachdrucken, aber bitte behalten Sie den Link, vielen Dank für Ihr Verständnis und Ihre Kooperation!
Vielen Dank an siyi8473 für seinen Beitrag