Die Taote-Site-Suchmaschine wurde aus der Taote-JSP-Suchmaschine entwickelt. Das System basiert auf dem Lucene.Net-Kern und verwendet einen effizienten chinesischen Wortsegmentierungsalgorithmus, um den Inhalt der Datenbank zu analysieren, zu indizieren und auf der Festplatte zu speichern. Während der Front-End-Suche werden durch das Lesen der Indexdatei für die Abfrage die Leistungsprobleme herkömmlicher Datenbankabfragen bei hoher Parallelität und großen Datenmengen vermieden. Da die Frontend-Suche keine Verbindung zur Datenbank herstellt, bietet sie eine schnelle Datenabfragelösung für spezielle Benutzergruppen, die nicht möchten, dass die Datenbank im Frontend platziert wird.
+Installationsanleitung+
Dieses System wurde mit asp.net + C# entwickelt und läuft in der .net Framework 2.0-Umgebung oder höher. Die Installation kann abgeschlossen werden, indem die Datei auf den Server hochgeladen und jedem im tot-Verzeichnis im System Lese- und Schreibberechtigungen erteilt werden.
+Erste Indizierungsanweisungen+
Wenn Ihre Website bereits über bestimmte Daten verfügt, können Sie Reset.aspx verwenden, das in dieser Software bereitgestellt wird, um eine Verbindung zur Datenbank herzustellen, die Tabellen und zugehörigen Felder auszuwählen, die für die Suchmaschine indiziert werden sollen, und die Indexinitialisierung der Datenbank nach der Ausführung des Index abzuschließen . Anschließend können Sie die Abfrageergebnisse über http://Ihr Domänenname/Default.aspx sehen.
Tipp!!: Nach Abschluss der Datenbankinitialisierung löschen oder ändern Sie bitte Reset.aspx, um eine Fehlbedienung des Index zu vermeiden.
+Indexschnittstellenbeschreibung+
Obwohl die Indexinitialisierung der Datenbankdaten abgeschlossen ist und die Front-End-Abfrage implementiert wurde, wie kann die Taote-Suchmaschine bei der Aktualisierung der Website-Daten die neuen Daten automatisch indizieren, um sicherzustellen, dass das Front-End immer den neuesten Inhalt abfragen kann? Zu diesem Zweck stellen wir die Indexzugriffsschnittstellendatei TotIndex.aspx bereit, die die Funktionen zum Hinzufügen und Löschen von Indizes bereitstellt. Um zu verhindern, dass externe Websites in böswilliger Absicht illegale Daten übermitteln, muss für den Zugriff auf diese Schnittstelle mit ihr über einen Schlüssel kommuniziert werden. Das Hinzufügen und Löschen des Index kann nur abgeschlossen werden, wenn der Schlüssel mit dem vom System angegebenen übereinstimmt. Der Schlüssel ist in Web.config wie folgt konfiguriert:
Bitte ändern Sie nach der Erstinstallation des Systems den Wertteil von ikey in eine komplexere Zeichenfolge. Geben Sie denselben Schlüssel auch an, wenn über Ihre Indexschnittstelle darauf zugegriffen wird.
Die Indexschnittstelle überträgt Daten über HTTP. In Anbetracht der von dieser Software verwendeten UTF-8-Codierung verwenden einige Sprachen wie ASP und PHP möglicherweise die GB2312-Codierung, wenn gb2312 nicht in UTF-8 konvertiert wird. Außerdem werden verstümmelte Zeichen angezeigt Beim Senden von Daten tritt auch das Problem der Längenbeschränkung der Datenübertragung auf. Daher verwenden wir die Post-Methode in der Indexschnittstelle. Um Entwicklern den schnellen Einstieg in die Indexschnittstelle zu erleichtern, haben wir Beispiele für die Indexschnittstellenentwicklung in verschiedenen WEB-Entwicklungssprachen (ASP, JSP, PHP, .net) erstellt. Bitte beachten Sie die entsprechenden Dateien im Demoverzeichnis.
Nachdem die Indexschnittstelle entwickelt wurde, kann durch Ändern Ihres ursprünglichen Programms zum Hinzufügen von Daten, nach dem Hinzufügen der Datenbank und Ausführen des Indexschnittstellenprogramms gleichzeitig die automatische Hinzufügung des Indexes der Suchmaschine abgeschlossen werden. Es werden Echtzeitaktualisierungen der Suchmaschine auf der Website durchgeführt.