Instalar .NET
Descarga este Proyecto.
Correr
cd FTServer
dotnet run -c Release
Abierto http://127.0.0.1:5066/
Presione [Ctrl+C] para apagar.
Ingrese una URL completa para indexar la página, luego busque.
Mueva la página hacia adelante reindexándola.
[Palabra1 Palabra2 Palabra3] => el texto tiene Palabra1 y Palabra2 y Palabra3
["Palabra1 Palabra2 Palabra3"] => el texto tiene "Palabra1 Palabra2 Palabra3" en su totalidad
Busque [https] o [http] => obtenga casi todas las páginas
Descargar código de Visual Studio
iBoxDB
ángulo agudo
UI semántica
El orden de los resultados se basa en el número id() de la clase PageText , en orden descendente.
Una página tiene muchos textos de página. Si no necesita varios textos, modifique Html.getDefaultTexts(Page) , devuelve solo un PageText (solo el texto de descripción de la página, Config.DescriptionOnly=true ).
El método Page.GetRandomContent() se utiliza para mantener el contenido de la página de búsqueda siempre cambiando, no afecta el orden real del texto de la página.
Utilice el número de identificación para controlar el orden en lugar de cargar todas las páginas en la memoria.
buscar (... Cadena de palabras clave, ID de inicio largo, recuento largo)
startId => qué ID (la identificación cuando creó PageText) para comenzar, use (startId=Long.MaxValue) para leer desde arriba, en orden descendente
recuento => registros para leer, parámetro importante , la velocidad de búsqueda depende de este parámetro, no del tamaño de los datos.
establezca startId como la última identificación de los resultados de la búsqueda menos uno
startId = search ( " keywords " , startId , count ) ;
nextpage_startId = startId - 1 // this 'minus one' has done inside search()
.. .
//read next page
search ( " keywords " , nextpage_startId , count )
principalmente, nextpage_startId se publica desde el navegador del cliente cuando el usuario llega al final de la página web y establece el valor predeterminado nextpage_startId=Long.MaxValue, en javascript el número grande debe escribirse como Cadena ("'" + nextpage_startId + "'")
Abierto
public Page Html . Get ( String url ) ;
Configure el texto privado de su sitio web
Page page = new Page ( ) ;
page . url = url ;
page . title = title ;
page . text = bodyText
page.. . = .. .
return page ;
Configuración del índice de caché de solo lectura (Readonly_MaxDBCount) desde FTServer/Code/Config.cs.
[user@localhost ~ ]$ cat /proc/sys/fs/file-max
803882
[user@localhost ~ ]$ ulimit -a | grep files
open files (-n) 500000
[user@localhost ~ ]$ ulimit -Hn
500000
[user@localhost ~ ]$ ulimit -Sn
500000
[user@localhost ~ ]$
$ vi /etc/security/limits.conf
* hard nofile 500000
* soft nofile 500000
root hard nofile 500000
root soft nofile 500000
[user@localhost ~ ]$ firewall-cmd --add-port=5066/tcp --permanent
¿Por qué Tracker consume recursos en mi PC?
[user@localhost ~ ]$ tracker daemon -k
[user@localhost project]$ tracker reset --hard
Trasplante desde la búsqueda de texto completo Versión Java JSP