Un motor de búsqueda de código abierto + rastreador web. Se puede utilizar para almacenar en caché sitios web específicos o toda la web. Esto es parte de un proyecto para almacenar en caché sitios específicos de la web en una Raspberry Pi y hacer que la información esté disponible gratuitamente en áreas remotas donde el acceso a Internet es difícil de proporcionar.
Este es un trabajo en progreso y en sus etapas iniciales, no apto para uso en producción. Sin embargo, para sitios web individuales, este motor de búsqueda funciona muy bien.
Resultados
El motor de búsqueda tiene 2 componentes; un rastreador y el servidor. El rastreador rastrea la web y envía el contenido de la página rastreada al servidor. El servidor almacena estos contenidos en una base de datos. Siempre que un usuario quiere buscar algo, el servidor realiza una operación de búsqueda en la base de datos sobre los contenidos almacenados.
Servidor: PHP7 + MySQL.
Cliente: se ejecuta en todas partes
Cree el archivo main.go en la carpeta del rastreador: go build main.go
Configurar un servidor LEMP
Configure el servidor web en línea copiando el contenido de la carpeta del servidor web.
Importe db.sql a su base de datos MySQL.
Vaya a application/config/database.php para cambiar las credenciales de la base de datos a su servidor de base de datos.
Pruebe si funciona visitando your-server-ip/index.php/Api
Cambie los enlaces en el archivo config.json
para que apunten a su servidor, cambie también la URL de inicio.
Ejecute el rastreador: ./main ./
. El primer argumento del rastreador es la ruta al directorio que contiene el archivo config.json. (PD: puedes ejecutar varios rastreadores a la vez)
Visite su-ip-servidor para ver la página de búsqueda y ver el progreso del número de páginas indexadas.