Un moteur de recherche Open Source + un robot d'exploration Web. Peut être utilisé pour mettre en cache des sites Web spécifiques ou l’ensemble du Web. Cela fait partie d'un projet visant à mettre en cache des sites Web spécifiques sur un Raspberry Pi et à rendre les informations disponibles gratuitement dans les zones reculées où l'accès à Internet est difficile à fournir.
Il s'agit d'un travail en cours et, à ses tout premiers stades, il n'est pas adapté à une utilisation en production. Toutefois, pour les sites Web uniques, ce moteur de recherche fonctionne très bien.
Résultats
Le moteur de recherche comporte 2 composants ; un robot et le serveur. Le robot explore le Web et renvoie le contenu des pages analysées au serveur. Le serveur stocke ces contenus dans une base de données. Chaque fois qu'un utilisateur souhaite rechercher quelque chose, le serveur effectue une opération de recherche dans la base de données sur le contenu stocké.
Serveur : PHP7 + MySQL.
Client : Fonctionne partout
Construisez le fichier main.go dans le dossier du robot : go build main.go
Configurer un serveur LEMP
Configurez le serveur Web en ligne en copiant le contenu du dossier du serveur Web.
Importez db.sql dans votre base de données MySQL.
Accédez à application/config/database.php pour modifier les informations d'identification de la base de données sur votre serveur de base de données.
Testez pour voir si cela fonctionne en visitant votre-serveur-ip/index.php/Api
Modifiez les liens dans le fichier config.json
pour pointer vers votre serveur, modifiez également l'URL de départ.
Exécutez le robot : ./main ./
. Le premier argument du robot est le chemin d'accès au répertoire qui contient le fichier config.json. (PS : vous pouvez exécuter plusieurs robots d'exploration à la fois)
Visitez l'adresse IP de votre serveur pour afficher la page de recherche et voir la progression du nombre de pages indexées.