SOSSE?
SOSSE (Selenium Open Source Search Engine) ist eine in Python geschriebene Webarchivierungssoftware, ein Crawler und eine Suchmaschine, die unter der GNU-AGPLv3-Lizenz vertrieben wird. Es wird sowohl auf der Gitlab- als auch auf der Github-Website gehostet. Bitte verwenden Sie eine davon, um Funktionsanfragen, Fehlerberichte oder Zusammenführungsanfragen zu stellen oder eine Diskussion zu eröffnen.
Die Hauptmerkmale von SOSSE sind:
- ? Browserbasiertes Crawling: SOSSE verwendet Mozilla Firefox oder Google Chromium und Selenium, um Seiten zu indizieren, die Javascript verwenden. Anfragen können auch zum schnelleren Crawlen verwendet werden
- Offline-Browsing: SOSSE kann HTML-Kopie speichern oder Screenshots von gecrawlten Seiten erstellen, um Archive zu erstellen, die für das Offline-Browsing geeignet sind
- ? Geringe Ressourcenanforderungen: SOSSE ist vollständig in Python geschrieben und verwendet PostgreSQL zur Datenspeicherung
- ? Authentifizierung: Die Crawler können Authentifizierungsformulare mit den bereitgestellten Anmeldeinformationen senden
- ? Suchmaschinen-Verknüpfungen: Verknüpfungen für Suchanfragen können verwendet werden, um auf externe Suchmaschinen umzuleiten (manchmal auch „Bang“-Suchen genannt).
- ? Suchverlauf: Benutzer können sich authentifizieren, um ihren Suchabfrageverlauf privat zu protokollieren
Sehen Sie sich die Dokumentation und Screenshots an.
Probieren Sie es aus
Sie können die neueste Version mit Docker ausprobieren:
docker run -p 8005:80 biolds/sosse:latest
Öffnen Sie http://127.0.0.1:8005/ und melden Sie sich mit dem Benutzer admin
und dem Passwort admin
an.
Um Docker-Daten beizubehalten oder alternative Installationsmethoden zu finden, lesen Sie bitte die Dokumentation.
Den Kontakt halten
Treten Sie dem Discord-Server bei, um Hilfe zu erhalten und Ideen auszutauschen!