Ein Open-Source-Multitool zum Erkunden und Veröffentlichen von Daten
Datasette ist ein Tool zum Erkunden und Veröffentlichen von Daten. Es hilft Menschen dabei, Daten jeder Form und Größe zu erfassen und diese als interaktive, erforschbare Website und zugehörige API zu veröffentlichen.
Datasette richtet sich an Datenjournalisten, Museumskuratoren, Archivare, Kommunalverwaltungen, Wissenschaftler, Forscher und alle anderen, die über Daten verfügen, die sie mit der Welt teilen möchten.
Entdecken Sie eine Demo, schauen Sie sich ein Video über das Projekt an oder probieren Sie es aus, indem Sie Ihre eigenen CSV-Daten hochladen und veröffentlichen.
main
: https://latest.datasette.io/Möchten Sie über das Projekt auf dem Laufenden bleiben? Abonnieren Sie den Datasette-Newsletter, um Tipps, Tricks und Neuigkeiten zu Neuigkeiten im Datasette-Ökosystem zu erhalten.
Wenn Sie einen Mac verwenden, ist Homebrew der einfachste Weg, Datasette zu installieren:
brew install datasette
Sie können es auch mit pip
oder pipx
installieren:
pip install datasette
Datasette erfordert Python 3.8 oder höher. Wir haben auch detaillierte Installationsanweisungen für andere Optionen wie Docker.
datasette serve path/to/database.db
Dadurch wird ein Webserver auf Port 8001 gestartet. Besuchen Sie http://localhost:8001/, um auf die Weboberfläche zuzugreifen.
serve
ist der Standard-Unterbefehl, Sie können ihn weglassen, wenn Sie möchten.
Chrome unter OS X verwenden? Sie können Datasette folgendermaßen mit Ihrem Browserverlauf ausführen:
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
Wenn Sie jetzt http://localhost:8001/History/downloads besuchen, wird Ihnen eine Weboberfläche zum Durchsuchen Ihrer Download-Daten angezeigt:
Wenn Sie Lizenz- und Quellinformationen in die generierte Datasette-Website einbinden möchten, können Sie dazu eine JSON-Datei verwenden, die etwa so aussieht:
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
Speichern Sie dies in metadata.json
und führen Sie Datasette wie folgt aus:
datasette serve fivethirtyeight.db -m metadata.json
Die Lizenz- und Quelleninformationen werden auf der Indexseite und in der Fußzeile angezeigt. Sie werden auch in das von der API erstellte JSON aufgenommen.
Wenn Sie Heroku oder Google Cloud Run konfiguriert haben, kann Datasette mit einem einzigen Befehl eine oder mehrere SQLite-Datenbanken im Internet bereitstellen:
datasette publish heroku database.db
Oder:
datasette publish cloudrun database.db
Dadurch wird ein Docker-Image erstellt, das sowohl die Datasette-Anwendung als auch die angegebenen SQLite-Datenbankdateien enthält. Anschließend stellt es dieses Bild auf Heroku oder Cloud Run bereit und gibt Ihnen eine URL für den Zugriff auf die resultierende Website und API.
Weitere Einzelheiten finden Sie unter Daten veröffentlichen in der Dokumentation.
Datasette Lite ist eine mit WebAssembly gepackte Datasette, sodass sie vollständig in Ihrem Browser ausgeführt wird und kein Python-Webanwendungsserver erforderlich ist. Lesen Sie mehr darüber in der Datasette Lite-Dokumentation.