Un multi-outil open source pour explorer et publier des données
Datasette est un outil d'exploration et de publication de données. Il aide les utilisateurs à prendre des données de n'importe quelle forme ou taille et à les publier sous la forme d'un site Web interactif et explorable accompagné d'une API.
Datasette s'adresse aux journalistes de données, aux conservateurs de musées, aux archivistes, aux gouvernements locaux, aux scientifiques, aux chercheurs et à toute autre personne possédant des données qu'ils souhaitent partager avec le monde.
Explorez une démo, regardez une vidéo sur le projet ou essayez-le en téléchargeant et en publiant vos propres données CSV.
main
actuelle : https://latest.datasette.io/Vous souhaitez rester au courant du projet ? Abonnez-vous à la newsletter Datasette pour obtenir des conseils, des astuces et des actualités sur les nouveautés de l'écosystème Datasette.
Si vous êtes sur Mac, Homebrew est le moyen le plus simple d'installer Datasette :
brew install datasette
Vous pouvez également l'installer en utilisant pip
ou pipx
:
pip install datasette
Datasette nécessite Python 3.8 ou supérieur. Nous avons également des instructions d'installation détaillées couvrant d'autres options telles que Docker.
datasette serve path/to/database.db
Cela démarrera un serveur Web sur le port 8001 - visitez http://localhost:8001/ pour accéder à l'interface Web.
serve
est la sous-commande par défaut, vous pouvez l'omettre si vous le souhaitez.
Utiliser Chrome sur OS X ? Vous pouvez exécuter un ensemble de données sur l'historique de votre navigateur comme suit :
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
En visitant maintenant http://localhost:8001/History/downloads, vous verrez une interface Web pour parcourir vos données de téléchargement :
Si vous souhaitez inclure des informations sur les licences et les sources dans le site Web de la base de données généré, vous pouvez le faire en utilisant un fichier JSON qui ressemble à ceci :
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
Enregistrez-le dans metadata.json
et exécutez Datasette comme ceci :
datasette serve fivethirtyeight.db -m metadata.json
Les informations sur la licence et la source seront affichées sur la page d'index et dans le pied de page. Ils seront également inclus dans le JSON produit par l'API.
Si Heroku ou Google Cloud Run est configuré, Datasette peut déployer une ou plusieurs bases de données SQLite sur Internet avec une seule commande :
datasette publish heroku database.db
Ou:
datasette publish cloudrun database.db
Cela créera une image Docker contenant à la fois l'application de base de données et les fichiers de base de données SQLite spécifiés. Il déploiera ensuite cette image sur Heroku ou Cloud Run et vous donnera une URL pour accéder au site Web et à l'API résultants.
Voir Publication de données dans la documentation pour plus de détails.
Datasette Lite est un Datasette packagé à l'aide de WebAssembly afin qu'il s'exécute entièrement dans votre navigateur, aucun serveur d'applications Web Python n'est requis. En savoir plus à ce sujet dans la documentation Datasette Lite.