Uma multiferramenta de código aberto para explorar e publicar dados
Datasette é uma ferramenta para explorar e publicar dados. Ele ajuda as pessoas a obter dados de qualquer formato ou tamanho e publicá-los como um site interativo e explorável e uma API que o acompanha.
O Datasette destina-se a jornalistas de dados, curadores de museus, arquivistas, governos locais, cientistas, investigadores e qualquer pessoa que possua dados que deseje partilhar com o mundo.
Explore uma demonstração, assista a um vídeo sobre o projeto ou experimente enviando e publicando seus próprios dados CSV.
main
atual: https://latest.datasette.io/Quer ficar atualizado sobre o projeto? Assine o boletim informativo Datasette para dicas, truques e notícias sobre as novidades do ecossistema Datasette.
Se você estiver em um Mac, o Homebrew é a maneira mais fácil de instalar o Datasette:
brew install datasette
Você também pode instalá-lo usando pip
ou pipx
:
pip install datasette
O Datasette requer Python 3.8 ou superior. Também temos instruções de instalação detalhadas que cobrem outras opções, como Docker.
datasette serve path/to/database.db
Isso iniciará um servidor web na porta 8001 - visite http://localhost:8001/ para acessar a interface web.
serve
é o subcomando padrão, você pode omiti-lo se desejar.
Usar o Chrome no OS X? Você pode executar o conjunto de dados no histórico do seu navegador da seguinte forma:
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
Agora, visitar http://localhost:8001/History/downloads mostrará uma interface da web para navegar pelos dados de downloads:
Se quiser incluir informações de licenciamento e origem no site do conjunto de dados gerado, você pode fazer isso usando um arquivo JSON parecido com este:
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
Salve isso em metadata.json
e execute o Datasette assim:
datasette serve fivethirtyeight.db -m metadata.json
As informações sobre licença e fonte serão exibidas na página de índice e no rodapé. Eles também serão incluídos no JSON produzido pela API.
Se você configurou o Heroku ou o Google Cloud Run, o Datasette pode implantar um ou mais bancos de dados SQLite na Internet com um único comando:
datasette publish heroku database.db
Ou:
datasette publish cloudrun database.db
Isso criará uma imagem docker contendo o aplicativo datasette e os arquivos de banco de dados SQLite especificados. Em seguida, ele implantará essa imagem no Heroku ou Cloud Run e fornecerá um URL para acessar o site e a API resultantes.
Consulte Publicação de dados na documentação para obter mais detalhes.
Datasette Lite é um Datasette empacotado usando WebAssembly para que ele seja executado inteiramente em seu navegador, sem a necessidade de servidor de aplicativos da web Python. Leia mais sobre isso na documentação do Datasette Lite.