Мультиинструмент с открытым исходным кодом для изучения и публикации данных.
Datasette — это инструмент для изучения и публикации данных. Он помогает людям брать данные любой формы и размера и публиковать их в виде интерактивного, доступного для изучения веб-сайта и сопутствующего API.
Datasette предназначен для журналистов данных, кураторов музеев, архивистов, представителей местных органов власти, ученых, исследователей и всех, у кого есть данные, которыми они хотят поделиться с миром.
Изучите демо-версию, посмотрите видео о проекте или опробуйте его, загрузив и опубликовав собственные данные в формате CSV.
main
ветки: https://latest.datasette.io/Хотите быть в курсе событий проекта? Подпишитесь на информационный бюллетень Datasette, чтобы получать советы, подсказки и новости о том, что нового в экосистеме Datasette.
Если вы используете Mac, Homebrew — это самый простой способ установить Datasette:
brew install datasette
Вы также можете установить его с помощью pip
или pipx
:
pip install datasette
Для набора данных требуется Python 3.8 или выше. У нас также есть подробные инструкции по установке, охватывающие другие варианты, такие как Docker.
datasette serve path/to/database.db
Это запустит веб-сервер на порту 8001 — посетите http://localhost:8001/, чтобы получить доступ к веб-интерфейсу.
serve
является подкомандой по умолчанию, вы можете опустить ее, если хотите.
Используете Chrome на OS X? Вы можете запустить набор данных для истории вашего браузера следующим образом:
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
Теперь посетив http://localhost:8001/History/downloads, вы увидите веб-интерфейс для просмотра данных о ваших загрузках:
Если вы хотите включить информацию о лицензировании и источнике в созданный веб-сайт набора данных, вы можете сделать это, используя файл JSON, который выглядит примерно так:
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
Сохраните это в metadata.json
и запустите Datasette следующим образом:
datasette serve fivethirtyeight.db -m metadata.json
Информация о лицензии и источнике будет отображаться на главной странице и в нижнем колонтитуле. Они также будут включены в JSON, создаваемый API.
Если у вас настроены Heroku или Google Cloud Run, Datasette может развернуть одну или несколько баз данных SQLite в Интернете с помощью одной команды:
datasette publish heroku database.db
Или:
datasette publish cloudrun database.db
При этом будет создан образ Docker, содержащий как приложение набора данных, так и указанные файлы базы данных SQLite. Затем он развернет этот образ в Heroku или Cloud Run и предоставит вам URL-адрес для доступа к полученному веб-сайту и API.
Дополнительные сведения см. в разделе Публикация данных в документации.
Datasette Lite — это набор данных, упакованный с использованием WebAssembly, поэтому он полностью работает в вашем браузере, сервер веб-приложений Python не требуется. Подробнее об этом читайте в документации Datasette Lite.