用于探索和发布数据的开源多功能工具
Datasette 是一个用于探索和发布数据的工具。它帮助人们获取任何形状或大小的数据,并将其发布为交互式、可探索的网站和随附的 API。
Datasette 面向数据记者、博物馆馆长、档案管理员、地方政府、科学家、研究人员以及任何希望与世界分享数据的人。
探索演示、观看有关该项目的视频或通过上传和发布您自己的 CSV 数据来尝试。
main
分支的现场演示:https://latest.datasette.io/想要了解该项目的最新动态吗?订阅 Datasette 时事通讯,了解有关 Datasette 生态系统新增功能的提示、技巧和新闻。
如果您使用的是 Mac,Homebrew 是安装 Datasette 的最简单方法:
brew install datasette
您还可以使用pip
或pipx
安装它:
pip install datasette
Datasette 需要 Python 3.8 或更高版本。我们还提供了涵盖其他选项(例如 Docker)的详细安装说明。
datasette serve path/to/database.db
这将在端口 8001 上启动 Web 服务器 - 访问 http://localhost:8001/ 来访问 Web 界面。
serve
是默认子命令,如果您愿意,可以省略它。
在 OS X 上使用 Chrome?您可以根据浏览器历史记录运行数据集,如下所示:
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
现在访问 http://localhost:8001/History/downloads 将显示一个 Web 界面来浏览下载数据:
如果您想在生成的数据集网站中包含许可和源信息,您可以使用如下所示的 JSON 文件来实现:
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
将其保存在metadata.json
中并像这样运行Datasette:
datasette serve fivethirtyeight.db -m metadata.json
许可证和源信息将显示在索引页和页脚中。它们还将包含在 API 生成的 JSON 中。
如果您配置了 Heroku 或 Google Cloud Run,Datasette 可以使用单个命令将一个或多个 SQLite 数据库部署到互联网:
datasette publish heroku database.db
或者:
datasette publish cloudrun database.db
这将创建一个包含数据集应用程序和指定 SQLite 数据库文件的 docker 映像。然后,它将将该映像部署到 Heroku 或 Cloud Run,并为您提供一个 URL 以访问生成的网站和 API。
有关更多详细信息,请参阅文档中的发布数据。
Datasette Lite 是使用 WebAssembly 打包的 Datasette,因此它完全在浏览器中运行,不需要 Python Web 应用程序服务器。请参阅 Datasette Lite 文档了解更多相关信息。