用於探索和發布資料的開源多功能工具
Datasette 是一個用於探索和發布資料的工具。它幫助人們獲取任何形狀或大小的數據,並將其發佈為互動式、可探索的網站和隨附的 API。
Datasette 針對資料記者、博物館館長、檔案管理員、地方政府、科學家、研究人員以及任何希望與世界分享資料的人。
探索演示、觀看有關該項目的影片或透過上傳和發布您自己的 CSV 資料來嘗試。
main
分支的現場演示:https://latest.datasette.io/想要了解該專案的最新動態嗎?訂閱 Datasette 時事通訊,以了解有關 Datasette 生態系統新增功能的提示、技巧和新聞。
如果您使用的是 Mac,Homebrew 是安裝 Datasette 的最簡單方法:
brew install datasette
您也可以使用pip
或pipx
安裝它:
pip install datasette
Datasette 需要 Python 3.8 或更高版本。我們還提供了涵蓋其他選項(例如 Docker)的詳細安裝說明。
datasette serve path/to/database.db
這將在連接埠 8001 上啟動 Web 伺服器 - 造訪 http://localhost:8001/ 來存取 Web 介面。
serve
是預設子命令,如果您願意,可以省略它。
在 OS X 上使用 Chrome?您可以根據瀏覽器歷史記錄執行資料集,如下所示:
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
現在造訪 http://localhost:8001/History/downloads 將顯示一個 Web 介面來瀏覽下載資料:
如果您想在生成的資料集網站中包含許可和來源信息,您可以使用如下所示的 JSON 檔案來實現:
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
將其保存在metadata.json
中並像這樣運行Datasette:
datasette serve fivethirtyeight.db -m metadata.json
許可證和來源資訊將顯示在索引頁和頁腳中。它們也將包含在 API 產生的 JSON 中。
如果您設定了 Heroku 或 Google Cloud Run,Datasette 可以使用單一指令將一個或多個 SQLite 資料庫部署到網際網路:
datasette publish heroku database.db
或者:
datasette publish cloudrun database.db
這將建立一個包含資料集應用程式和指定 SQLite 資料庫檔案的 docker 映像。然後,它將將該映像部署到 Heroku 或 Cloud Run,並為您提供一個 URL 以存取生成的網站和 API。
有關更多詳細信息,請參閱文件中的發布數據。
Datasette Lite 是使用 WebAssembly 打包的 Datasette,因此它完全在瀏覽器中運行,不需要 Python Web 應用程式伺服器。請參閱 Datasette Lite 文件以了解更多相關資訊。