Multi-alat sumber terbuka untuk menjelajahi dan menerbitkan data
Kumpulan data adalah alat untuk mengeksplorasi dan mempublikasikan data. Ini membantu orang mengambil data dalam bentuk atau ukuran apa pun dan mempublikasikannya sebagai situs web yang interaktif dan dapat dijelajahi serta API yang menyertainya.
Kumpulan data ditujukan untuk jurnalis data, kurator museum, arsiparis, pemerintah daerah, ilmuwan, peneliti, dan siapa pun yang memiliki data yang ingin mereka bagikan kepada dunia.
Jelajahi demo, tonton video tentang proyek, atau cobalah dengan mengunggah dan memublikasikan data CSV Anda sendiri.
main
saat ini: https://latest.datasette.io/Ingin tetap mendapatkan informasi terbaru tentang proyek ini? Berlangganan buletin Datasette untuk mendapatkan tips, trik, dan berita tentang apa yang baru di ekosistem Datasette.
Jika Anda menggunakan Mac, Homebrew adalah cara termudah untuk menginstal Datasette:
brew install datasette
Anda juga dapat menginstalnya menggunakan pip
atau pipx
:
pip install datasette
Himpunan data memerlukan Python 3.8 atau lebih tinggi. Kami juga memiliki petunjuk instalasi terperinci yang mencakup opsi lain seperti Docker.
datasette serve path/to/database.db
Ini akan memulai server web pada port 8001 - kunjungi http://localhost:8001/ untuk mengakses antarmuka web.
serve
adalah subperintah default, Anda dapat menghilangkannya jika Anda mau.
Gunakan Chrome di OS X? Anda dapat menjalankan kumpulan data berdasarkan riwayat browser Anda seperti:
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
Sekarang mengunjungi http://localhost:8001/History/downloads akan menampilkan antarmuka web untuk menelusuri data unduhan Anda:
Jika Anda ingin menyertakan informasi lisensi dan sumber di situs web kumpulan data yang dihasilkan, Anda dapat melakukannya menggunakan file JSON yang terlihat seperti ini:
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
Simpan ini di metadata.json
dan jalankan Datasette seperti ini:
datasette serve fivethirtyeight.db -m metadata.json
Informasi lisensi dan sumber akan ditampilkan pada halaman indeks dan footer. Mereka juga akan disertakan dalam JSON yang diproduksi oleh API.
Jika Anda telah mengonfigurasi Heroku atau Google Cloud Run, Datasette dapat menerapkan satu atau beberapa database SQLite ke internet dengan satu perintah:
datasette publish heroku database.db
Atau:
datasette publish cloudrun database.db
Ini akan membuat gambar buruh pelabuhan yang berisi aplikasi kumpulan data dan file database SQLite yang ditentukan. Ini kemudian akan menyebarkan gambar itu ke Heroku atau Cloud Run dan memberi Anda URL untuk mengakses situs web dan API yang dihasilkan.
Lihat Menerbitkan data dalam dokumentasi untuk detail selengkapnya.
Datasette Lite adalah Datasette yang dikemas menggunakan WebAssembly sehingga dapat berjalan sepenuhnya di browser Anda, tidak memerlukan server aplikasi web Python. Baca selengkapnya tentang hal itu di dokumentasi Datasette Lite.