أداة متعددة مفتوحة المصدر لاستكشاف البيانات ونشرها
Datasette هي أداة لاستكشاف البيانات ونشرها. فهو يساعد الأشخاص على الحصول على بيانات من أي شكل أو حجم ونشرها كموقع ويب تفاعلي وقابل للاستكشاف وواجهة برمجة التطبيقات المصاحبة.
تستهدف Datasette صحفيي البيانات، وأمناء المتاحف، وأمناء المحفوظات، والحكومات المحلية، والعلماء، والباحثين، وأي شخص آخر لديه بيانات يرغبون في مشاركتها مع العالم.
استكشف عرضًا توضيحيًا، أو شاهد مقطع فيديو حول المشروع، أو جربه عن طريق تحميل بيانات CSV الخاصة بك ونشرها.
main
الحالي: https://latest.datasette.io/هل ترغب في البقاء على اطلاع دائم بالمشروع؟ اشترك في النشرة الإخبارية لـ Datasette للحصول على النصائح والحيل والأخبار حول ما هو جديد في نظام Datasette البيئي.
إذا كنت تستخدم جهاز Mac، فإن Homebrew هو أسهل طريقة لتثبيت Datasette:
brew install datasette
يمكنك أيضًا تثبيته باستخدام pip
أو pipx
:
pip install datasette
تتطلب مجموعة البيانات إصدار Python 3.8 أو أعلى. لدينا أيضًا تعليمات تثبيت مفصلة تغطي خيارات أخرى مثل Docker.
datasette serve path/to/database.db
سيؤدي هذا إلى تشغيل خادم الويب على المنفذ 8001 - قم بزيارة http://localhost:8001/ للوصول إلى واجهة الويب.
إن serve
هو الأمر الفرعي الافتراضي، ويمكنك حذفه إذا أردت.
هل تريد استخدام Chrome على نظام التشغيل OS X؟ يمكنك تشغيل مجموعة البيانات مقابل سجل المتصفح الخاص بك كما يلي:
datasette ~/Library/Application Support/Google/Chrome/Default/History --nolock
الآن، زيارة http://localhost:8001/History/downloads ستظهر لك واجهة ويب لتصفح بيانات التنزيلات الخاصة بك:
إذا كنت تريد تضمين معلومات الترخيص والمصدر في موقع الويب الخاص بمجموعة البيانات التي تم إنشاؤها، فيمكنك القيام بذلك باستخدام ملف JSON الذي يبدو كما يلي:
{
"title": "Five Thirty Eight",
"license": "CC Attribution 4.0 License",
"license_url": "http://creativecommons.org/licenses/by/4.0/",
"source": "fivethirtyeight/data on GitHub",
"source_url": "https://github.com/fivethirtyeight/data"
}
احفظ هذا في metadata.json
وقم بتشغيل Datasette كما يلي:
datasette serve fivethirtyeight.db -m metadata.json
سيتم عرض معلومات الترخيص والمصدر في صفحة الفهرس وفي التذييل. سيتم أيضًا تضمينها في JSON التي تنتجها واجهة برمجة التطبيقات (API).
إذا قمت بتكوين Heroku أو Google Cloud Run، فيمكن لـ Datasette نشر قاعدة بيانات SQLite واحدة أو أكثر على الإنترنت باستخدام أمر واحد:
datasette publish heroku database.db
أو:
datasette publish cloudrun database.db
سيؤدي هذا إلى إنشاء صورة عامل إرساء تحتوي على كل من تطبيق مجموعة البيانات وملفات قاعدة بيانات SQLite المحددة. سيتم بعد ذلك نشر تلك الصورة على Heroku أو Cloud Run ويمنحك عنوان URL للوصول إلى موقع الويب الناتج وواجهة برمجة التطبيقات (API).
راجع نشر البيانات في الوثائق لمزيد من التفاصيل.
Datasette Lite عبارة عن Datasette تم تجميعها باستخدام WebAssembly بحيث يتم تشغيلها بالكامل في متصفحك، دون الحاجة إلى خادم تطبيق ويب Python. اقرأ المزيد عن ذلك في وثائق Datasette Lite.