هذا المستودع عبارة عن أرشيف للعمل المنجز مع تحدي CORD-19 في عام 2020. إذا كنت ترغب في معالجة الأدبيات الطبية برمجيًا، فراجع Paperai
تعد مجموعة البيانات البحثية المفتوحة لكوفيد-19 (CORD-19) مصدرًا مجانيًا للمقالات العلمية، التي تم تجميعها بواسطة تحالف من مجموعات البحث الرائدة، والتي تغطي فيروس كوفيد-19 وعائلة الفيروسات التاجية. يمكن العثور على مجموعة البيانات على Semantic Scholar وKaggle.
يقوم مشروع cord19q ببناء فهرس على مجموعة بيانات CORD-19 للمساعدة في التحليل واكتشاف البيانات. تم استكشاف سلسلة من الموضوعات البحثية المتعلقة بفيروس كورونا المستجد (كوفيد-19) لتحديد المقالات ذات الصلة والمساعدة في العثور على إجابات للأسئلة العلمية الرئيسية.
يمكن العثور على قائمة كاملة بمهام تحدي Kaggle CORD-19 في هذا الدفتر. فاز هذا دفتر الملاحظات ودفاتر الملاحظات التقرير المقابلة؟ 7 جوائز ؟ في تحدي Kaggle CORD-19.
يتم أيضًا تخزين أحدث المهام في مستودع cord19q.
يمكن تثبيت cord19q مباشرة من GitHub باستخدام النقطة. يوصى باستخدام بيئة Python الافتراضية.
pip install git+https://github.com/neuml/cord19q
بايثون 3.6+ مدعوم
يعتمد cord19q على Paperetl لتحليل مجموعة بيانات CORD-19 وتحميلها في قاعدة بيانات SQLite. يتم بعد ذلك استخدام Paperai لإجراء مراجعة الأدبيات المدعومة بالذكاء الاصطناعي عبر مجموعة بيانات CORD-19 للحصول على قائمة بمهام الاستعلام.
توضح الروابط التالية كيفية تحليل CORD-19 وتحميله وفهرسته.
سيتم تخزين النموذج في ~/.cord19
ملف التقرير هو ببساطة ملف تخفيض السعر الذي تم إنشاؤه من قائمة الاستعلامات. مثال:
python -m paperai.report tasks/risk-factors.yml
بمجرد الانتهاء من ذلك، سيتم إنشاء ملف باسم المهام/عوامل الخطر.md.
أسرع طريقة لتشغيل الاستعلامات هي بدء غلاف ورقي
paperai
سوف تظهر مطالبة. يمكن كتابة الاستعلامات مباشرة في وحدة التحكم.