พื้นที่เก็บข้อมูลนี้เป็นที่เก็บถาวรของงานที่ทำกับความท้าทาย CORD-19 ในปี 2020 หากคุณต้องการประมวลผลวรรณกรรมทางการแพทย์โดยทางโปรแกรม โปรดดู paperai
ชุดข้อมูลการวิจัยแบบเปิดเกี่ยวกับโควิด-19 (CORD-19) เป็นแหล่งข้อมูลบทความวิชาการฟรี ซึ่งรวบรวมโดยแนวร่วมของกลุ่มวิจัยชั้นนำ ซึ่งครอบคลุมเรื่องโควิด-19 และกลุ่มไวรัสโคโรน่าไวรัส ชุดข้อมูลสามารถพบได้ใน Semantic Scholar และ Kaggle
โปรเจ็กต์ cord19q สร้างดัชนีบนชุดข้อมูล CORD-19 เพื่อช่วยในการวิเคราะห์และการค้นพบข้อมูล มีการสำรวจชุดหัวข้อวิจัยที่เกี่ยวข้องกับโควิด-19 เพื่อระบุบทความที่เกี่ยวข้องและช่วยค้นหาคำตอบสำหรับคำถามทางวิทยาศาสตร์ที่สำคัญ
ดูรายการงาน Kaggle CORD-19 Challenge ทั้งหมดได้ในสมุดบันทึกนี้ สมุดบันทึกนี้และสมุดบันทึกรายงานที่เกี่ยวข้องชนะ ? 7 รางวัล ? ในการท้าทาย Kaggle CORD-19
งานล่าสุดจะถูกจัดเก็บไว้ในที่เก็บ cord19q ด้วย
cord19q สามารถติดตั้งได้โดยตรงจาก GitHub โดยใช้ pip แนะนำให้ใช้ Python Virtual Environment
pip install git+https://github.com/neuml/cord19q
รองรับ Python 3.6+
cord19q อาศัย paperetl เพื่อแยกวิเคราะห์และโหลดชุดข้อมูล CORD-19 ลงในฐานข้อมูล SQLite จากนั้น paperai จะถูกนำมาใช้เพื่อรันการทบทวนวรรณกรรมที่ขับเคลื่อนโดย AI บนชุดข้อมูล CORD-19 สำหรับรายการงานสืบค้น
ลิงค์ต่อไปนี้แสดงวิธีแยกวิเคราะห์ โหลด และจัดทำดัชนี CORD-19
โมเดลจะถูกเก็บไว้ใน ~/.cord19
ไฟล์รายงานเป็นเพียงไฟล์มาร์กดาวน์ที่สร้างขึ้นจากรายการข้อความค้นหา ตัวอย่าง:
python -m paperai.report tasks/risk-factors.yml
เมื่อเสร็จแล้วไฟล์ชื่อ Tasks/risk-factors.md จะถูกสร้างขึ้น
วิธีที่เร็วที่สุดในการเรียกใช้แบบสอบถามคือการเริ่มเชลล์กระดาษ
paperai
พรอมต์จะปรากฏขึ้น สามารถพิมพ์ข้อความค้นหาลงในคอนโซลได้โดยตรง