Repositori ini adalah arsip pekerjaan yang dilakukan dengan tantangan CORD-19 pada tahun 2020. Jika Anda ingin memproses literatur medis secara terprogram, lihat paperai
Kumpulan Data Penelitian Terbuka COVID-19 (CORD-19) adalah sumber artikel ilmiah gratis, yang dikumpulkan oleh koalisi kelompok penelitian terkemuka, yang mencakup COVID-19 dan keluarga virus virus corona. Kumpulan data dapat ditemukan di Semantic Scholar dan Kaggle.
Proyek cord19q membuat indeks pada kumpulan data CORD-19 untuk membantu analisis dan penemuan data. Serangkaian topik penelitian terkait COVID-19 dieksplorasi untuk mengidentifikasi artikel yang relevan dan membantu menemukan jawaban atas pertanyaan-pertanyaan ilmiah utama.
Daftar lengkap tugas Kaggle CORD-19 Challenge dapat ditemukan di buku catatan ini. Buku catatan ini dan buku catatan laporan terkait menang? 7 penghargaan? dalam Tantangan Kaggle CORD-19.
Tugas terbaru juga disimpan di repositori cord19q.
cord19q dapat diinstal langsung dari GitHub menggunakan pip. Disarankan menggunakan Lingkungan Virtual Python.
pip install git+https://github.com/neuml/cord19q
Python 3.6+ didukung
cord19q mengandalkan paperetl untuk mengurai dan memuat kumpulan data CORD-19 ke dalam database SQLite. paperai kemudian digunakan untuk menjalankan Tinjauan Literatur yang Didukung AI pada kumpulan data CORD-19 untuk daftar tugas kueri.
Tautan berikut menunjukkan cara mengurai, memuat, dan mengindeks CORD-19.
Model akan disimpan di ~/.cord19
File laporan hanyalah file penurunan harga yang dibuat dari daftar kueri. Contoh:
python -m paperai.report tasks/risk-factors.yml
Setelah selesai, file bernama task/risk-factors.md akan dibuat.
Cara tercepat untuk menjalankan kueri adalah dengan memulai shell paperai
paperai
Sebuah prompt akan muncul. Kueri dapat diketik langsung ke konsol.