Ce référentiel est une archive des travaux effectués avec le défi CORD-19 en 2020. Si vous souhaitez traiter par programmation la littérature médicale, consultez paperai
L’ensemble de données de recherche ouverte sur la COVID-19 (CORD-19) est une ressource gratuite d’articles scientifiques, regroupés par une coalition de groupes de recherche de premier plan, couvrant la COVID-19 et la famille des virus des coronavirus. L'ensemble de données peut être trouvé sur Semantic Scholar et Kaggle.
Le projet cord19q crée un index sur l'ensemble de données CORD-19 pour faciliter l'analyse et la découverte de données. Une série de sujets de recherche liés au COVID-19 ont été explorés pour identifier les articles pertinents et aider à trouver des réponses aux questions scientifiques clés.
Une liste complète des tâches du défi Kaggle CORD-19 peut être trouvée dans ce cahier. Ce carnet et les carnets de rapport correspondants ont gagné ? 7 récompenses ? dans le défi Kaggle CORD-19.
Les dernières tâches sont également stockées dans le référentiel cord19q.
cord19q peut être installé directement depuis GitHub en utilisant pip. L'utilisation d'un environnement virtuel Python est recommandée.
pip install git+https://github.com/neuml/cord19q
Python 3.6+ est pris en charge
cord19q s'appuie sur paperetl pour analyser et charger l'ensemble de données CORD-19 dans une base de données SQLite. paperai est ensuite utilisé pour exécuter une revue de la littérature basée sur l'IA sur l'ensemble de données CORD-19 pour une liste de tâches de requête.
Les liens suivants montrent comment analyser, charger et indexer CORD-19.
Le modèle sera stocké dans ~/.cord19
Un fichier de rapport est simplement un fichier de démarque créé à partir d'une liste de requêtes. Un exemple :
python -m paperai.report tasks/risk-factors.yml
Une fois terminé, un fichier nommé task/risk-factors.md sera créé.
Le moyen le plus rapide d'exécuter des requêtes est de démarrer un shell paperai
paperai
Une invite apparaîtra. Les requêtes peuvent être saisies directement dans la console.