Medicat هي مجموعة بيانات من الصور الطبية ، والتعليقات التوضيحية ، وشروط التكوين الفرعي-subcaption ، والمراجع النصية المضمنة. يتم توفير تعليمات للوصول هنا.
يتم استخراج الأشكال والتسميات التوضيحية من مقالات الوصول المفتوح في PubMed Central ، ويتم اشتقاق النص المرجعي المقابل من S2ORC.
تتكون مجموعة البيانات من:
تتوفر عينة من البيانات في sample/
.
إدخال بيانات مثال:
{
"pdf_hash": "57c9ad0f4aab133f96d40992c46926fabc901ffa",
"fig_key": "Figure1",
"fig_uri": "2-Figure1-1.png",
"s2_caption": "Figure 1. (A) Barium enema and (B) endoscopic image of the high-grade distal colonic obstruction caused by a 5-cm anastomotic stricture.",
"s2orc_caption": "Figure 1. (A) Barium enema and (B) endoscopic image of the high-grade distal colonic obstruction caused by a 5-cm anastomotic stricture.",
"s2orc_references": [
"Computed tomography (CT) showed a distal large bowel obstruction, and a barium enema revealed a high-grade stenosis proximal to the anastomotic site in the recto-sigmoid region (Figure 1 ).",
"Flexible sigmoidoscopy revealed a tight, fibrotic, benign-appearing anastomotic stricture 15 cm from the anal verge ( Figure 1) ."
],
"radiology": false,
"scope": true,
"predicted_type": "Medical images",
"oa_info": {
"doi": "10.14309/crj.2014.54",
"doi_url": "https://doi.org/10.14309/crj.2014.54",
"oa": {
"is_oa": true,
"oa_status": "gold",
"journal_is_oa": true,
"journal_is_in_doaj": true,
"license": "cc-by-nc-nd",
"provenance": "unpaywall"
}
}
}
يوجد الشكل المقابل في figures/57c9ad0f4aab133f96d40992c46926fabc901ffa_2-Figure1-1.png
( {pdf_hash}_{fig_uri}
).
يرجى ملء هذا النموذج للوصول. إذا لم تكن قد تلقيت روابط إلى مجموعة البيانات بعد 5 أيام ، فيرجى الاتصال بـ [email protected] للاستفسار. في بعض الأحيان ، ينتهي الوصول إلى رسائل البريد الإلكتروني أيضًا في مربعات البريد العشوائي ، لذا يرجى التحقق من هناك أولاً قبل إرسال البريد الإلكتروني.
يرجى الاطلاع على دليل code
للرمز المرتبط بورقنا. يتضمن code/README.md
معلومات إضافية حول كيفية استخدام هذا الرمز.
إذا كنت تستخدم مجموعة البيانات هذه ، يرجى الاستشهاد:
@inproceedings{subramanian-2020-medicat,
title={{MedICaT: A Dataset of Medical Images, Captions, and Textual References}},
author={Sanjay Subramanian, Lucy Lu Wang, Sachin Mehta, Ben Bogin, Madeleine van Zuylen, Sravanthi Parasa, Sameer Singh, Matt Gardner, and Hannaneh Hajishirzi},
year={2020},
booktitle={Findings of EMNLP},
}
كل وثيقة مصدر في Medicat مرخصة بشكل مختلف. تحتوي المقالات المدرجة في Medicat على تراخيص وصول مفتوحة (انظر CC و UPW) أو في المجال العام. يتم توفير ترخيص كل مقالة في الإدخال المرتبط في مجموعة البيانات. يرجى الالتزام بهذه التراخيص عند استخدام. تتوفر مجموعة بيانات Medicat للاستخدام غير التجاري فقط.
البريد الإلكتروني: {sanjays, lucyw}@allenai.org