Medicat adalah dataset dari gambar medis, keterangan, anotasi sub-subkapsi, dan referensi tekstual inline. Instruksi untuk akses disediakan di sini.
Angka dan keterangan diekstraksi dari artikel akses terbuka di PubMed Central dan teks referensi yang sesuai berasal dari S2ORC.
Dataset terdiri dari:
Sampel data tersedia dalam sample/
.
Contoh Entri Data:
{
"pdf_hash": "57c9ad0f4aab133f96d40992c46926fabc901ffa",
"fig_key": "Figure1",
"fig_uri": "2-Figure1-1.png",
"s2_caption": "Figure 1. (A) Barium enema and (B) endoscopic image of the high-grade distal colonic obstruction caused by a 5-cm anastomotic stricture.",
"s2orc_caption": "Figure 1. (A) Barium enema and (B) endoscopic image of the high-grade distal colonic obstruction caused by a 5-cm anastomotic stricture.",
"s2orc_references": [
"Computed tomography (CT) showed a distal large bowel obstruction, and a barium enema revealed a high-grade stenosis proximal to the anastomotic site in the recto-sigmoid region (Figure 1 ).",
"Flexible sigmoidoscopy revealed a tight, fibrotic, benign-appearing anastomotic stricture 15 cm from the anal verge ( Figure 1) ."
],
"radiology": false,
"scope": true,
"predicted_type": "Medical images",
"oa_info": {
"doi": "10.14309/crj.2014.54",
"doi_url": "https://doi.org/10.14309/crj.2014.54",
"oa": {
"is_oa": true,
"oa_status": "gold",
"journal_is_oa": true,
"journal_is_in_doaj": true,
"license": "cc-by-nc-nd",
"provenance": "unpaywall"
}
}
}
Gambar yang sesuai terletak di figures/57c9ad0f4aab133f96d40992c46926fabc901ffa_2-Figure1-1.png
( {pdf_hash}_{fig_uri}
).
Harap isi formulir ini untuk akses. Jika Anda belum menerima tautan ke dataset setelah 5 hari, silakan hubungi [email protected] untuk menanyakan. Terkadang email akses juga berakhir di kotak spam, jadi silakan periksa di sana terlebih dahulu sebelum mengirim email.
Silakan lihat direktori code
untuk kode yang terkait dengan makalah kami. code/README.md
menyertakan informasi tambahan tentang bagaimana Anda dapat menggunakan kode ini.
Jika menggunakan dataset ini, silakan kutip:
@inproceedings{subramanian-2020-medicat,
title={{MedICaT: A Dataset of Medical Images, Captions, and Textual References}},
author={Sanjay Subramanian, Lucy Lu Wang, Sachin Mehta, Ben Bogin, Madeleine van Zuylen, Sravanthi Parasa, Sameer Singh, Matt Gardner, and Hannaneh Hajishirzi},
year={2020},
booktitle={Findings of EMNLP},
}
Setiap dokumen sumber dalam Medicat dilisensikan secara berbeda. Artikel yang termasuk dalam Medicat memiliki lisensi akses terbuka (lihat CC dan UPW) atau berada di domain publik. Lisensi untuk setiap artikel disediakan dalam entri terkait dalam dataset. Harap patuhi lisensi ini saat menggunakan. Dataset Medicat hanya tersedia untuk penggunaan non-komersial saja.
Email: {sanjays, lucyw}@allenai.org