Medicat은 의료 이미지, 캡션, 하위 포지셔닝 주석 및 인라인 텍스트 참조의 데이터 세트입니다. 액세스 지침은 여기에 제공됩니다.
그림과 캡션은 PubMed Central의 Open Access 기사에서 추출되며 해당 참조 텍스트는 S2ORC에서 파생됩니다.
데이터 세트는 다음으로 구성됩니다.
데이터 샘플은 sample/
에서 사용할 수 있습니다.
예제 데이터 입력 :
{
"pdf_hash": "57c9ad0f4aab133f96d40992c46926fabc901ffa",
"fig_key": "Figure1",
"fig_uri": "2-Figure1-1.png",
"s2_caption": "Figure 1. (A) Barium enema and (B) endoscopic image of the high-grade distal colonic obstruction caused by a 5-cm anastomotic stricture.",
"s2orc_caption": "Figure 1. (A) Barium enema and (B) endoscopic image of the high-grade distal colonic obstruction caused by a 5-cm anastomotic stricture.",
"s2orc_references": [
"Computed tomography (CT) showed a distal large bowel obstruction, and a barium enema revealed a high-grade stenosis proximal to the anastomotic site in the recto-sigmoid region (Figure 1 ).",
"Flexible sigmoidoscopy revealed a tight, fibrotic, benign-appearing anastomotic stricture 15 cm from the anal verge ( Figure 1) ."
],
"radiology": false,
"scope": true,
"predicted_type": "Medical images",
"oa_info": {
"doi": "10.14309/crj.2014.54",
"doi_url": "https://doi.org/10.14309/crj.2014.54",
"oa": {
"is_oa": true,
"oa_status": "gold",
"journal_is_oa": true,
"journal_is_in_doaj": true,
"license": "cc-by-nc-nd",
"provenance": "unpaywall"
}
}
}
해당 그림은 figures/57c9ad0f4aab133f96d40992c46926fabc901ffa_2-Figure1-1.png
( {pdf_hash}_{fig_uri}
}에 위치합니다.
액세스를 위해이 양식을 작성하십시오. 5 일 후에 데이터 세트에 대한 링크를받지 못한 경우 [email protected]에 문의하십시오. 때때로 액세스 전자 메일도 스팸 상자에 들어가므로 이메일을 보내기 전에 먼저 확인하십시오.
당사와 관련된 코드의 code
디렉토리를 참조하십시오. code/README.md
에는이 코드를 사용하는 방법에 대한 추가 정보가 포함되어 있습니다.
이 데이터 세트를 사용하는 경우 다음을 인용하십시오.
@inproceedings{subramanian-2020-medicat,
title={{MedICaT: A Dataset of Medical Images, Captions, and Textual References}},
author={Sanjay Subramanian, Lucy Lu Wang, Sachin Mehta, Ben Bogin, Madeleine van Zuylen, Sravanthi Parasa, Sameer Singh, Matt Gardner, and Hannaneh Hajishirzi},
year={2020},
booktitle={Findings of EMNLP},
}
Medicat의 각 소스 문서는 다르게 라이센스가 부여됩니다. Medicat에 포함 된 기사에는 공개 액세스 라이센스 (CC 및 UPW 참조) 또는 공개 도메인에 있습니다. 각 기사에 대한 라이센스는 데이터 세트의 관련 항목에 제공됩니다. 사용시이 라이센스를 준수하십시오. Medicat 데이터 세트는 비상업적 사용 만 사용할 수 있습니다.
이메일 : {sanjays, lucyw}@allenai.org