[ arXiv | ข้อมูล | เอกสารประกอบ | บทช่วยสอน | อ้างอิง ]
ยินดีต้อนรับสู่พื้นที่เก็บข้อมูล GitHub อย่างเป็นทางการของ HEST-Library ที่เปิดตัวใน "HEST-1k: ชุดข้อมูลสำหรับการวิเคราะห์เชิงพื้นที่และการวิเคราะห์ภาพเนื้อเยื่อวิทยา", NeurIPS Spotlight, 2024 โครงการนี้ได้รับการพัฒนาโดย Mahmood Lab ที่ Harvard Medical School และ Brigham and Women's Hospital
HEST-1k: เข้าถึง HEST-1K ฟรี ซึ่งเป็นชุดข้อมูลตัวอย่าง Spatial Transcriptomics ที่จับคู่ไว้ 1,229 ตัวอย่างพร้อมภาพสไลด์ทั้งสีที่ย้อมด้วย HE
HEST-Library: ชุดตัวช่วยในการประกอบตัวอย่าง ST ใหม่ (ST, Visium, Visium HD, Xenium) และทำงานร่วมกับ HEST-1k (การวิเคราะห์ ST, เอฟเฟกต์แบบกลุ่ม ได้แก่ และการแก้ไข ฯลฯ)
HEST-Benchmark: เกณฑ์มาตรฐานใหม่ในการประเมินประสิทธิภาพการทำนายของแบบจำลองพื้นฐานสำหรับเนื้อเยื่อวิทยาในการทำนายการแสดงออกของยีนจากสัณฐานวิทยา
HEST-1k, HEST-Library และ HEST-Benchmark ได้รับการเผยแพร่ภายใต้ใบอนุญาต Attribution-NonCommercial-ShareAlike 4.0 International
21.10.24 : HEST ได้รับการยอมรับให้เข้าร่วม NeurIPS 2024 ในฐานะ Spotlight! เราจะไปแวนคูเวอร์ตั้งแต่วันที่ 10 ถึง 15 ธันวาคม ส่งข้อความถึงเราหากคุณต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ HEST ([email protected])
23.09.24 : เปิดตัวตัวอย่างใหม่ 121 รายการ รวมถึง Xenium 27 รายการ และ Visium HD 7 รายการ! นอกจากนี้เรายังสร้างการถอดเสียง Xenium ที่สอดคล้อง + เซลล์ / นิวเคลียสที่แบ่งส่วน DAPI ที่จัดแนวให้เป็นสาธารณะ
30.08.24 : อัปเดตผลลัพธ์ HEST-Benchmark แล้ว ประกอบด้วย H-Optimus-0, Virchow 2, Virchow และ GigaPath งาน COAD ใหม่ตามตัวอย่าง Xenium 4 รายการ ข้อมูลม้านั่ง HuggingFace ได้รับการอัปเดตแล้ว
28.08.24 : ชุดตัวช่วยใหม่สำหรับการแสดงภาพและการแก้ไขเอฟเฟกต์แบบแบตช์ บทช่วยสอนที่นี่
หากต้องการดาวน์โหลด/สอบถาม HEST-1k ให้ทำตามบทช่วยสอน 1-Downloading-HEST-1k.ipynb หรือทำตามคำแนะนำบน Hugging Face
หมายเหตุ: ชุดข้อมูลทั้งหมดมีน้ำหนักมากกว่า 1TB แต่คุณสามารถดาวน์โหลดชุดย่อยได้อย่างง่ายดายโดยการสืบค้นตามรหัส อวัยวะ สายพันธุ์...
git clone https://github.com/mahmoodlab/HEST.git cd HEST conda create -n "hest" python=3.9 conda activate hest pip install -e .
sudo apt install libvips libvips-dev openslide-tools
หากมี GPU บนเครื่องของคุณ เราขอแนะนำให้ติดตั้ง cucim บนสภาพแวดล้อม conda ของคุณ (ทดสอบด้วย cucim-cu12==24.4.0
และ CUDA 12.1
)
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12==24.6.* dask-cudf-cu12==24.6.* cucim-cu12==24.6.* raft-dask-cu12==24.6.*
หมายเหตุ: HEST-Library ได้รับการทดสอบบนเครื่อง Linux/macOS เท่านั้น โปรดรายงานจุดบกพร่องในปัญหา GitHub
จากนั้นคุณสามารถดูชุดข้อมูลเป็น
จาก hest นำเข้า iter_hestfor st ใน iter_hest('../hest_data', id_list=['TENX95']):print(st)
HEST-Library อนุญาตให้ รวบรวม ตัวอย่างใหม่โดยใช้รูปแบบ HEST และ โต้ตอบ กับ HEST-1k เรามีบทช่วยสอนสองแบบ:
2-Interacting-with-HEST-1k.ipynb: เล่นกับข้อมูล HEST เพื่อโหลดแพตช์ รวมคำอธิบายโดยละเอียดของวัตถุสแกนแต่ละรายการ
3-Assembling-HEST-Data.ipynb: บทสรุปเพื่อแปลงตัวอย่าง Visum ให้เป็น HEST
5-Batch-effect-visualization.ipynb: การสร้างภาพและการแก้ไขเอฟเฟกต์แบบแบตช์ (MNN, Harmony, ComBat)
นอกจากนี้เรายังจัดเตรียมเอกสารให้ครบถ้วน
HEST-Benchmark ได้รับการออกแบบมาเพื่อประเมินแบบจำลองพื้นฐาน 11 แบบสำหรับพยาธิวิทยาภายใต้เกณฑ์มาตรฐานใหม่ หลากหลาย และท้าทาย HEST-Benchmark ประกอบด้วยงานเก้างานสำหรับการทำนายการแสดงออกของยีน (ยีนที่มีความหลากหลายสูง 50 ยีน) จากสัณฐานวิทยา (บริเวณ 112 x 112 um ที่ 0.5 um/px) ในอวัยวะที่แตกต่างกันเก้าแบบและมะเร็งแปดประเภท เรามีบทช่วยสอนทีละขั้นตอนเพื่อเรียกใช้ HEST-Benchmark และสร้างผลลัพธ์ของเราใหม่ใน 4-Running-HEST-Benchmark.ipynb
HEST-Benchmark ใช้เพื่อประเมินโมเดล 11 แบบที่เปิดเผยต่อสาธารณะ ผลลัพธ์ที่รายงานจะขึ้นอยู่กับ Ridge Regression ด้วย PCA (256 ปัจจัย) การถดถอยแบบริดจ์จะลงโทษโมเดลที่มีขนาดการฝังที่ใหญ่กว่าอย่างไม่ยุติธรรม เพื่อให้มั่นใจว่ามีการเปรียบเทียบระหว่างรุ่นต่างๆ อย่างยุติธรรมและเป็นกลาง เราจึงเลือกใช้การลด PCA ประสิทธิภาพของแบบจำลองที่วัดด้วยความสัมพันธ์แบบเพียร์สัน ดีที่สุดคือ ตัวหนา ดีที่สุดรองคือ ขีดเส้นใต้ ผลลัพธ์เพิ่มเติมตามการถดถอยแบบสุ่มของฟอเรสต์และการถดถอย XGBoost มีอยู่ในบทความนี้
แบบอย่าง | ไอดีซี | ปราด | พล.อ | เอสเคซีเอ็ม | COAD | อ่าน | ซีซีอาร์ซีซี | ลุด | ลิมฟ ไอดีซี | เฉลี่ย |
---|---|---|---|---|---|---|---|---|---|---|
เรสเน็ต50 | 0.4741 | 0.3075 | 0.3889 | 0.4822 | 0.2528 | 0.0812 | 0.2231 | 0.4917 | 0.2322 | 0.326 |
ซีทรานส์พาธ | 0.511 | 0.3427 | 0.4378 | 0.5106 | 0.2285 | 0.11 | 0.2279 | 0.4985 | 0.2353 | 0.3447 |
พิกล | 0.5327 | 0.342 | 0.4432 | 0.5355 | 0.2585 | 0.1517 | 0.2423 | 0.5468 | 0.2373 | 0.3656 |
สังข์ | 0.5363 | 0.3548 | 0.4475 | 0.5791 | 0.2533 | 0.1674 | 0.2179 | 0.5312 | 0.2507 | 0.3709 |
เรเมดิส | 0.529 | 0.3471 | 0.4644 | 0.5818 | 0.2856 | 0.1145 | 0.2647 | 0.5336 | 0.2473 | 0.3742 |
กิกะพาธ | 0.5508 | 0.3708 | 0.4768 | 0.5538 | 0.301 | 0.186 | 0.2391 | 0.5399 | 0.2493 | 0.3853 |
ยูนิ | 0.5702 | 0.314 | 0.4764 | 0.6254 | 0.263 | 0.1762 | 0.2427 | 0.5511 | 0.2565 | 0.3862 |
เวอร์โชว | 0.5702 | 0.3309 | 0.4875 | 0.6088 | 0.311 | 0.2019 | 0.2637 | 0.5459 | 0.2594 | 0.3977 |
เวอร์โชว2 | 0.5922 | 0.3465 | 0.4661 | 0.6174 | 0.2578 | 0.2084 | 0.2788 | 0.5605 | 0.2582 | 0.3984 |
ยูนิฟ1.5 | 0.5989 | 0.3645 | 0.4902 | 0.6401 | 0.2925 | 0.2240 | 0.2522 | 0.5586 | 0.2597 | 0.4090 |
ฮอปติมัส0 | 0.5982 | 0.385 | 0.4932 | 0.6432 | 0.2991 | 0.2292 | 0.2654 | 0.5582 | 0.2595 | 0.4146 |
บทช่วยสอนของเราใน 4-Running-HEST-Benchmark.ipynb จะแนะนำผู้ใช้ที่สนใจในการเปรียบเทียบโมเดลของตนเองบน HEST-Benchmark
หมายเหตุ: เราสนับสนุนการมีส่วนร่วมโดยธรรมชาติหากนักวิจัยจากชุมชนต้องการรวมโมเดลใหม่ๆ ในการทำเช่นนั้น เพียงสร้าง Pull Request
โหมดการสื่อสารที่ต้องการคือผ่านปัญหา GitHub
หากปัญหา GitHub ไม่เหมาะสม โปรดส่งอีเมลไป [email protected]
(และ cc [email protected]
)
อาจไม่สามารถตอบสนองต่อปัญหาเล็กๆ น้อยๆ ได้ในทันที
หากคุณพบว่างานของเรามีประโยชน์ในการวิจัยของคุณ โปรดพิจารณาการอ้างอิง:
Jaume, G., Doucet, P., Song, AH, Lu, MY, Almagro-Perez, C., Wagner, SJ, Vaidya, AJ, Chen, RJ, Williamson, DFK, Kim, A., & Mahmood, F HEST-1k: ชุดข้อมูลสำหรับการวิเคราะห์ภาพเชิงพื้นที่และเนื้อเยื่อวิทยา ความก้าวหน้าในระบบประมวลผลข้อมูลประสาท ธันวาคม 2024
@inproceedings{jaume2024hest, author = {Guillaume Jaume and Paul Doucet and Andrew H. Song and Ming Y. Lu and Cristina Almagro-Perez and Sophia J. Wagner and Anurag J. Vaidya and Richard J. Chen and Drew F. K. Williamson and Ahrong Kim and Faisal Mahmood}, title = {HEST-1k: A Dataset for Spatial Transcriptomics and Histology Image Analysis}, booktitle = {Advances in Neural Information Processing Systems}, year = {2024}, month = dec, }