[ أرخايف | البيانات | التوثيق | دروس | استشهد ]
مرحبًا بكم في مستودع GitHub الرسمي لمكتبة HEST المقدمة في "HEST-1k: مجموعة بيانات للنسخ المكاني وتحليل الصور النسيجية"، NeurIPS Spotlight، 2024 . تم تطوير هذا المشروع من قبل مختبر محمود في كلية الطب بجامعة هارفارد ومستشفى بريجهام والنساء.
HEST-1k: وصول مجاني إلى HEST-1K ، وهي مجموعة بيانات مكونة من 1,229 عينة نسخية مكانية مقترنة مع صور شرائح كاملة ملطخة بـ HE
مكتبة HEST: سلسلة من المساعدين لتجميع عينات ST جديدة (ST، Visium، Visium HD، Xenium) والعمل مع HEST-1k (تحليل ST، تأثير الدفعة والتصحيح، وما إلى ذلك)
HEST-Benchmark: معيار جديد لتقييم الأداء التنبؤي للنماذج الأساسية لعلم الأنسجة في التنبؤ بالتعبير الجيني من التشكل
تم إصدار HEST-1k وHEST-Library وHEST-Benchmark بموجب ترخيص Attribution-NonCommercial-ShareAlike 4.0 الدولي.
21.10.24 : تم قبول HEST في NeurIPS 2024 كأحد أبرز النجوم! سنكون في فانكوفر في الفترة من 10 إلى 15 ديسمبر. أرسل لنا رسالة إذا كنت تريد معرفة المزيد عن HEST ([email protected]).
23.09.24 : تم إصدار 121 عينة جديدة، بما في ذلك 27 Xenium و7 Visium HD! نحن أيضًا نجعل نسخ Xenium المحاذاة + الخلايا/النوى المجزأة DAPI عامة.
30.08.24 : تم تحديث نتائج HEST-BENCHmark. يتضمن H-Optimus-0، وVirchow 2، وVirchow، وGigaPath. مهمة COAD جديدة تعتمد على 4 عينات من السينيوم. تم تحديث بيانات مقعد HuggingFace.
28.08.24 : مجموعة جديدة من المساعدين لتصور وتصحيح تأثير الدُفعات. البرنامج التعليمي هنا.
لتنزيل/الاستعلام عن HEST-1k، اتبع البرنامج التعليمي 1-Downloading-HEST-1k.ipynb أو اتبع الإرشادات الموجودة على Hugging Face.
ملاحظة: تزن مجموعة البيانات بأكملها أكثر من 1 تيرابايت ولكن يمكنك بسهولة تنزيل مجموعة فرعية عن طريق الاستعلام عن المعرف والعضو والأنواع...
git clone https://github.com/mahmoodlab/HEST.git cd HEST conda create -n "hest" python=3.9 conda activate hest pip install -e .
sudo apt install libvips libvips-dev openslide-tools
إذا كانت وحدة معالجة الرسومات (GPU) متاحة على جهازك، فنوصي بتثبيت cucim على بيئة conda الخاصة بك. (تم اختباره باستخدام cucim-cu12==24.4.0
و CUDA 12.1
)
pip install --extra-index-url=https://pypi.nvidia.com cudf-cu12==24.6.* dask-cudf-cu12==24.6.* cucim-cu12==24.6.* raft-dask-cu12==24.6.*
ملاحظة: تم اختبار HEST-Library فقط على أجهزة Linux/macOS، برجاء الإبلاغ عن أي أخطاء في مشكلات GitHub.
يمكنك بعد ذلك ببساطة عرض مجموعة البيانات على النحو التالي:
من hest قم باستيراد iter_hestfor st في iter_hest('../hest_data', id_list=['TENX95']):print(st)
تتيح مكتبة HEST تجميع عينات جديدة باستخدام تنسيق HEST والتفاعل مع HEST-1k. نحن نقدم اثنين من الدروس:
2-Interacting-with-HEST-1k.ipynb: التلاعب ببيانات HEST لتحميل التصحيحات. يتضمن وصفًا تفصيليًا لكل كائن scanpy.
3-Assembling-HEST-Data.ipynb: شرح تفصيلي لتحويل عينة Visum إلى HEST.
5-Batch-effect-visualization.ipynb: تصور وتصحيح تأثير الدفعة (MNN، Harmony، ComBat).
وبالإضافة إلى ذلك، نحن نقدم وثائق كاملة.
تم تصميم HEST-Benchmark لتقييم 11 نموذجًا أساسيًا لعلم الأمراض في ظل معيار جديد ومتنوع وصعب. يتضمن HEST-Benchmark تسع مهام للتنبؤ بالتعبير الجيني (50 جينًا شديد التباين) من التشكل (مناطق 112 × 112 ميكرومتر عند 0.5 ميكرومتر/بيكسل) في تسعة أعضاء مختلفة وثمانية أنواع من السرطان. نحن نقدم برنامجًا تعليميًا خطوة بخطوة لتشغيل HEST-Benchmark وإعادة إنتاج نتائجنا في 4-Running-HEST-Benchmark.ipynb.
تم استخدام HEST-Benchmark لتقييم 11 نموذجًا متاحًا للجمهور. تستند النتائج المبلغ عنها إلى انحدار ريدج مع PCA (256 عاملاً). يعاقب انحدار ريدج بشكل غير عادل النماذج ذات أبعاد التضمين الأكبر. ولضمان المقارنة العادلة والموضوعية بين النماذج، اخترنا تقليل PCA. تم قياس أداء النموذج باستخدام ارتباط بيرسون. الأفضل جريء ، والثاني أفضل تم وضع خط تحته . يتم توفير نتائج إضافية تعتمد على Random Forest وانحدار XGBoost في الورقة.
نموذج | آي دي سي | براد | باد | SKCM | كود | يقرأ | ccRCC | لود | ليمف آي دي سي | متوسط |
---|---|---|---|---|---|---|---|---|---|---|
ريسنيت50 | 0.4741 | 0.3075 | 0.3889 | 0.4822 | 0.2528 | 0.0812 | 0.2231 | 0.4917 | 0.2322 | 0.326 |
CTransPath | 0.511 | 0.3427 | 0.4378 | 0.5106 | 0.2285 | 0.11 | 0.2279 | 0.4985 | 0.2353 | 0.3447 |
فيكون | 0.5327 | 0.342 | 0.4432 | 0.5355 | 0.2585 | 0.1517 | 0.2423 | 0.5468 | 0.2373 | 0.3656 |
محارة | 0.5363 | 0.3548 | 0.4475 | 0.5791 | 0.2533 | 0.1674 | 0.2179 | 0.5312 | 0.2507 | 0.3709 |
علاج | 0.529 | 0.3471 | 0.4644 | 0.5818 | 0.2856 | 0.1145 | 0.2647 | 0.5336 | 0.2473 | 0.3742 |
جيجاباث | 0.5508 | 0.3708 | 0.4768 | 0.5538 | 0.301 | 0.186 | 0.2391 | 0.5399 | 0.2493 | 0.3853 |
UNI | 0.5702 | 0.314 | 0.4764 | 0.6254 | 0.263 | 0.1762 | 0.2427 | 0.5511 | 0.2565 | 0.3862 |
فيرشو | 0.5702 | 0.3309 | 0.4875 | 0.6088 | 0.311 | 0.2019 | 0.2637 | 0.5459 | 0.2594 | 0.3977 |
فيرشو2 | 0.5922 | 0.3465 | 0.4661 | 0.6174 | 0.2578 | 0.2084 | 0.2788 | 0.5605 | 0.2582 | 0.3984 |
UNIv1.5 | 0.5989 | 0.3645 | 0.4902 | 0.6401 | 0.2925 | 0.2240 | 0.2522 | 0.5586 | 0.2597 | 0.4090 |
هوبتيموس0 | 0.5982 | 0.385 | 0.4932 | 0.6432 | 0.2991 | 0.2292 | 0.2654 | 0.5582 | 0.2595 | 0.4146 |
سيرشد برنامجنا التعليمي في 4-Running-HEST-Benchmark.ipynb المستخدمين المهتمين بقياس نموذجهم الخاص على HEST-Benchmark.
ملاحظة: يتم تشجيع المساهمات التلقائية إذا أراد الباحثون من المجتمع تضمين نماذج جديدة. للقيام بذلك، ما عليك سوى إنشاء طلب سحب.
وضع الاتصال المفضل هو عبر مشكلات GitHub.
إذا كانت مشكلات GitHub غير مناسبة، فأرسل بريدًا إلكترونيًا [email protected]
(وcc [email protected]
).
قد لا يكون الرد الفوري على المشكلات البسيطة متاحًا.
إذا وجدت عملنا مفيدًا في بحثك، فيرجى مراعاة الاستشهاد بما يلي:
Jaume, G., Doucet, P., Song, AH, Lu, MY, Almagro-Perez, C., Wagner, SJ, Vaidya, AJ, Chen, RJ, Williamson, DFK, Kim, A., & Mahmood, F HEST-1k: مجموعة بيانات للنسخ المكاني وتحليل الصور النسيجية. التقدم في أنظمة معالجة المعلومات العصبية ، ديسمبر 2024.
@inproceedings{jaume2024hest, author = {Guillaume Jaume and Paul Doucet and Andrew H. Song and Ming Y. Lu and Cristina Almagro-Perez and Sophia J. Wagner and Anurag J. Vaidya and Richard J. Chen and Drew F. K. Williamson and Ahrong Kim and Faisal Mahmood}, title = {HEST-1k: A Dataset for Spatial Transcriptomics and Histology Image Analysis}, booktitle = {Advances in Neural Information Processing Systems}, year = {2024}, month = dec, }