Téléchargement ICD MSMN - Téléchargement du code source ICD MSMN

ICD MSMN

Autre code source

Télécharger

CIM-MSMN

La mise en œuvre officielle de « Les synonymes de code comptent : réseau de correspondance de synonymes multiples pour le codage automatique de la CIM » [ACL 2022]

Environnement

Tous les codes sont testés sous Python 3.7, PyTorch 1.7.0. Besoin d'installer opt_einsum pour les calculs einsum. Au moins 32 Go de GPU sont nécessaires pour la formation du paramètre complet MIMIC-III.

Ensemble de données

Nous ne mettons que plusieurs échantillons pour chaque ensemble de données. Il faut obtenir des licences pour télécharger l’ensemble de données MIMIC-III. Une fois que vous avez obtenu l'ensemble de données MIMIC-III, veuillez suivre caml-mimic pour prétraiter l'ensemble de données. Vous devriez obtenir train_full.csv , test_full.csv , dev_full.csv , train_50.csv , test_50.csv , dev_50.csv après le prétraitement. Veuillez les mettre sous sample_data/mimic3 . Ensuite, vous devez utiliser preprocess/generate_data_new.ipynb pour générer un ensemble de données au format json.

Intégration de mots

Veuillez télécharger word2vec_sg0_100.model depuis LAAT. Vous devez modifier le chemin d'intégration des mots.

Utilisez notre code

MIMIC-III complet (1 GPU) :

 CUDA_VISIBLE_DEVICES=0 python main.py --n_gpu 1 --version mimic3 --combiner lstm --rnn_dim 256 --num_layers 2 --decoder MultiLabelMultiHeadLAATV2 --attention_head 4 --attention_dim 512 --learning_rate 5e-4 --train_epoch 20 --batch_size 2 --gradient_accumulation_steps 8 --xavier --main_code_loss_weight 0.0 --rdrop_alpha 5.0 --est_cls 1  --term_count 4  --sort_method random --word_embedding_path word_embedding_path

MIMIC-III complet (8 GPU) :

 NCCL_IB_DISABLE=1 CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 python -m torch.distributed.launch --nproc_per_node 8 --master_port=1212 --use_env  main.py --n_gpu 8 --version mimic3 --combiner lstm --rnn_dim 256 --num_layers 2 --decoder MultiLabelMultiHeadLAATV2 --attention_head 4 --attention_dim 512 --learning_rate 5e-4 --train_epoch 20 --batch_size 2 --gradient_accumulation_steps 1 --xavier --main_code_loss_weight 0.0 --rdrop_alpha 5.0 --est_cls 1  --term_count 4  --sort_method random --word_embedding_path word_embedding_path

MIMIC-III 50 :

 CUDA_VISIBLE_DEVICES=0 python main.py --version mimic3-50 --combiner lstm --rnn_dim 512 --num_layers 1 --decoder MultiLabelMultiHeadLAATV2 --attention_head 8 --attention_dim 512 --learning_rate 5e-4 --train_epoch 20 --batch_size 16 --gradient_accumulation_steps 1 --xavier --main_code_loss_weight 0.0 --rdrop_alpha 5.0 --est_cls 1 --term_count 8 --word_embedding_path word_embedding_path

Évaluer les points de contrôle

 python eval_model.py MODEL_CHECKPOINT

point de contrôle mimic3

point de contrôle mimic3-50

Citation

 @inproceedings{yuan-etal-2022-code,
    title = "Code Synonyms Do Matter: Multiple Synonyms Matching Network for Automatic {ICD} Coding",
    author = "Yuan, Zheng  and
      Tan, Chuanqi  and
      Huang, Songfang",
    booktitle = "Proceedings of the 60th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)",
    month = may,
    year = "2022",
    address = "Dublin, Ireland",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2022.acl-short.91",
    pages = "808--814",
    abstract = "Automatic ICD coding is defined as assigning disease codes to electronic medical records (EMRs).Existing methods usually apply label attention with code representations to match related text snippets.Unlike these works that model the label with the code hierarchy or description, we argue that the code synonyms can provide more comprehensive knowledge based on the observation that the code expressions in EMRs vary from their descriptions in ICD. By aligning codes to concepts in UMLS, we collect synonyms of every code. Then, we propose a multiple synonyms matching network to leverage synonyms for better code representation learning, and finally help the code classification. Experiments on the MIMIC-III dataset show that our proposed method outperforms previous state-of-the-art methods.",
}

Développer

Informations supplémentaires

Version
Type Autre code source
Date de mise à jour 2024-12-21
taille 50MB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Application de codage des maladies et des procédures ICD

2023-07-11
Code source du site Web Hongyun ICD

2022-06-27

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
wp functions

Autres catégories

1.0.0
termwind

Autres catégories

v2.3.0

Actualités connexes Tout