Un cadre génératif pour relier les modèles basés sur les données et les théories scientifiques en neurosciences du langage (arXiv 2024)
Expliquer les modules de texte boîte noire en langage naturel avec des modèles de langage (arXiv 2023)
Ce référentiel contient du code pour reproduire les expériences de l'article GEM-V et de l'article SASC. SASC prend en charge un module de texte et en produit une explication naturelle qui décrit les types d'entrées qui suscitent la plus grande réponse du module (voir la figure ci-dessous). Les tests GEM-V testent cela en détail dans un contexte IRMf.
SASC est similaire au joli article concurrent d'OpenAI, mais simplifie les explications pour décrire la fonction plutôt que de produire des activations au niveau du jeton. Cela le rend plus simple/plus rapide et le rend plus efficace pour décrire les fonctions sémantiques à partir de données limitées (par exemple les voxels IRMf) mais moins bon pour trouver des modèles qui dépendent des séquences/de l'ordre.
Pour une interface scikit-learn simple permettant d'utiliser SASC, utilisez la bibliothèque imodelsX. Installez avec pip install imodelsx
, puis ci-dessous montre un exemple de démarrage rapide.
depuis imodelsx import expliquer_module_sasc# un module de jouet qui répond à la longueur d'une chaînemod = lambda str_list : np.array([len(s) for s in str_list])# un ensemble de données de jouet où les chaînes les plus longues sont des animauxtext_str_list = ["red" , "bleu", "x", "1", "2", "hippopotame", "éléphant", "rhinocéros"]explanation_dict = expliquer_module_sasc(text_str_list,mod,ngrams=1, )
Voir les expériences IRMf associées
Construit à partir de ce modèle
@misc{antonello2024generativeframeworkbridgedatadriven, title={Un cadre génératif pour relier les modèles basés sur les données et les théories scientifiques en neurosciences du langage}, author={Richard Antonello et Chandan Singh et Shailee Jain et Aliyah Hsu et Jianfeng Gao et Bin Yu et Alexander Huth}, année={2024}, eprint={2410.00812}, archivePrefix={arXiv}, PrimaryClass={cs.CL} , url={https://arxiv.org/abs/2410.00812}, }@misc{singh2023explaining, title={Expliquer les modules de texte en boîte noire en langage naturel avec des modèles de langage}, author={Chandan Singh et Aliyah R. Hsu et Richard Antonello et Shailee Jain et Alexander G. Huth et Bin Yu et Jianfeng Gao}, année={2023}, eprint={2305.09863}, archivePrefix={arXiv}, PrimaryClass={ cs.AI} }