Un marco generativo para unir modelos basados en datos y teorías científicas en la neurociencia del lenguaje (arXiv 2024)
Explicación de módulos de texto de caja negra en lenguaje natural con modelos de lenguaje (arXiv 2023)
Este repositorio contiene código para reproducir los experimentos en el artículo GEM-V y el artículo SASC. SASC toma un módulo de texto y produce una explicación natural para él que describe qué tipos de entradas provocan la mayor respuesta del módulo (consulte la figura a continuación). Las pruebas GEM-V prueban esto en detalle en un entorno de resonancia magnética funcional.
SASC es similar al bonito artículo concurrente de OpenAI, pero simplifica las explicaciones para describir la función en lugar de producir activaciones a nivel de token. Esto lo hace más simple/rápido y más efectivo para describir funciones semánticas a partir de datos limitados (por ejemplo, vóxeles de resonancia magnética funcional), pero peor para encontrar patrones que dependen de secuencias/ordenamiento.
Para que una interfaz scikit-learn simple use SASC, use la biblioteca imodelsX. Instale con pip install imodelsx
A continuación se muestra un ejemplo de inicio rápido.
de imodelsx importa explicó_module_sasc# un módulo de juguete que responde a la longitud de una cadenamod = lambda str_list: np.array([len(s) for s in str_list])# un conjunto de datos de juguete donde las cadenas más largas son animalestext_str_list = ["rojo" , "azul", "x", "1", "2", "hipopótamo", "elefante", "rinoceronte"]explanation_dict = explicar_module_sasc(text_str_list,mod,ngrams=1, )
Ver experimentos de resonancia magnética funcional relacionados
Construido a partir de esta plantilla
@misc{antonello2024generativeframeworkbridgedatadriven, title={Un marco generativo para unir modelos basados en datos y teorías científicas en la neurociencia del lenguaje}, autor={Richard Antonello y Chandan Singh y Shailee Jain y Aliyah Hsu y Jianfeng Gao y Bin Yu y Alexander Huth}, año={2024}, eprint={2410.00812}, archivePrefix={arXiv}, PrimaryClass={cs.CL} , URL={https://arxiv.org/abs/2410.00812}, }@misc{singh2023explaining, title={Explicando módulos de texto de caja negra en lenguaje natural con modelos de lenguaje}, autor={Chandan Singh y Aliyah R. Hsu y Richard Antonello y Shailee Jain y Alexander G. Huth y Bin Yu y Jianfeng Gao}, año={2023}, eprint={2305.09863}, archivePrefix={arXiv}, PrimaryClass={ cs.AI} }