automated explanations
1.0.0
言語神経科学におけるデータ駆動型モデルと科学理論の橋渡しをする生成フレームワーク (arXiv 2024)
言語モデルを使用した自然言語でのブラック ボックス テキスト モジュールの説明 (arXiv 2023)
このリポジトリには、GEM-V 論文と SASC 論文の実験を再現するコードが含まれています。 SASC はテキスト モジュールを取り込み、モジュールから最大の応答を引き出す入力の種類を説明する自然な説明を生成します (下図を参照)。 GEM-V テストでは、これを fMRI 設定で詳細にテストします。
SASC は OpenAI による優れた並行論文に似ていますが、トークンレベルのアクティベーションを生成するのではなく、機能を説明するために説明を簡素化しています。これにより、よりシンプル/高速になり、限られたデータ (fMRI ボクセルなど) から意味関数を記述する場合にはより効果的になりますが、シーケンス/順序に依存するパターンを見つけるのは困難になります。
SASC を使用するための単純な scikit-learn インターフェイスの場合は、imodelsX ライブラリを使用します。 pip install imodelsx
でインストールすると、以下にクイックスタートの例が表示されます。
from imodelsx import Explain_module_sasc# 文字列の長さに応答するおもちゃモジュールmod = lambda str_list: np.array([len(s) for s in str_list])# 最長の文字列が動物であるおもちゃのデータセットtext_str_list = ["red" 、「青」、「×」、「1」、「2」、「カバ」、「ゾウ」、 "rhinoceros"]explanation_dict = Explain_module_sasc(text_str_list,mod,ngrams=1, )
関連する fMRI 実験を参照
このテンプレートから構築
@misc{antonello2024generativeframeworkbridgedatadriven, title={言語神経科学におけるデータ駆動型モデルと科学理論の橋渡しをする生成フレームワーク}, author={Richard Antonello、Chandan Singh、Shailee Jain、Aliyah Hsu、Jianfeng Gao、Bin Yu、Alexander Huth}、year={2024}、eprint={2410.00812}、archivePrefix={arXiv}、primaryClass={cs.CL} 、url={https://arxiv.org/abs/2410.00812}、 }@misc{singh2023explaining, title={言語モデルを使用した自然言語のブラック ボックス テキスト モジュールの説明}, author={Chandan Singh、Aliyah R. Hsu、Richard Antonello、Shailee Jain、Alexander G. Huth、Bin Yu、Jianfeng Gao}、year={2023}、eprint={2305.09863}、archivePrefix={arXiv}、primaryClass={ cs.AI} }