TEXTOIR é a primeira plataforma de reconhecimento de intenção aberta de texto de alta qualidade. Este repositório contém um kit de ferramentas conveniente com interfaces extensíveis, integrando uma série de algoritmos de última geração de duas tarefas (detecção de intenção aberta e descoberta de intenção aberta). Também lançamos o framework do pipeline e a plataforma visualizada no repo TEXTOIR-DEMO.
TEXTOIR tem como objetivo fornecer um kit de ferramentas conveniente para pesquisadores reproduzirem os métodos abertos de classificação e agrupamento de textos relacionados. Ele contém duas tarefas, que são definidas como detecção de intenção aberta e descoberta de intenção aberta. A detecção de intenção aberta visa identificar intenções conhecidas de classe n e detectar intenção aberta de uma classe. A descoberta de intenção aberta visa aproveitar o conhecimento prévio limitado de intenções conhecidas para encontrar clusters conhecidos e abertos de baixa granularidade. Artigos e códigos relacionados são coletados em nossa lista de leituras lançada anteriormente.
Reconhecimento de intenção aberta:
Data | Anúncios |
---|---|
12/2023 | ? ? Novo artigo e SOTA em Open Intent Discovery. Consulte o diretório USNID para obter os códigos. Leia o artigo - Uma estrutura de cluster para descoberta de novas intenções não supervisionadas e semissupervisionadas (publicado no IEEE TKDE 2023). |
04/2023 | ? ? Novo artigo e SOTA em detecção de intenção aberta. Consulte o diretório DA-ADB para os códigos. Leia o artigo - Aprendendo Representações Discriminativas e Limites de Decisão para Detecção de Intenção Aberta (Publicado no IEEE/ACM TASLP 2023). |
09/2021 | ? ? A primeira plataforma integrada e visualizada para reconhecimento de intenção aberta de texto TEXTOIR foi lançada. Consulte o diretório TEXTOIR-DEMO para os códigos de demonstração. Leia nosso artigo TEXTOIR: uma plataforma integrada e visualizada para reconhecimento de intenção aberta de texto (publicado no ACL 2021). |
05/2021 | Novo artigo e linhas de base DeepAligned no Open Intent Discovery foram lançados. Leia nosso artigo Discovering New Intents with Deep Aligned Clustering (publicado na AAAI 2021). |
05/2021 | Novo artigo e linhas de base ADB em Open Intent Detection foram lançados. Leia nosso artigo Classificação de intenção aberta profunda com limite de decisão adaptativo (publicado na AAAI 2021). |
05/2020 | Novo artigo e linhas de base CDAC+ no Open Intent Discovery foram lançados. Leia nosso artigo Descobrindo novas intenções por meio de clustering adaptativo profundo e restrito com refinamento de cluster (publicado na AAAI 2020). |
07/2019 | Novo artigo e linhas de base do DeepUNK em Open Intent Detection foram lançados. Leia nosso artigo Deep Unknown Intent Detection with Margin Loss (publicado na ACL 2019). |
Recomendamos fortemente que você use nosso kit de ferramentas TEXTOIR, que possui interfaces padrão e unificadas (especialmente configuração de dados) para obter resultados justos e persuasíveis em conjuntos de dados de intenção de benchmark!
Conjuntos de dados | Fonte |
---|---|
BANCÁRIO | Papel |
OOS / CLINC150 | Papel |
StackOverflow | Papel |
Nome do modelo | Fonte | Publicado |
---|---|---|
OpenMax* | Código de papel | CVPR 2016 |
MSP | Código de papel | ICLR 2017 |
DOC | Código de papel | EMNLP 2017 |
DeepUnk | Código de papel | ACL 2019 |
SEG | Código de papel | ACL 2020 |
BAD | Código de papel | AAAI 2021 |
(K+1)-via | Código de papel | ACL 2021 |
MDF | Código de papel | ACL 2021 |
ARPL* | Código de papel | IEEE TPAMI 2022 |
KNNCL | Código de papel | ACL 2022 |
DA-ADB | Código de papel | TASLP IEEE/ACM 2023 |
Contexto | Nome do modelo | Fonte | Publicado |
---|---|---|---|
Não supervisionado | km | Papel | BSMSP 1967 |
Não supervisionado | AG | Papel | RP 1978 |
Não supervisionado | SAE-KM | Papel | JMLR 2010 |
Não supervisionado | DEZEMBRO | Código de papel | ICML 2016 |
Não supervisionado | DCN | Código de papel | ICML 2017 |
Não supervisionado | CC | Código de papel | AAAI 2021 |
Não supervisionado | SCCL | Código de papel | NAACL 2021 |
Não supervisionado | USNID | Código de papel | IEEE TKDE 2023 |
Semi-supervisionado | KCL* | Código de papel | ICLR 2018 |
Semi-supervisionado | MCL* | Código de papel | ICLR 2019 |
Semi-supervisionado | CDT* | Código de papel | ICCV 2019 |
Semi-supervisionado | CDAC+ | Código de papel | AAAI 2020 |
Semi-supervisionado | DeepAligned | Código de papel | AAAI 2021 |
Semi-supervisionado | GCD | Código de papel | CVPR 2022 |
Semi-supervisionado | MTP-CLNN | Código de papel | ACL 2022 |
Semi-supervisionado | USNID | Código de papel | IEEE TKDE 2023 |
(* denota o modelo CV substituído pelo backbone BERT)
conda create --name textoir python=3.6
conda activate textoir
conda install pytorch torchvision torchaudio cudatoolkit=11.0 -c pytorch -c conda-forge
git clone [email protected]:thuiar/TEXTOIR.git
cd TEXTOIR
cd open_intent_detection
pip install -r requirements.txt
sh examples/run_ADB.sh
Este kit de ferramentas é extensível e suporta a adição de novos métodos, conjuntos de dados, configurações, backbones, carregadores de dados e perdas de forma conveniente. Informações mais detalhadas podem ser vistas nos tutoriais dos diretórios open_intent_detection e open_intent_discovery.
Se este trabalho for útil ou se você quiser usar os códigos e resultados deste repositório, cite os seguintes artigos:
@inproceedings{zhang-etal-2021-textoir,
title = "{TEXTOIR}: An Integrated and Visualized Platform for Text Open Intent Recognition",
author = "Zhang, Hanlei and Li, Xiaoteng and Xu, Hua and Zhang, Panpan and Zhao, Kang and Gao, Kai",
booktitle = "Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: System Demonstrations",
pages = "167--174",
year = "2021",
url = "https://aclanthology.org/2021.acl-demo.20",
doi = "10.18653/v1/2021.acl-demo.20",
}
@article{DA-ADB,
title = {Learning Discriminative Representations and Decision Boundaries for Open Intent Detection},
author = {Zhang, Hanlei and Xu, Hua and Zhao, Shaojie and Zhou, Qianrui},
journal = {IEEE/ACM Transactions on Audio, Speech, and Language Processing},
volume = {31},
pages = {1611-1623},
year = {2023},
doi = {10.1109/TASLP.2023.3265203}
}
@ARTICLE{USNID,
author={Zhang, Hanlei and Xu, Hua and Wang, Xin and Long, Fei and Gao, Kai},
journal={IEEE Transactions on Knowledge and Data Engineering},
title={A Clustering Framework for Unsupervised and Semi-supervised New Intent Discovery},
year={2023},
doi={10.1109/TKDE.2023.3340732}
}
Hanlei Zhang, Shaojie Zhao, Xin Wang, Ting-En Lin, Qianrui Zhou, Huisheng Mao.
Se você tiver alguma dúvida, abra as questões e ilustre seus problemas da forma mais detalhada possível. Se você deseja integrar seu método em nosso repositório, sinta-se à vontade para fazer pull request !