自然语言处理项目&工具库&资源大全,划分子领域版块汇集梳理,每周自动更新
本资源清单包含100个python自然语言处理相关的项目&工具库&资源,这些资源总共分成11个不同的子板块,这些项目目前在github上已经收到180K个点赞。所有的工具资源每周会自动从GitHub和工具维护平台采集信息,并更新梳理展示。本清单参考best-of模板完成,欢迎大家提PR丰富本清单。
facebookresearch-fastText24K · Code facebookresearch的fastText工具库 by @facebookresearch | text_classification(brightmart)7.4K · Code brightmart实现的多种中文文本分类模型 by @brightmart | facebookresearch-pytext6.3K · Code facebookresearch的pytext工具库 by @facebookresearch |
PaddleNLP5.2K · Code PaddlePaddle NLP工具库 by @PaddlePaddle | Paddle-ERNIE5.1K · Code PaddlePaddle实现的ERNIE by @PaddlePaddle | Chinese-Text-Classification-Pytorch3.8K · Code Pytorch实现的多种中文文本分类模型 by @649453932 |
Bert-Chinese-Text-Classification-Pytorch2.5K · Code Pytorch实现的基于transformer/BERT的中文文本分类模型 by @649453932 | Text_Classification1.6K · Code kk7nc Text_Classification by @kk7nc | NeuralNLP-NeuralClassifier(Tencent)1.4K · Code 腾讯文本分类开源项目,包含多种模型实现和完整模型构建流程 by @Tencent |
pytorch-sentiment-analysis3.6K · Code pytorch实现的情感分析建模 by @bentrevett | Aspect-Based-Sentiment-Analysis1.6K · Code 基于不同粒度的图卷积网络情感分析实现。 by @songyouwei | baidu-Senta1.6K · Code 百度的Senta情感分析项目 by @baidu |
BDCI2019-Sentiment-classification440 · Code BDCI2019情感分析比赛第1名方案 by @cxy229 | Customer_Satisfaction_Analysis330 · Code 消费者满意度分析建模 by @CarryChang | chinese-customer-review34 · Code 中文点评网站评论数据 by @lsvih |
Chinese-DeepNER700 · Code 深度学习命名实体识别项目 by @z814081807 | BERT-for-Sequence-Labeling-and-Text-Classification410 · Code 基于bert的序列标注与文本分类 by @yuanxiaosc | sequence_tagging390 · Code 序列标注实现 by @qiufengyuyi |
Macadam300 · Code Macadam是一个以Tensorflow(Keras)和bert4keras为基础,专注于文本分类、序列标注和关系抽取的自然语言处理工具包。 by @yongzhuo | seq2annotation80 · Code 序列标注的实现方案 by @howl-anderson |
DeepPavlov5.8K · Code 深度学习端到端的对话系统 by @deepmipt | haystack5.2K · Code 端到端的深度学习问答检索系统 by @deepset-ai | baidu-AnyQ2.4K · Code 百度的AnyQ高频问题检索式问答系统 by @baidu |
Chatbot_CN1.1K · Code 基于金融-司法领域(兼有闲聊性质)的聊天机器人 by @charlesXu86 | Chinese-Chatbot-PyTorch670 · Code 基于pytorch实现的对话机器人 by @Doragd | 58-qa_match310 · Code 58的匹配型问答系统实现 by @wuba |
pytorch-question-answering240 · Code pytorch问答系统实现 by @kushalj001 | gpt2-bert-reddit-bot180 · Code 基于gpt2和bert的reddit问答机器人实现 by @lots-of-things |
ASRT_SpeechRecognition5.7K · Code 基于深度学习的中文语音识别系统 by @nl8590687 | TensorFlowTTS2.8K · Code tensorflow实现的文本转语音项目 by @TensorSpeech | NVIDIA-waveglow2K · Code NVIDIA的waveglow语音合成项目 by @NVIDIA |
TransformerTTS920 · Code 基于transformer的tts文本转语音实现 by @as-ideas | noisereduce720 · Code 智能降噪项目 by @timsainb | Speech-Transformer690 · Code Speech-Transformer语音识别项目 by @kaituoxu |
Multilingual_Text_to_Speech580 · Code 多语言文本转语音实现 by @Tomiinek | inaSpeechSegmenter520 · Code 语音智能分割项目 by @ina-foss | Speech-enhancement390 · Code 语音增强项目 by @vbelz |
OpenTransformer310 · Code 基于transformer的语音识别 by @ZhengkunTian | tacotron2100 · Code tacotron2语音合成项目 by @ide8 |
QASystemOnMedicalKG4.2K · Code 医疗知识图谱构建与问答推理 by @liuhuanyong | KnowledgeGraphData4.1K · Code 知识图谱数据集合 by @ownthink | awesome-knowledge-graph3.4K · Code awesome知识图谱资料 by @husthuke |
Agriculture_KnowledgeGraph3.2K · Code 农业知识图谱项目 by @qq547276542 | KnowledgeGraphCourse3K · Code 东南大学知识图谱课程 by @npubird | Financial-Knowledge-Graphs1.9K · Code 金融知识图谱项目 by @jm199504 |
stock-knowledge-graph1.6K · Code 股票金融知识图谱项目 by @lemonhu | knowledge-graphs1.3K · Code 知识图谱 by @shaoxiongji | NLP-Knowledge-Graph1.2K · Code NLP知识图谱资料 by @lihanghang |
QASystemOnMedicalGraph860 · Code 基于医疗知识图谱的问答系统 by @zhihao-chen |
GPT2-Chinese5.2K · Code GPT2中文生成 by @Morizeyao | texar2.3K · Code texar NLP工具库,可用于文本生成 by @asyml | gpt2-ml1.4K · Code gpt2中文文本生成 by @imcaspar |
Texygen840 · Code 文本生成 by @geek-ai | texar-pytorch720 · Code texar的pytorch实现 by @asyml | transformer-xl-chinese610 · Code transformer-xl中文文本生成 by @GaoPeng97 |
awesome-text-generation460 · Code awesome文本生成资料 by @ChenChengKuan | aichpoem160 · Code 诗歌生成 by @wangjiezju1988 | CoupletAI140 · Code AI对联生成 by @WiseDoge |
gpt-2-poetry84 · Code gpt2诗歌生成 by @kylemcdonald | QueryGeneration83 · Code 基于深度学习的相似问题生成 by @YunwenTechnology |
awesome-text-summarization1.2K · Code awesome文本摘要生成资料 by @icoxfog417 | bert-extractive-summarizer1K · Code 基于bert的抽取式文本摘要生成 by @dmmiller612 | GPT2-NewsTitle690 · Code GPT2新闻标题自动生成 by @liucongg |
Text-Summarization-Papers460 · Code 文本总结与摘要生成相关论文 by @neulab | seq2seq-summarizer350 · Code seq2seq文本摘要生成 by @ymfa | GPT2-Summary290 · Code GPT2文本摘要生成 by @qingkongzhiqian |
Bart_T5-summarization150 · Code 基于Bart-T5的文本摘要生成 by @renatoviolin | TranSummar130 · Code 基于transformer的抽取式文本摘要生成 by @lipiji | nnsum100 · Code 基于深度学习的文本总结 by @kedz |
Neural-Abstractive-Text-Summarization100 · Code LeafNATS文本摘要生成框架 by @tshi04 |
mt-dnn2K · Code 基于多任务深度学习网络的文本理解 by @namisan | Adversarial-Training-for-Natural-Language-Understanding230 · Code 基于对抗训练(Adversarial Training)的文本理解实现 by @zhuchen03 | microsoft-Natural-Language-Understanding120 · Code 基于多任务深度学习网络的文本理解(微软) by @microsoft |
capsule-mrc88 · Code 基于capsule的观点型阅读理解模型 by @freefuiiismyname |
sktime5.6K · Code scikit机器学习时间序列预估 by @alan-turing-institute | neural_prophet2.5K · Code 基于神经网络的prophet时间序列预估 by @ourownstory | pytorch-forecasting2.2K · Code pytorch时序预估 by @jdb78 |
pytorch-ts740 · Code 基于pytorch的时间序列预估 by @zalandoresearch | transformer-time-series-prediction610 · Code 基于transformer的时间序列预估 by @oliverguhr | DeepLearning-For-Time-Series-Forecasting560 · Code 微软深度学习时间序列预估实现 by @Azure |
sktime-dl560 · Code scikit深度学习时间序列分类与回归 by @sktime | awesome-time-series510 · Code awesome时间序列预估资料 by @cuge1995 | Deep-Time-Series-Prediction380 · Code 深度学习时间序列预估 by @EvilPsyCHo |
scikit-hts200 · Code scikit层次化时间序列预估库 by @carlomazzaferro |
tensorflow-nmt6.1K · Code tensorflow神经网络机器翻译库 by @tensorflow | OpenNMT-py5.7K · Code OpenNMT神经网络机器翻译库 by @OpenNMT | facebookresearch-UnsupervisedMT1.5K · Code FacebookResearch的无监督机器翻译库 by @facebookresearch |
OpenNMT-tf1.3K · Code OpenNMT神经网络机器翻译库(tensorflow版本) by @OpenNMT | nematus780 · Code nematus神经网络机器翻译库 by @EdinburghNLP | translators760 · Code 机器翻译库 by @UlionTse |
EasyNMT610 · Code EasyNMT神经网络机器翻译库 by @UKPLab | joeynmt560 · Code 神经网络机器翻译 by @joeynmt |
MatchZoo3.7K · Code 包含多种文本匹配模型的MatchZoo库 by @NTMC-Community | awesome-neural-models-for-semantic-match750 · Code awesome神经网络语义匹配资料 by @NTMC-Community | text_matching620 · Code 文本匹配模型实现 by @terrifyzhao |
TextMatch580 · Code TextMatch文本匹配实现 by @zhaogaofeng611 | eBay-Sequence-Semantic-Embedding450 · Code eBay的序列语义embedding工具库 by @eBay | deepmatcher440 · Code 深度学习文本匹配库 by @anhaidgroup |
alibaba-simple-effective-text-matching330 · Code ACL2019论文“简单高效文本匹配”实现 by @alibaba-edu | alibaba-simple-effective-text-matching-pytorch270 · Code ACL2019论文“简单高效文本匹配”实现(pytorch版本) by @alibaba-edu | Semantic-Search100 · Code 语义检索系统 by @renatoviolin |