自然語言處理專案&工具庫&資源大全,分割子領域版塊匯集梳理,每週自動更新
本資源清單包含100個python自然語言處理相關的項目&工具庫&資源,這些資源總共分成11個不同的子板塊,這些項目目前在github上已經收到180K個點讚。所有的工具資源每週會自動從GitHub和工具維護平台收集訊息,並更新梳理展示。本清單參考best-of範本完成,歡迎大家提PR豐富本清單。
facebookresearch-fastText24K · Code facebookresearch的fastText工具庫 by @facebookresearch | text_classification(brightmart)7.4K · Code brightmart實現的多種中文文字分類模型 by @brightmart | facebookresearch-pytext6.3K · Code facebookresearch的pytext工具庫 by @facebookresearch |
PaddleNLP5.2K · Code PaddlePaddle NLP工具庫 by @PaddlePaddle | Paddle-ERNIE5.1K · Code PaddlePaddle實現的ERNIE by @PaddlePaddle | 中文-Text-Classification-Pytorch3.8K · Code Pytorch實作的多種中文文字分類模型 by @649453932 |
Bert-Chinese-Text-Classification-Pytorch2.5K · Code Pytorch實作的基於transformer/BERT的中文文字分類模型 by @649453932 | Text_Classification1.6K · Code kk7nc Text_Classification by @kk7nc | NeuralNLP-NeuralClassifier(Tencent)1.4K · Code 騰訊文本分類開源項目,包含多種模型實作和完整模型建構流程 by @Tencent |
pytorch-sentiment-analysis3.6K · Code pytorch實現的情感分析建模 by @bentrevett | Aspect-Based-Sentiment-Analysis1.6K · Code 基於不同粒度的圖卷積網絡情感分析實現。 by @songyouwei | baidu-Senta1.6K · Code 百度的Senta情感分析項目 by @baidu |
BDCI2019-Sentiment-classification440 · Code BDCI2019情緒分析比賽第1名方案 by @cxy229 | Customer_Satisfaction_Analysis330 · Code 消費者滿意度分析建模 by @CarryChang | chinese-customer-review34 · Code 中文點評網站評論數據 by @lsvih |
Chinese-DeepNER700 · Code 深度學習命名實體辨識項目 by @z814081807 | BERT-for-Sequence-Labeling-and-Text-Classification410 · Code 基於bert的序列標註與文字分類 by @yuanxiaosc | sequence_tagging390 · Code 序列標註實現 by @qiufengyuyi |
Macadam300 · Code Macadam是一個以Tensorflow(Keras)和bert4keras為基礎,專注於文本分類、序列標註和關係抽取的自然語言處理工具包。 by @yongzhuo | seq2annotation80 · Code 序列標註的實現方案 by @howl-anderson |
DeepPavlov5.8K · Code 深度學習端到端的對話系統 by @deepmipt | haystack5.2K · Code 端到端的深度學習問答檢索系統 by @deepset-ai | baidu-AnyQ2.4K · Code 百度的AnyQ高頻問題檢索式問答系統 by @baidu |
Chatbot_CN1.1K · Code 基於金融-司法領域(兼有閒聊性質)的聊天機器人 by @charlesXu86 | 中文-Chatbot-PyTorch670 · Code 基於pytorch實現的對話機器人 by @Doragd | 58-qa_match310 · Code 58的匹配型問答系統實現 by @wuba |
pytorch-question-answering240 · Code pytorch問答系統實現 by @kushalj001 | gpt2-bert-reddit-bot180 · Code 基於gpt2和bert的reddit問答機器人實現 by @lots-of-things |
ASRT_SpeechRecognition5.7K · Code 基於深度學習的中文語音辨識系統 by @nl8590687 | TensorFlowTTS2.8K · Code tensorflow實現的文字轉語音項目 by @TensorSpeech | NVIDIA-waveglow2K · Code NVIDIA的waveglow語音合成項目 by @NVIDIA |
TransformerTTS920 · Code 基於transformer的tts文字轉語音實現 by @as-ideas | noisereduce720 · Code 智慧降噪項目 by @timsainb | Speech-Transformer690 · Code Speech-Transformer語音辨識項目 by @kaituoxu |
Multilingual_Text_to_Speech580 · Code 多語言文字轉語音實現 by @Tomiinek | inaSpeechSegmenter520 · Code 語音智慧分割項目 by @ina-foss | Speech-enhancement390 · Code 語音增強項目 by @vbelz |
OpenTransformer310 · Code 基於transformer的語音識別 by @ZhengkunTian | tacotron2100 · Code tacotron2語音合成項目 by @ide8 |
QASystemOnMedicalKG4.2K · Code 醫療知識圖譜建構與問答推理 by @liuhuanyong | KnowledgeGraphData4.1K · Code 知識圖譜資料集合 by @ownthink | awesome-knowledge-graph3.4K · Code awesome知識圖譜資料 by @husthuke |
Agriculture_KnowledgeGraph3.2K · Code 農業知識圖譜項目 by @qq547276542 | KnowledgeGraphCourse3K · Code 東南大學知識圖譜課程 by @npubird | Financial-Knowledge-Graphs1.9K · Code 金融知識圖譜項目 by @jm199504 |
stock-knowledge-graph1.6K · Code 股票金融知識圖譜項目 by @lemonhu | knowledge-graphs1.3K · Code 知識圖譜 by @shaoxiongji | NLP-Knowledge-Graph1.2K · Code NLP知識圖譜資料 by @lihanghang |
QASystemOnMedicalGraph860 · Code 基於醫療知識圖譜的問答系統 by @zhihao-chen |
GPT2-Chinese5.2K · Code GPT2中文生成 by @Morizeyao | texar2.3K · Code texar NLP工具庫,可用於文字生成 by @asyml | gpt2-ml1.4K · Code gpt2中文文字生成 by @imcaspar |
Texygen840 · Code 文字生成 by @geek-ai | texar-pytorch720 · Code texar的pytorch實現 by @asyml | transformer-xl-chinese610 · Code transformer-xl中文文字生成 by @GaoPeng97 |
awesome-text-generation460 · Code awesome文字生成資料 by @ChenChengKuan | aichpoem160 · Code 詩歌生成 by @wangjiezju1988 | CoupletAI140 · Code AI對聯生成 by @WiseDoge |
gpt-2-poetry84 · Code gpt2詩歌生成 by @kylemcdonald | QueryGeneration83 · Code 基於深度學習的相似問題生成 by @YunwenTechnology |
awesome-text-summarization1.2K · Code awesome文字摘要產生資料 by @icoxfog417 | bert-extractive-summarizer1K · Code 基於bert的抽取式文字摘要生成 by @dmmiller612 | GPT2-NewsTitle690 · Code GPT2新聞標題自動生成 by @liucongg |
Text-Summarization-Papers460 · Code 文本總結與摘要生成相關論文 by @neulab | seq2seq-summarizer350 · Code seq2seq文字摘要生成 by @ymfa | GPT2-Summary290 · Code GPT2文字摘要生成 by @qingkongzhiqian |
Bart_T5-summarization150 · Code 基於Bart-T5的文本摘要生成 by @renatoviolin | TranSummar130 · Code 基於transformer的抽取式文字摘要生成 by @lipiji | nnsum100 · Code 基於深度學習的文本總結 by @kedz |
Neural-Abstractive-Text-Summarization100 · Code LeafNATS文字摘要產生框架 by @tshi04 |
mt-dnn2K · Code 基於多任務深度學習網路的文本理解 by @namisan | Adversarial-Training-for-Natural-Language-Understanding230 · Code 基於對抗訓練(Adversarial Training)的文本理解實現 by @zhuchen03 | microsoft-Natural-Language-Understanding120 · Code 基於多工深度學習網路的文本理解(微軟) by @microsoft |
capsule-mrc88 · Code 基於capsule的觀點型閱讀理解模型 by @freefuiiismyname |
sktime5.6K · Code scikit機器學習時間序列預估 by @alan-turing-institute | neural_prophet2.5K · Code 基於神經網路的prophet時間序列預估 by @ourownstory | pytorch-forecasting2.2K · Code pytorch時序預估 by @jdb78 |
pytorch-ts740 · Code 基於pytorch的時間序列預估 by @zalandoresearch | transformer-time-series-prediction610 · Code 基於transformer的時間序列預估 by @oliverguhr | DeepLearning-For-Time-Series-Forecasting560 · Code 微軟深度學習時間序列預估實現 by @Azure |
sktime-dl560 · Code scikit深度學習時間序列分類與迴歸 by @sktime | awesome-time-series510 · Code awesome時間序列預估資料 by @cuge1995 | Deep-Time-Series-Prediction380 · Code 深度學習時間序列預估 by @EvilPsyCHo |
scikit-hts200 · Code scikit層次化時間序列預估庫 by @carlomazzaferro |
tensorflow-nmt6.1K · Code tensorflow神經網路機器翻譯庫 by @tensorflow | OpenNMT-py5.7K · Code OpenNMT神經網路機器翻譯庫 by @OpenNMT | facebookresearch-UnsupervisedMT1.5K · Code FacebookResearch的無監督機器翻譯庫 by @facebookresearch |
OpenNMT-tf1.3K · Code OpenNMT神經網路機器翻譯庫(tensorflow版本) by @OpenNMT | nematus780 · Code nematus神經網路機器翻譯庫 by @EdinburghNLP | translators760 · Code 機器翻譯庫 by @UlionTse |
EasyNMT610 · Code EasyNMT神經網路機器翻譯庫 by @UKPLab | joeynmt560 · Code 神經網路機器翻譯 by @joeynmt |
MatchZoo3.7K · Code 包含多種文字比對模型的MatchZoo函式庫 by @NTMC-Community | awesome-neural-models-for-semantic-match750 · Code awesome神經網路語義匹配資料 by @NTMC-Community | text_matching620 · Code 文字匹配模型實現 by @terrifyzhao |
TextMatch580 · Code TextMatch文字匹配實現 by @zhaogaofeng611 | eBay-Sequence-Semantic-Embedding450 · Code eBay的序列語意embedding工具庫 by @eBay | deepmatcher440 · Code 深度學習文字匹配庫 by @anhaidgroup |
alibaba-simple-effective-text-matching330 · Code ACL2019論文「簡單高效文字匹配」實現 by @alibaba-edu | alibaba-simple-effective-text-matching-pytorch270 · Code ACL2019論文「簡單高效文字匹配」實作(pytorch版本) by @alibaba-edu | Semantic-Search100 · Code 語意檢索系統 by @renatoviolin |