Download PCPM - Download do código-fonte PCPM

PCPM

Código-Fonte de IA

1.0.0

Baixar

PCPM

Apresentando C orpus de Modelos P retreinados. Links para modelos pré-treinados em PNL e voz com roteiro de treinamento.

Com o rápido progresso na PNL, está se tornando mais fácil inicializar um projeto de aprendizado de máquina envolvendo texto. Em vez de começar com um código base, agora é possível começar com um modelo básico pré-treinado e, em algumas iterações, obter desempenho SOTA. Este repositório é feito pensando que modelos pré-treinados minimizam o esforço humano coletivo e o custo de recursos, acelerando assim o desenvolvimento na área.

Os modelos listados são selecionados para pytorch ou tensorflow devido ao seu amplo uso.

Nota: pytorch-transofmers é uma biblioteca incrível que pode ser usada para inferir/ajustar rapidamente a partir de muitos modelos pré-treinados em PNL. Os modelos pré-treinados deles não estão incluídos aqui.

Conteúdo

Modelos de ML de texto
Modelos de fala para texto
Conjuntos de dados
Salão da Vergonha
Modelos não ingleses
Outras coleções

Texto ML

Modelos de Linguagem

Nome	Link	Treinado em	Roteiro de treinamento
Transformador-xl	https://github.com/kimiyoung/transformer-xl/tree/master/tf#obtain-and-evaluate-pretrained-sota-models	`enwik8` , `lm1b` , `wt103` , `text8`	https://github.com/kimiyoung/transformer-xl
GPT-2	https://github.com/openai/gpt-2/blob/master/download_model.py	`webtext`	https://github.com/nshepperd/gpt-2/
Entradas adaptativas (fairseq)	https://github.com/pytorch/fairseq/blob/master/examples/language_model/README.md#pre-trained-models	`lm1b`	https://github.com/pytorch/fairseq/blob/master/examples/linguagem_model/README.md

Baseado em modelagem de linguagem de permutação - XLNet

Nome	Link	Treinado em	Roteiro de treinamento
XLNet	https://github.com/zihangdai/xlnet/#released-models	`booksCorpus` + `English Wikipedia` + `Giga5` + `ClueWeb 2012-B` + `Common Crawl`	https://github.com/zihangdai/xlnet/

Baseado em modelagem de linguagem mascarada - Bert

Nome	Link	Treinado em	Roteiro de treinamento
RoBERTa	https://github.com/pytorch/fairseq/tree/master/examples/roberta#pre-trained-models	livrosCorpus+CC-N EWS+OpenWebText+CommonCrawl-Stories	https://github.com/huggingface/transformers
BERTO	https://github.com/google-research/bert/	livrosCorpus+Wikipedia em inglês	https://github.com/huggingface/transformers
MT-DNN	https://mrc.blob.core.windows.net/mt-dnn-model/mt_dnn_base.pt (https://github.com/namisan/mt-dnn/blob/master/download.sh)	cola	https://github.com/namisan/mt-dnn

Tradução automática

Nome	Link	Treinado em	Roteiro de treinamento
OpenNMT	http://opennmt.net/Models-py/ (pytorch) http://opennmt.net/Models-tf/ (tensorflow)	Inglês-Alemão	https://github.com/OpenNMT/OpenNMT-py
Fairseq (vários modelos)	https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md#pre-trained-models	WMT14 Inglês-Francês, WMT16 Inglês-Alemão	https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md

Sentimento

Nome	Link	Treinado em	Roteiro de treinamento
Descoberta de sentimento da Nvidia	https://github.com/NVIDIA/sentiment-discovery#pretrained-models	SST, imdb, Semeval-2018-tweet-emoção	https://github.com/NVIDIA/sentiment-discovery
Sentimento MT-DNN	https://drive.google.com/open?id=1-ld8_WpdQVDjPeYhb3AK8XYLGlZEbs-l	TSM	https://github.com/namisan/mt-dnn

Compreensão de leitura

ESQUADRÃO 1.1

Classificação	Nome	Link	Roteiro de treinamento
49	BiDaf	https://s3-us-west-2.amazonaws.com/allennlp/models/bidaf-model-2017.09.15-charpad.tar.gz	https://github.com/allenai/allennlp

Resumo

Modelo para resumo em inglês

Nome	Link	Treinado em	Roteiro de treinamento
OpenNMT	http://opennmt.net/Models-py/	Padrão gigaword	https://github.com/OpenNMT/OpenNMT-py

Fala para Texto

Nome	Link	Treinado em	Roteiro de treinamento
NeMo-quartznet	https://ngc.nvidia.com/catalog/models/nvidia:quartznet15x5	librispeech,mozilla-common-voice	https://github.com/NVIDIA/NeMo
OpenSeq2Seq-Jasper	https://nvidia.github.io/OpenSeq2Seq/html/speech-recognition.html#models	librispeech	https://github.com/NVIDIA/OpenSeq2Seq
Espnet	https://github.com/espnet/espnet#asr-results	librispeech,Aishell,HKUST,TEDLIUM2	https://github.com/espnet/espnet
wav2letra++	https://talonvoice.com/research/	librispeech	https://github.com/facebookresearch/wav2letter
Deepspeech2 pytorch	SeanNaren/deepspeech.pytorch#299 (comentário)	librispeech	https://github.com/SeanNaren/deepspeech.pytorch
Fala Profunda	https://github.com/mozilla/DeepSpeech#getting-the-pre-trained-model	mozilla-common-voice, librispeech, fisher, central telefônica	https://github.com/mozilla/DeepSpeech
wavenet de fala para texto	https://github.com/buriburisuri/speech-to-text-wavenet#pre-trained-models	vctk	https://github.com/buriburisuri/speech-to-text-wavenet
às 16k	https://github.com/at16k/at16k#download-models	N / D	N / D

Conjuntos de dados

Conjuntos de dados referenciados neste documento

Dados do modelo de linguagem

Rastreamento comum

http://commoncrawl.org/

enwik8

Despejo de dados da Wikipedia (benchmark de compactação de texto grande) http://mattmahoney.net/dc/textdata.html

texto8

Texto limpo da Wikipedia (benchmark de compactação de texto grande) http://mattmahoney.net/dc/textdata.html

lm1b

Referência de modelo de linguagem de 1 bilhão de palavras https://www.statmt.org/lm-benchmark/

wt103

Wikitexto 103 https://blog.einstein.ai/the-wikitext-long-term-dependency-language-modeling-dataset/

webtexto

Conjunto de dados original não divulgado pelos autores. Uma coleção de código aberto está disponível em https://skylion007.github.io/OpenWebTextCorpus/

Wikipédia em inglês

https://en.wikipedia.org/wiki/Wikipedia:Database_download#English-idioma_Wikipedia

LivrosCorpus

https://yknzhu.wixsite.com/mbweb https://github.com/soskek/bookcorpus

Sentimento

TSM

Banco de árvore de sentimento de Stanford https://nlp.stanford.edu/sentiment/index.html. Uma das tarefas do Glue.

IMDB

Conjunto de dados de resenhas de filmes do IMDB usado para classificação de sentimentos http://ai.stanford.edu/~amaas/data/sentiment

Semeval2018te

Conjunto de dados de emoções de tweet do semestre de 2018 https://competitions.codalab.org/competitions/17751

Cola

Glue é uma coleção de recursos para benchmarking de sistemas de linguagem natural. https://gluebenchmark.com/ Contém conjuntos de dados sobre inferência de linguagem natural, classificação de sentimentos, detecção de paráfrases, correspondência de similaridade e aceitabilidade linguística.

Dados de fala em texto

pescador

https://pdfs.semanticscholar.org/a723/97679079439b075de815553c7b687ccfa886.pdf

librispeech

www.danielpovey.com/files/2015_icassp_librispeech.pdf

central telefônica

https://ieeexplore.ieee.org/document/225858/

Voz comum da Mozilla

https://github.com/mozilla/voice-web

vctk

https://datashare.is.ed.ac.uk/handle/10283/2651

Salão da Vergonha

Pesquisa de alta qualidade que não inclui modelos e/ou códigos pré-treinados para uso público.

KERMIT https://arxiv.org/abs/1906.01604 Modelagem Generativa Baseada em Inserção para Sequências. Nenhum código.

Não inglês

Outras coleções

Allen PNL

Construído em pytorch, allen nlp produziu modelos SOTA e os abriu em código-fonte. https://github.com/allenai/allennlp/blob/master/MODELS.md

Eles têm uma demonstração interativa bacana sobre várias tarefas em https://demo.allennlp.org/

GluonNLP

Baseada no MXNet, esta biblioteca possui uma extensa lista de modelos pré-treinados em diversas tarefas em PNL. http://gluon-nlp.mxnet.io/master/index.html#model-zoo

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2024-12-31
tamanho 50MB
Vindo de Github

Aplicativos Relacionados

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
node telegram bot api

Código-Fonte de IA

v0.50.0
typebot.io

Código-Fonte de IA

v3.1.2
python wechaty getting started

Código-Fonte de IA

1.0.0
waymo open dataset

Outro código-fonte

December 2023 Update
termwind

Outras categorias

v2.3.0
wp functions

Outras categorias

1.0.0

Informações Relacionadas Todos