Загрузка PCPM - Загрузка исходного кода PCPM

PCPM

AI Исходный код

1.0.0

Скачать

PCPM

Представляем корпус предварительно обученных моделей . Ссылки на предварительно обученные модели в НЛП и озвучку со сценарием обучения.

Благодаря быстрому прогрессу в НЛП становится легче запустить проект машинного обучения, включающий текст. Вместо того, чтобы начинать с базового кода, теперь можно начать с предварительно обученной базовой модели и за несколько итераций получить производительность SOTA. Этот репозиторий создан с учетом того, что предварительно обученные модели сводят к минимуму коллективные человеческие усилия и стоимость ресурсов, тем самым ускоряя разработку в этой области.

Перечисленные модели курируются либо для pytorch, либо для тензорного потока из-за их широкого использования.

Примечание. pytorch-transofmers — это замечательная библиотека, которую можно использовать для быстрого вывода/точной настройки на основе множества предварительно обученных моделей в НЛП. Предварительно обученные модели из них сюда не включены.

Содержание

Текстовые модели машинного обучения
Преобразование речи в текстовые модели
Наборы данных
Зал позора
Неанглийские модели
Другие коллекции

Текст МЛ

Языковые модели

Имя	Связь	Обучение на	Скрипт обучения
Трансформер-xl	https://github.com/kimiyoung/transformer-xl/tree/master/tf#obtain-and-evaluate-pretrained-sota-models	`enwik8` , `lm1b` , `wt103` , `text8`	https://github.com/kimiyoung/transformer-xl
ГПТ-2	https://github.com/openai/gpt-2/blob/master/download_model.py	`webtext`	https://github.com/nshepperd/gpt-2/
Адаптивные входы (fairseq)	https://github.com/pytorch/fairseq/blob/master/examples/language_model/README.md#pre-trained-models	`lm1b`	https://github.com/pytorch/fairseq/blob/master/examples/language_model/README.md

Моделирование языка перестановок - XLNet

Имя	Связь	Обучение на	Скрипт обучения
XLnet	https://github.com/zihangdai/xlnet/#released-models	`booksCorpus` + `English Wikipedia` + `Giga5` + `ClueWeb 2012-B` + `Common Crawl`	https://github.com/zihangdai/xlnet/

Основанное на моделировании замаскированного языка — Берт

Имя	Связь	Обучение на	Скрипт обучения
РОБЕРТа	https://github.com/pytorch/fairseq/tree/master/examples/roberta#pre-trained-models	книгиКорпус+CC-N EWS+OpenWebText+CommonCrawl-Stories	https://github.com/huggingface/transformers
БЕРТ	https://github.com/google-research/bert/	книгиКорпус+английская Википедия	https://github.com/huggingface/transformers
МТ-ДНН	https://mrc.blob.core.windows.net/mt-dnn-model/mt_dnn_base.pt (https://github.com/namisan/mt-dnn/blob/master/download.sh)	клей	https://github.com/namisan/mt-dnn

Машинный перевод

Имя	Связь	Обучение на	Скрипт обучения
ОпенНМТ	http://opennmt.net/Models-py/ (pytorch) http://opennmt.net/Models-tf/ (тензорный поток)	английский-немецкий	https://github.com/OpenNMT/OpenNMT-py
Fairseq (несколько моделей)	https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md#pre-trained-models	WMT14 англо-французский, WMT16 англо-немецкий	https://github.com/pytorch/fairseq/blob/master/examples/translation/README.md

Настроение

Имя	Связь	Обучение на	Скрипт обучения
Открытие настроений Nvidia	https://github.com/NVIDIA/sentiment-discovery#pretrained-models	ССТ, imdb, Семевал-2018-tweet-emotion	https://github.com/NVIDIA/sentiment-discovery
Настроение MT-DNN	https://drive.google.com/open?id=1-ld8_WpdQVDjPeYhb3AK8XYLGlZEbs-l	ССТ	https://github.com/namisan/mt-dnn

Понимание чтения

ОТРЯД 1.1

Классифицировать	Имя	Связь	Скрипт обучения
49	БиДаф	https://s3-us-west-2.amazonaws.com/allennlp/models/bidaf-model-2017.09.15-charpad.tar.gz	https://github.com/allenai/allennlp

Подведение итогов

Модель обобщения английского языка

Имя	Связь	Обучение на	Скрипт обучения
ОпенНМТ	http://opennmt.net/Models-py/	Стандарт Гигаворда	https://github.com/OpenNMT/OpenNMT-py

Речь в текст

Имя	Связь	Обучение на	Скрипт обучения
НеМо-кварцнет	https://ngc.nvidia.com/catalog/models/nvidia:quartznet15x5	либриспич, mozilla-common-voice	https://github.com/NVIDIA/NeMo
OpenSeq2Seq-Джаспер	https://nvidia.github.io/OpenSeq2Seq/html/speech-recognition.html#models	либрисречь	https://github.com/NVIDIA/OpenSeq2Seq
Эспнет	https://github.com/espnet/espnet#asr-results	либриспич,Айшелл,HKUST,TEDLIUM2	https://github.com/espnet/espnet
wav2letter++	https://talonvoice.com/research/	либрисречь	https://github.com/facebookresearch/wav2letter
Дипспич2	SeanNaren/deepspeech.pytorch#299 (комментарий)	либрисречь	https://github.com/SeanNaren/deepspeech.pytorch
Глубокая речь	https://github.com/mozilla/DeepSpeech#getting-the-pre-trained-model	mozilla-common-voice, librispeech, fisher, коммутатор	https://github.com/mozilla/DeepSpeech
преобразование речи в текст-wavenet	https://github.com/buriburisuri/speech-to-text-wavenet#pre-trained-models	вктк	https://github.com/buriburisuri/speech-to-text-wavenet
в16к	https://github.com/at16k/at16k#download-models	NA	NA

Наборы данных

Наборы данных, упомянутые в этом документе

Данные языковой модели

Общее сканирование

http://commoncrawl.org/

enwik8

Дамп данных Википедии (тест сжатия большого текста) http://mattmahoney.net/dc/textdata.html

текст8

Очищенный текст Википедии (тест сжатия большого текста) http://mattmahoney.net/dc/textdata.html

lm1b

Тест языковой модели на 1 миллиард слов https://www.statmt.org/lm-benchmark/

wt103

Викитекст 103 https://blog.einstein.ai/the-wikitext-long-term-dependent-language-modeling-dataset/

веб-текст

Исходный набор данных, не опубликованный авторами. Коллекция с открытым исходным кодом доступна по адресу https://skylion007.github.io/OpenWebTextCorpus/.

английская википедия

https://en.wikipedia.org/wiki/Wikipedia:Database_download#English-language_Wikipedia

КнигиКорпус

https://yknzhu.wixsite.com/mbweb https://github.com/soskek/bookcorpus

Настроение

ССТ

Стэнфордский банк деревьев настроений https://nlp.stanford.edu/sentiment/index.html. Одно из заданий Клея.

ИМДБ

Набор данных обзоров фильмов IMDB, используемый для классификации настроений http://ai.stanford.edu/~amaas/data/sentiment

Семевал2018te

Набор данных эмоций в твитах Semeval за 2018 год https://competitions.codalab.org/competitions/17751

Клей

Glue — это набор ресурсов для сравнительного анализа систем естественного языка. https://gluebenchmark.com/ Содержит наборы данных по выводу естественного языка, классификации настроений, обнаружению перефразирования, сопоставлению сходства и языковой приемлемости.

Речь в текстовые данные

рыбак

https://pdfs.semanticscholar.org/a723/97679079439b075de815553c7b687ccfa886.pdf

либрисречь

www.danielpovey.com/files/2015_icassp_librispeech.pdf

распределительный щит

https://ieeexplore.ieee.org/document/225858/

Общий голос Mozilla

https://github.com/mozilla/voice-web

вктк

https://datashare.is.ed.ac.uk/handle/10283/2651

Зал позора

Высококачественные исследования, не включающие предварительно обученные модели и/или код для публичного использования.

КЕРМИТ https://arxiv.org/abs/1906.01604 Генеративное моделирование последовательностей на основе вставок. Никакого кода.

Не английский

Другие коллекции

Аллен НЛП

Аллен НЛП, основанный на pytorch, создал модели SOTA и открыл их исходный код. https://github.com/allenai/allennlp/blob/master/MODELS.md

У них есть аккуратная интерактивная демонстрация по различным задачам на https://demo.allennlp.org/.

ГлюонНЛП

Эта библиотека, основанная на MXNet, имеет обширный список предварительно обученных моделей для различных задач НЛП. http://gluon-nlp.mxnet.io/master/index.html#model-zoo

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2024-12-31
размер 50MB
От Github

Связанные приложения

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14