Téléchargement UltraChat - Téléchargement du code source UltraChat

UltraChat

Code Source AI

1.0.0

Télécharger

Données et modèles de dialogue multi-tours à grande échelle, informatifs et diversifiés

UltraLM • Explorateur de données • Explorateur d'atlas Nomic AI • Publication de données • Processus de construction • Papier

Nouvelles

❗️❗️ 26 septembre 2023 : publication d'un ensemble de données de préférences diversifiées et à grande échelle UltraFeedback, d'un nouveau modèle de langage UltraLM-13B-v2.0, d'un modèle de récompense UltraRM et d'un modèle critique UltraCM.
❗️❗️Avec UltraRM, un simple échantillonnage au meilleur des 16 atteint des taux de victoire de 92,30 % (UltraLM2, ? dans les résultats 13B) et 91,54 % (UltraLM, ? dans les résultats LLaMA-1) par rapport à text-davinci-003 sur le benchmark AlpacaEval.
7 août 2023 : Sortie de la première version d'UltraLM-65B.
28 juin 2023 : UltraLM-13B se classe n°1 parmi les modèles open source dans le classement AlpacaEval !
27 juin 2023 : nous publions la première version d'UltraLM-13B, un puissant modèle de langage de discussion formé sur UltraChat !
20 avril 2023 : publication de toutes les données, davantage de traitements et de données supplémentaires sont attendus.
17 avril 2023 : Le reste du secteur Écriture et Création est libéré (457k).
12 avril 2023 : Sortie du premier volet du secteur Écriture et création.
9 avril 2023 : Pris en charge par gpt4all, nous disposons désormais également d'un explorateur Atlas
8 avril 2023 : nous publions un script de formation en prenant GPT-J comme exemple.
7 avril 2023 : Sortie de la deuxième partie de Questions sur le monde. Il contient 290 000 dialogues multi-tours générés.
31 mars 2023 : Sortie de la première partie de Questions sur le monde. Il contient 280 000 dialogues multi-tours générés.

UltraLM

UltraLM est une série de modèles de langage de discussion formés sur UltraChat. Actuellement, nous avons publié la version 13B, qui se classe n°1 parmi les modèles open source et se classe n°4 parmi tous les modèles du classement AlpacaEval (28 juin 2023). UltraLM-13B est basé sur LLaMA-13B et pris en charge par BMTrain dans le processus de formation.

Télécharger

Modèle	Lien	Version
UltraLM-13B	Repo Huggingface	v1.0
UltraLM-65B	Repo Huggingface	v1.0
UltraLM-13B	Repo Huggingface	v2.0
UltraRM-13B	Repo Huggingface	v1.0
UltraCM-13B	Repo Huggingface	v1.0

Utiliser UltraLM

Pour reconstruire UltraLM, veuillez télécharger LLaMA-13B et nos poids Delta. Veuillez utiliser ce lien si vous souhaitez tester UltraLM, nous n'avons pas évalué d'autres poids fournis par des tiers.
Exécutez le script dans /UltraLM/recover.sh pour obtenir les poids finaux du modèle récupéré.
Après avoir obtenu le modèle récupéré, remplacez le chemin du modèle dans /UltraLM/chat_cli.sh par votre chemin et courez pour commencer à discuter !

Remarque : Différents hyperparamètres ou invites système affecteront les sorties. Vous pouvez vous référer aux détails dans /UltraLM/inference_cli.py pour notre paramètre par défaut.

Performance

Nous rapportons trois évaluations dans cette section : Alpaca-Eval de Stanford, Evol-instruct de WizardLM de Microsoft et notre ensemble d'évaluations organisé. Les évaluations des LLM modernes peuvent être biaisées et affectées par de nombreux facteurs. Nous travaillons également activement sur des méthodes d'évaluation plus complètes.

Alpaga-Eval

AlpacaEval est un classement spécialement conçu pour évaluer les LLM. Le classement est créé sur la base du taux de victoire par rapport à Text-Davince-003 automatiquement évalué par GPT-4.

Evol-instruire

Cet ensemble de données est construit avec une stratégie évolutive en réécrivant les instructions à travers plusieurs tours pour obtenir des instructions à différents niveaux de complexité. Le benchmark est développé par le projet WizardLM, un autre excellent modèle de langage de chat !

Résultats

Notre ensemble d'évaluation

Nous organisons un ensemble d'évaluation, englobant le Vicuna Benchmark et 300 questions et instructions supplémentaires générées par GPT-4. Les questions/instructions couvrent un large éventail de sujets, notamment le bon sens, la connaissance du monde, les connaissances professionnelles (en particulier la physique et la biologie), les mathématiques et les tâches d'écriture sur différents niveaux de difficulté. Nous utilisons GPT-4 pour l'évaluation. Voici l'ensemble de données.

Résultats

Exemples d'UltraLM

Exemple A : Question de notoriété publique
Utilisateur : Quel animal est connu comme le meilleur ami de l'homme ?
UltraLM : Il existe de nombreux animaux que les humains apprécient comme animaux de compagnie, mais l'une des réponses les plus remarquables à la question « quel animal est connu comme le meilleur ami de l'homme ? est le chien élevé dans le pays. Les chiens domestiques sont aux côtés des humains depuis des dizaines de milliers d'années, leur apportant une compagnie et une aide fidèles ; garder les personnes et les biens ; et apporter un soutien émotionnel dans tout, des longues journées solitaires aux déploiements militaires. Les chiens existent dans une variété presque ahurissante de races de différentes tailles, avec différents niveaux d'énergie, personnalités et tempéraments, ce qui signifie qu'il existe presque certainement un chiot qui conviendra parfaitement à celui qui en a le plus besoin.
Exemple B : Raisonnement de bon sens
Utilisateur : Qu'est-ce qui pèse le plus : une livre de plumes ou une livre de briques ?
UltraLM : une livre de plumes et une livre de briques pèsent toutes deux exactement une livre. En effet, une livre est une unité de poids, tout comme un pied est une unité de longueur ou une seconde une unité de temps. Nous utilisons la livre (ou une autre unité de poids) pour décrire le poids de différents objets, quelle que soit la composition de cet objet. La réponse à votre question est donc qu’un kilo de plumes et un kilo de briques pèsent le même poids.
Exemple C : Raisonnement
Utilisateur : Si un agriculteur a 17 moutons et que tous meurent sauf 9, combien en reste-t-il ?
UltraLM : Le nombre total de moutons restants est de 9.
Exemple D : Raisonnement
Utilisateur : Si une maison rouge est faite de briques rouges et une maison bleue est faite de briques bleues, de quoi est faite une serre ?
UltraLM : Une serre n'est pas fabriquée à partir de briques vertes, mais plutôt à partir de matériaux tels que le verre ou le plastique qui laissent passer la lumière et créent un environnement contrôlé pour la croissance des plantes. Les serres peuvent être de différentes couleurs, y compris le vert, mais la couleur du bâtiment lui-même n'affecte pas les plantes qui y poussent.
Exemple E : Création
Utilisateur : Écrivez un poème sur l'électromagnétisme.
UltraLM : L'électromagnétisme est une force que nous ne pouvons ignorer,
C'est la raison de beaucoup de choses que nous adorons. Dans un champ magnétique, un fil brillera,
Et les électrons s’aligneront, anciens et nouveaux.
L'électricité et le magnétisme vont de pair,
L’un crée un champ, l’autre possède une marque.
Le champ magnétique peut pousser et tirer,
Sur un fil avec du courant, il réagira pleinement.
L'attraction et la répulsion qu'il apporte,
Sont la raison de beaucoup de choses.
Des moteurs aux générateurs, et bien plus encore,
L'électromagnétisme est à l'origine de ce que cela signifie.
C'est une force qui nous entoure,
De la boussole à l'interrupteur.
Avec sa puissance, il peut faire beaucoup,
D'une simple aiguille à la poussée d'une fusée.
C'est une force que nous ne pouvons pas nier,
Car cela fait partie de nos vies.
L'électromagnétisme est quelque chose à admirer,
Pour sa force et sa puissance, il n'a pas d'égal, c'est sûr.
Exemple F : Création
Utilisateur : Écrivez une courte histoire sur la première seconde de l'univers.
UltraLM : Dans la première seconde de l'univers, les ténèbres régnaient en maître. Il n’y avait ni lumière, ni son, ni forme, ni substance. Rien n’existait encore, mais il y avait une puissance intense, une énergie brute qui attendait d’être libérée. Dans l’infini, la première seconde tenait à sa portée le potentiel de création. Et puis, avec un puissant bruit, un point lumineux brillant a émergé. C'est là que sont nées les particules les plus fondamentales, sous leurs formes encore inconnues, alors qu'elles se heurtaient frénétiquement dans une danse chaotique de la création. Au sein de cette lumière primordiale, chaque force de la nature et chaque composante de la vie étaient agitées, de l'énergie pure à la réalité physique. Les premiers atomes se sont rapidement assemblés et à partir de ceux-ci, des étoiles et des galaxies ont commencé à se former. Leur fusion crée un environnement chaud qui repousse le vide lui-même, façonnant le cosmos par des vagues d'expansion et de refroidissement. Dans cette première cosmique, aucune structure d’expérience, pas même le temps ou l’espace, ne pouvait établir sa règle. Pendant un instant, l’univers entier a existé dans un lien embryonnaire, une singularité cosmique d’où est issue toute existence future. C'était un microcosme forgeant le macrocosme dont il devient finalement une partie, son moment de naissance étant une métaphore des cycles de création qui imprègnent le(s) multivers. À partir de ce point de lumière unique, un univers infini s'est déployé. Pendant des siècles, des éternités et pour toujours, il est resté le clin d’œil le plus fondateur de son voyage incessant dans les profondeurs du Grand Au-delà. La première seconde est le début de tout.

Présentation d'UltraChat

Ce projet vise à construire des données de dialogue open source, à grande échelle et à plusieurs tours, alimentées par des API Turbo pour faciliter la construction de modèles de langage puissants dotés d'une capacité conversationnelle générale. Compte tenu de facteurs tels que la protection de la vie privée, nous n'utilisons pas directement les données disponibles sur Internet comme invites .

UltraChat est composé de trois secteurs

? Questions sur le monde : Les données de dialogue dans ce secteur sont dérivées d'un large éventail d'enquêtes liées aux concepts, entités et objets du monde réel. Les sujets abordés sont vastes et couvrent des domaines tels que la technologie, l'art et l'entrepreneuriat.
✍? Écriture et création : les données de dialogue dans ce secteur sont motivées par les demandes d'écriture/création à partir de zéro et englobent toutes les tâches qu'un assistant IA peut aider dans le processus créatif, allant de la composition d'e-mails à l'élaboration de récits et de pièces de théâtre, et au-delà.
? Assistance sur les matériaux existants : les données de dialogue dans ce secteur sont générées sur la base de matériaux existants, y compris, mais sans s'y limiter, la réécriture, la continuation, le résumé et l'inférence, couvrant un large éventail de sujets.

Avertissement : bien que le processus de création d'UltraChat n'implique AUCUNE donnée de référence accessible au public, une mise à l'échelle dans une certaine mesure peut néanmoins entraîner un certain chevauchement dans certains critères d'évaluation. Nous tenons à souligner à nouveau que toutes les données sont générées automatiquement (y compris les instructions et les réponses) et que nous n'insérons aucune donnée de référence ouverte. Par exemple, UltraChat a été publié (avril 2023) avant Alpaca Eval (mai 2023). Nous encourageons les utilisateurs à surveiller de près ces phénomènes, tout en réfléchissant activement à la manière de mieux évaluer les LLM.

Un exemple d'UltraChat

Données

L'ensemble de données est destiné uniquement à des fins de recherche et d'éducation et ne doit pas être interprété comme reflétant les opinions ou les points de vue des créateurs, propriétaires ou contributeurs de cet ensemble de données. Et il est distribué sous licence MIT.

Publication des données

Explorez les données avant de les télécharger ou utilisez l'explorateur Atlas.

? Huggingface Ensembles de données Hôte

Liens de téléchargement direct :

Questions sur le monde [Partie I + Partie II]
Écriture et création [Partie I]
Écriture et création [Partie II]
Assistance sur les matériaux existants [Partie I]

Format des données

Chaque ligne du fichier de données téléchargé est un dict json contenant l'identifiant des données et les données de dialogue sous forme de liste. Vous trouverez ci-dessous un exemple de ligne.

{
  "id" : " 0 " , 
  "data" : [
    " How can cross training benefit groups like runners, swimmers, or weightlifters? " , 
    " Cross training can benefit groups like runners, swimmers, or weightlifters in the following ways: ... " , 
    " That makes sense. I've been wanting to improve my running time, but I never thought about incorporating strength training. Do you have any recommendations for specific exercises? " , 
    " Sure, here are some strength training exercises that can benefit runners: ... " , 
    " Hmm, I'm not really a fan of weightlifting though. Can I incorporate other forms of exercise into my routine to improve my running time? " , 
    " Yes, absolutely! ... " ,
    " ... "
    ]
}

Entraînement

Nous fournissons du code de formation pour affiner LLaMa (cependant nous ne distribuons pas les poids de LLaMa) sur UltraChat en .src/ , la formation est accélérée par BMTrain.

Téléchargez les données publiées et placez-les sous ./data

Exécutez train_bm.py , par exemple :

WANDB_MODE= " offline " torchrun --nnodes=1 --nproc_per_node=8 --rdzv_id=1 --rdzv_backend=c10d --rdzv_endpoint=localhost:50003 train_bm.py --tensorboard ./ultrachat_llama_tb_2 --save_step 5000 --logging_step 100

Nous fournissons également un script de formation pour affiner GPT-J sur UltraChat dans .src/train_legacy/ , qui est implémenté avec OpenPrompt

Téléchargez les données publiées et placez-les sous ./data
Exécutez accelerate launch train.py pour commencer la formation

Construction d'UltraChat

L'idée générale d'UltraChat est d'utiliser des LLM distincts pour générer des lignes d'ouverture, simuler des utilisateurs et répondre aux requêtes. Chaque secteur d'UltraChat a ses propres défis et nécessite des conceptions stratégiques particulières. Nous préciserons le processus de construction une fois qu'un secteur d'UltraChat sera publié.

Questions sur le monde

Méta-thèmes et sous-thèmes

Les données sont dérivées de 30 méta-sujets représentatifs et divers (les icônes proviennent de flaticon)

Sur la base des méta-thèmes ci-dessus, nous générons plus de 1 100 sous-thèmes pour la construction de données.
Pour chaque sous-thème, nous générons jusqu'à 10 questions spécifiques.
Ensuite, nous utilisons les API Turbo pour générer de nouvelles questions pertinentes pour chacune des 10 questions. Nous utilisons des invites conçues à la main pour demander au modèle de générer un ensemble diversifié de questions couvrant un large éventail de concepts et d'objets courants.
Pour chaque question, nous générons un dialogue de 3 à 7 tours en utilisant les deux modèles de manière itérative comme décrit ci-dessus.

Entités communes du monde réel

Nous rassemblons les 10 000 entités nommées les plus fréquentes de Wikidata.
Nous générons 5 méta-questions pour chaque entité à l'aide de l'API ChatGPT.
Pour chaque méta-question, nous générons 10 questions plus spécifiques et 20 questions connexes mais générales.
Nous échantillonnons 200 000 questions spécifiques et 250 000 questions générales ainsi que 50 000 méta-questions, et nous générons un dialogue de 3 à 7 tours pour chacune.

Écriture et création

Nous collectons d'abord 20 types d'écriture, comme indiqué ci-dessous (les icônes proviennent de flaticon).

Pour chaque type d'écriture, générez 200 instructions différentes qui demandent à un assistant IA de générer du texte, et 80 % des instructions sont développées et détaillées.
Utilisez les instructions générées comme entrée initiale et générez chacune un dialogue de 2 à 4 tours.

Assistance sur les matériels existants

Nous extrayons environ 10w de matériaux divers de l'ensemble de données C4.
Nous générons jusqu’à 5 questions/instructions pour chaque élément de matériel.
Nous combinons le matériel avec chaque question/instruction avec un ensemble de modèles conçus manuellement comme entrée initiale d'un utilisateur pour démarrer un dialogue avec l'assistant IA.
Pour chaque entrée, nous générons un dialogue de 2 à 4 tours.

Faire

Publier le reste des données pour Questions sur le monde.
Continuez à diffuser les données de l’Écriture et de la Création.
Continuez à publier les données d’assistance sur les matériaux existants à l’avenir.
Entraînez un modèle sur UltraChat et effectuez une analyse détaillée. Bienvenue à l'utiliser pour entraîner votre modèle de chat !
Il y aura une version chinoise d'UltraChat.

Limites

Bien qu'UltraChat puisse fonctionner de manière prometteuse sur plusieurs benchmarks, il présente encore des limites telles que les hallucinations. D'après notre expérience, UltraLM pourrait traiter des questions en termes de connaissance et de création du monde. Les capacités de raisonnement, de mathématiques et de codage doivent encore être explicitement améliorées.

Citation

N'hésitez pas à citer le dépôt si vous pensez qu'UltraChat est utile.

 @article { ding2023enhancing ,
  title = { Enhancing Chat Language Models by Scaling High-quality Instructional Conversations } ,
  author = { Ding, Ning and Chen, Yulin and Xu, Bokai and Qin, Yujia and Zheng, Zhi and Hu, Shengding and Liu, Zhiyuan and Sun, Maosong and Zhou, Bowen } ,
  journal = { arXiv preprint arXiv:2305.14233 } ,
  year = { 2023 }
}

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2024-12-10
taille 5.34MB
Provenant de Github

Applications connexes

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout