Téléchargement ainovelprompter - Téléchargement du code source ainovelprompter

ainovelprompter

Code Source AI

1.0.0

Télécharger

AI roman prompteur

L'IA Nouveau Prompter peut générer des invites d'écriture pour des romans en fonction des caractéristiques spécifiées par l'utilisateur.

Outil basé sur les plats

Le roman de l'IA est une application de bureau conçue pour aider les écrivains à créer des invites cohérentes et bien structurées pour des assistants d'écriture d'IA comme Chatgpt et Claude. L'outil aide à gérer les éléments de l'histoire, les détails des personnages et génère des invites correctement formatées pour poursuivre votre roman.

L'exécutable est sur l'exécutable Build / Bin

Caractéristiques

1. Gestion des tâches et des chapitres

Sélection du type de tâche : définir et personnaliser différents types de tâches d'écriture
Exemple de gestion des chapitres : Chapitres d'échantillons de magasin et de référence pour la cohérence du style
Onglets de contenu du chapitre :
- Story Beats: Planifiez les principaux points de votre prochain chapitre
- Chapitre précédent: Référence Le dernier chapitre écrit
- Remarques futures: Gardez une trace des développements futurs prévus

Ai roman 1

2. Gestion des éléments d'histoire

Chaque catégorie peut être modifiée, enregistrée et réutilisée sur différentes invites:

Règles : définir les règles d'écriture et les directives de style
Personnages : Gérer les profils et les détails des personnages
Emplacements : Gardez une trace des emplacements de l'histoire et de leurs descriptions
Codex : Stockage des éléments et des traditions du monde

3. Génération rapide

Support de double IA :
- Formatage optimisé par chatpt
- Formatage XML optimisé Claude
Aperçu en temps réel : voir votre invite formatée lorsque vous la construisez
Comptage de jetons : utilisation de jeton de piste pour les limites du modèle IA
Instructions personnalisées : ajouter des exigences ou des directives spécifiques

4. Persistance des données

Toutes les données sont automatiquement enregistrées localement
Les catégories comprennent:
- Types de tâches
- Exemples de chapitres
- Règles
- Personnages
- Lieux
- Entrées du codex

5. Interface utilisateur

Design propre et moderne : construit avec des composants shadcn / ui
Disposition réactive : s'adapte à différentes tailles de fenêtre
Interface à onglets : accès au contenu organisé
Éditeurs modaux : édition facile des éléments de l'histoire

Pile technique

L'extrémité avant :
- Réagir
- Manuscrit
- CSS du vent arrière
- composants shadcn / ui
Backend :
- Aller
- Framework gémissant

Gestion des fichiers

Enregistre les données dans le répertoire domestique de l'utilisateur sous .ai-novel-prompter
Prend en charge les fichiers jusqu'à 500 Ko
Comprend des capacités de sélection de fichiers et de dossiers

Installation

 # Clone the repository
git clone [repository-url]

# Install frontend dependencies
cd frontend
npm install

# Build and run the application
cd ..
wails dev

Bâtiment pour la production

Pour construire un package de mode de production redistribuable, utilisez wails build .

wails build

L'exécutable est sur l'exécutable Build / Bin

Ou générez-le avec:

 wails build -nsis

Cela peut être fait pour Mac et voir la dernière partie de ce guide

L'application construite sera disponible dans le répertoire build .

Guide d'utilisation

Configuration initiale :
- Définissez vos types de tâches (par exemple, "Écrivez le chapitre suivant", "réviser le chapitre")
- Ajouter des exemples de chapitres pour la référence de style
- Configurez vos règles et directives
Création d'une invite :
- Sélectionnez votre type de tâche
- Référence ou ajouter votre chapitre précédent
- Écrivez votre histoire
- Sélectionnez des règles, des caractères et des emplacements pertinents
- Ajouter toutes les instructions personnalisées
Génération de sortie :
- Choisissez entre Chatgpt ou Claude Formatting
- Passez en revue l'invite générée
- Copier dans le presse-papiers
- Collez dans votre assistant d'IA préféré

Développement

Ajout de nouvelles fonctionnalités

La base de code prend en charge l'ajout facile de nouveaux sélecteurs et options
Les composants modaux suivent un modèle cohérent
La persistance des données est gérée automatiquement

Personnalisation

Tous les composants utilisent CSS à vent arrière pour le style
Les composants de l'interface utilisateur peuvent être personnalisés via shadcn / ui
Le formatage rapide peut être modifié dans l'utilitaire d'invite pour les encenteurs

Outil Web

Caractéristiques

Enregistrement et authentification des utilisateurs
Création et gestion de texte
Création et gestion des chapitres
Soumission et gestion des commentaires
Génération rapide basée sur les traits
Intégration avec un service local ollla
Basé sur le modèle de baies (https://codedthemes.gitbook.io/berry)
Inspiré sur Jason Hamilton YouTube (https://www.youtube.com/@thenerdynovelist)

Technologies utilisées

L'extrémité avant:
- Réagir
- Manuscrit
- Axios
- Routeur de réact
- Réagir à faire toastify
Backend:
- Aller
- Framework Web Gin
- Gorm (go orm)
- Postgresql

Condition préalable

Avant d'exécuter l'application, assurez-vous que vous avez installé les suivants:

Node.js (v18 ou supérieur)
GO (v1.18 ou plus)
Postgresql
Docker
Docker

Commencer

Clone le référentiel:

 git clone https://github.com/danielsobrado/ainovelprompter.git

Accédez au répertoire du projet:
```
 cd ainovelprompter
```
Configurez le backend:

Accédez au répertoire server :
```
 cd server
```
Installez les dépendances GO:
```
 go mod download
```
Mettez à jour le fichier config.yaml avec votre configuration de base de données.
Exécutez les migrations de la base de données:
```
 go run cmd/main.go migrate
```
Démarrez le serveur backend:
```
 go run cmd/main.go
```

Configurez le frontend:

Accédez au répertoire client :
```
 cd ../client
```
Installez les dépendances du frontend:
```
 npm install
```
Démarrez le serveur de développement Frontend:
```
 npm start
```

Ouvrez votre navigateur Web et visitez http://localhost:3000 pour accéder à l'application.

Commencer (Docker)

Clone le référentiel:

 git clone https://github.com/danielsobrado/ainovelprompter.git

Accédez au répertoire du projet:

 cd ainovelprompter

Mettez à jour le fichier docker-compose.yml avec votre configuration de base de données.
Démarrez l'application à l'aide de Docker Compose:

 docker-compose up -d

Ouvrez votre navigateur Web et visitez http://localhost:3000 pour accéder à l'application.

Configuration

La configuration du backend peut être modifiée dans le fichier server/config.yaml .
La configuration du frontend peut être modifiée dans le fichier client/src/config.ts .

Construire

Pour construire le frontend pour la production, exécutez la commande suivante dans le répertoire client :

 npm run build

Les fichiers prêts pour la production seront générés dans le répertoire client/build .

Guide d'installation et de gestion pour PostgreSQL sur WSL

Ce petit guide fournit des instructions sur la façon d'installer PostgreSQL sur le sous-système Windows pour Linux (WSL), ainsi que des étapes pour gérer les autorisations des utilisateurs et résoudre les problèmes communs.

Condition préalable

Windows 10 ou plus avec WSL activé. (Ou juste ubuntu)
Familiarité de base avec la ligne de commande Linux et SQL.

Installation

Terminal WSL ouvert : lancez votre distribution WSL (Ubuntu recommandé).
Mettre à jour les packages :
```
sudo apt update
```

Installez PostgreSQL :

sudo apt install postgresql postgresql-contrib

Vérifiez l'installation :
```
psql --version
```
Définir le mot de passe utilisateur PostgreSQL :
```
sudo passwd postgres
```

Opérations de base de données

Créer une base de données :
```
createdb mydb
```
Base de données d'accès :
```
psql mydb
```

Importer des tables à partir du fichier SQL :

psql -U postgres -q mydb < /path/to/file.sql

Liste des bases de données et des tables :

l  # List databases
dt # List tables in the current database

Base de données de commutation :
```
c dbname
```

Gestion des utilisateurs

Créer un nouvel utilisateur :

 CREATE USER your_db_user WITH PASSWORD ' your_db_password ' ;

Privilèges de concession :
```
 ALTER USER your_db_user CREATEDB;
```

Dépannage

Le rôle n'existe pas d'erreur : passer à l'utilisateur «Postgres»:
```
sudo -i -u postgres
createdb your_db_name
```
Autorisation refusée de créer une extension : Connexion comme «Postgres» et exécuter:
```
CREATE EXTENSION IF NOT EXISTS pg_trgm;
```
Erreur de l'utilisateur inconnu : assurez-vous que vous utilisez un utilisateur système reconnu ou référez-vous correctement à un utilisateur PostgreSQL dans l'environnement SQL, et non via sudo .

Générer des données de formation personnalisées pour affiner un modèle de langue (étapes manuelles)

Pour générer des données de formation personnalisées pour affiner un modèle de langue pour imiter le style d'écriture de George Macdonald, le processus commence par obtenir le texte intégral de l'un de ses romans, "La princesse et le gobelin", du projet Gutenberg. Le texte est ensuite décomposé en battements d'histoire individuels ou moments clés en utilisant une invite qui demande à l'IA de générer un objet JSON pour chaque battement, capturant l'auteur, le ton émotionnel, le type d'écriture et l'extrait de texte réel.

Ensuite, GPT-4 est utilisé pour réécrire chacun de ces battements d'histoire dans ses propres mots, générant un ensemble parallèle de données JSON avec des identificateurs uniques reliant chaque battement réécrit à son homologue d'origine. Pour simplifier les données et les rendre plus utiles pour la formation, la grande variété de tons émotionnels est cartographiée à un ensemble plus petit de tons de base à l'aide d'une fonction Python. Les deux fichiers JSON (battements originaux et réécrits) sont ensuite utilisés pour générer des invites de formation, où le modèle est invité à reformuler le texte généré GPT-4 dans le style de l'auteur d'origine. Enfin, ces invites et leurs sorties cibles sont formatées en fichiers JSONL et JSON, prêts à être utilisés pour affiner le modèle de langue pour capturer le style d'écriture distinctif de MacDonald.

Générer des données de formation personnalisées pour affiner un modèle de langue (automatisé)

Dans l'exemple précédent, le processus de génération de texte paraphrasé à l'aide d'un modèle de langue impliquait des tâches manuelles. L'utilisateur a dû fournir manuellement le texte d'entrée, exécuter le script, puis examiner la sortie générée pour garantir sa qualité. Si la sortie ne répondait pas aux critères souhaités, l'utilisateur devrait réessayer manuellement le processus de génération avec différents paramètres ou effectuer des ajustements au texte d'entrée.

Cependant, avec la version mise à jour de la fonction process_text_file , l'ensemble du processus a été entièrement automatisé. La fonction s'occupe de lire le fichier texte d'entrée, de le diviser en paragraphes et d'envoyer automatiquement chaque paragraphe au modèle de langue pour paraphraser. Il intègre divers contrôles et mécanismes de réessayer pour gérer les cas où la sortie générée ne répond pas aux critères spécifiés, tels que contenant des phrases indésirables, étant trop courts ou trop longs, ou comprenant plusieurs paragraphes.

Le processus d'automatisation comprend plusieurs caractéristiques clés:

Resum à partir du dernier paragraphe traité: si le script est interrompu ou doit être exécuté plusieurs fois, il vérifie automatiquement le fichier de sortie et reprend le traitement à partir du dernier paragraphe paraphrasé avec succès. Cela garantit que les progrès ne sont pas perdus et que le script peut reprendre là où il s'était arrêté.
Retry Mécanisme avec des semences et une température aléatoires: si une paraphrase générée ne répond pas aux critères spécifiés, le script rétracte automatiquement le processus de génération jusqu'à un nombre spécifié de fois. À chaque réessayer, il modifie au hasard les valeurs de graines et de température pour introduire une variation des réponses générées, augmentant les chances d'obtenir une sortie satisfaisante.
Économie de progrès: le script enregistre les progrès vers le fichier de sortie chaque nombre spécifié de paragraphes (par exemple, tous les 500 paragraphes). Cela garantit une perte de données en cas d'interruptions ou d'erreurs pendant le traitement d'un grand fichier texte.
Journalisation détaillée et résumé: Le script fournit des informations de journalisation détaillées, y compris le paragraphe d'entrée, la sortie générée, les tentatives de réessayer et les raisons de l'échec. Il génère également un résumé à la fin, affichant le nombre total de paragraphes, les paragraphes paraphrasés avec succès, les paragraphes sautés et le nombre total de tentatives.

Générer des données de formation personnalisées pour affiner un modèle de langue avec LLM local et Studio LM en utilisant ORPO

Pour générer des données de formation personnalisées ORPO pour affiner un modèle de langue pour imiter le style d'écriture de George MacDonald.

Les données d'entrée doivent être au format JSONL, chaque ligne contenant un objet JSON qui inclut la réponse invite et choisie. (À partir du réglage fin précédent) Pour utiliser le script, vous devez configurer le client OpenAI avec votre touche API et spécifier les chemins de fichier d'entrée et de sortie. L'exécution du script traitera le fichier JSONL et générera un fichier CSV avec des colonnes pour l'invite, la réponse choisie et une réponse rejetée générée. Le script économise des progrès toutes les 100 lignes et peut reprendre de l'endroit où il s'était arrêté s'il est interrompu. Une fois terminé, il fournit un résumé des lignes totales traitées, des lignes écrites, des lignes sautées et des détails de réessayer.

Leçons de réglage fin

La qualité de l'ensemble de données est question: 95% des résultats dépendent de la qualité de l'ensemble de données. Un ensemble de données propre est essentiel car même un peu de mauvaises données peuvent nuire au modèle.
Revue des données manuelles: le nettoyage et l'évaluation de l'ensemble de données peuvent considérablement améliorer le modèle. Il s'agit d'une étape longue mais nécessaire car aucun ajustement des paramètres ne peut corriger un ensemble de données défectueux.
Les paramètres de formation ne doivent pas s'améliorer mais empêcher la dégradation du modèle. Dans les ensembles de données robustes, l'objectif devrait être d'éviter les répercussions négatives tout en dirigeant le modèle. Il n'y a pas de taux d'apprentissage optimal.
Échelle du modèle et limitations matérielles: les modèles plus grands (paramètres 33b) peuvent permettre une meilleure affinage, mais nécessitent au moins 48 Go de VRAM, ce qui les rend impraticables pour la majorité des configurations de maisons.
Accumulation de gradient et taille des lots: l'accumulation de gradient permet de réduire le sur-ajustement en améliorant la généralisation entre différents ensembles de données, mais il peut être plus faible après quelques lots.
La taille de l'ensemble de données est plus importante pour affiner un modèle de base qu'un modèle bien réglé. La surcharge d'un modèle bien réglé avec des données excessives pourrait dégrader son réglage fin précédent.
Un calendrier de taux d'apprentissage idéal commence par une phase d'échauffement, est stable pour une époque, puis diminue progressivement en utilisant un calendrier de cosinus.
Rang et généralisation du modèle: la quantité de paramètres formables affecte les détails et la généralisation du modèle. Les modèles de rang inférieur se généralisent mieux mais perdent les détails.
L'applicabilité de Lora: le réglage fin et économe en paramètres (PEFT) est applicable aux modèles de grande langue (LLM) et aux systèmes comme la diffusion stable (SD), démontrant sa polyvalence.

Finetuning Llama 3 Issues en mai 2024

La communauté peu insuffisante a contribué à résoudre plusieurs problèmes avec Finetuning Llama3. Voici quelques points clés à garder à l'esprit:

Tokens BOS double : les jetons BOS doubles pendant les finetuning peuvent casser les choses. Unsil résout automatiquement ce problème.
Conversion GGUF : La conversion GGUF est brisée. Faites attention au double BOS et utilisez le CPU au lieu du GPU pour la conversion. UNSLOTH a des conversions GGUF automatiques intégrées.
Poids de base de buggy : certains des poids de base de Llama 3 (non instruites) sont "buggy" (non formé): <|reserved_special_token_{0->250}|> <|eot_id|> <|start_header_id|> <|end_header_id|> . Cela peut provoquer des résultats NANS et Buggy. Unsloth corrige automatiquement cela.
Invite du système : Selon la communauté peu inscrite, l'ajout d'une invite de système rend bien mieux la version instruct (et peut-être la version de base).
Problèmes de quantification : les problèmes de quantification sont courants. Voir cette comparaison qui montre que vous pouvez obtenir de bonnes performances avec LLAMA3, mais l'utilisation de la mauvaise quantification peut nuire aux performances. Pour la fin du Finetuning, utilisez BitsandBytes NF4 pour augmenter la précision. Pour GGUF, utilisez les versions I autant que possible.
Modèles de contexte long : les modèles de contexte longs sont mal formés. Ils étendent simplement la corde thêta, parfois sans aucune formation, puis s'entraînent sur un ensemble de données concaténé étrange pour en faire un long jeu de données. Cette approche ne fonctionne pas bien. Une mise à l'échelle du contexte long et continu aurait été bien meilleure si la mise à l'échelle de 8k à 1 m de longueur de contexte.

Pour résoudre certains de ces problèmes, utilisez des insuffisants pour Finetuning Llama3.

Mesures d'évaluation

Lors de la fin de la paraphrase d'un modèle linguistique dans le style d'un auteur, il est important d'évaluer la qualité et l'efficacité des paraphrases générées.

Les mesures d'évaluation suivantes peuvent être utilisées pour évaluer les performances du modèle:

BLEU (Bilingual Evaluation Montsudy):
- BLEU mesure le chevauchement N-gramme entre la paraphrase générée et le texte de référence, fournissant un score entre 0 et 1.
- Pour calculer les scores BLEU, vous pouvez utiliser la bibliothèque sacrebleu à Python.
- Exemple d'utilisation: from sacrebleu import corpus_bleu; bleu_score = corpus_bleu(generated_paraphrases, [original_paragraphs])
Rouge (sous-étude orientée rappel pour l'évaluation de l'essentiel):
- Rouge mesure le chevauchement des n-grammes entre la paraphrase générée et le texte de référence, en se concentrant sur le rappel.
- Pour calculer les scores rouges, vous pouvez utiliser la bibliothèque rouge en Python.
- Exemple d'utilisation: from rouge import Rouge; rouge = Rouge(); scores = rouge.get_scores(generated_paraphrases, original_paragraphs)
Perplexité:
- La perplexité quantifie l'incertitude ou la confusion du modèle lors de la génération de texte.
- Pour calculer la perplexité, vous pouvez utiliser le modèle de langage affiné lui-même.
- Exemple d'utilisation: perplexity = model.perplexity(generated_paraphrases)
Mesures stylométriques:
- Les mesures stylométriques capturent les caractéristiques du style d'écriture de l'auteur cible.
- Pour extraire les fonctionnalités stylotriques, vous pouvez utiliser la bibliothèque stylometry en Python.
- Exemple d'utilisation: from stylometry import extract_features; features = extract_features(generated_paraphrases)

Intégration avec axolotl

Pour intégrer ces mesures d'évaluation dans votre pipeline axolotl, suivez ces étapes:

Préparez vos données de formation en créant un ensemble de données de paragraphes des travaux de l'auteur cible et en les divisant en ensembles de formation et de validation.
Affinez votre modèle de langue à l'aide de l'ensemble de formation, en suivant l'approche discutée précédemment.
Générez des paraphrases pour les paragraphes dans l'ensemble de validation à l'aide du modèle affiné.
Mettez en œuvre les mesures d'évaluation à l'aide des bibliothèques respectives ( sacrebleu , rouge , stylometry ) et calculez les scores pour chaque paraphrase générée.
Effectuer une évaluation humaine en collectant les cotes et les commentaires des évaluateurs humains.
Analysez les résultats de l'évaluation pour évaluer la qualité et le style des paraphrases générées et prendre des décisions éclairées pour améliorer votre processus de réglage fin.

Voici un exemple de la façon dont vous pouvez intégrer ces mesures dans votre pipeline:

 from sacrebleu import corpus_bleu
from rouge import Rouge
from stylometry import extract_features

# Fine-tune the model using the training set
fine_tuned_model = train_model ( training_data )

# Generate paraphrases for the validation set
generated_paraphrases = generate_paraphrases ( fine_tuned_model , validation_data )

# Calculate evaluation metrics
bleu_score = corpus_bleu ( generated_paraphrases , [ original_paragraphs ])
rouge = Rouge ()
rouge_scores = rouge . get_scores ( generated_paraphrases , original_paragraphs )
perplexity = fine_tuned_model . perplexity ( generated_paraphrases )
stylometric_features = extract_features ( generated_paraphrases )

# Perform human evaluation
human_scores = collect_human_evaluations ( generated_paraphrases )

# Analyze and interpret the results
analyze_results ( bleu_score , rouge_scores , perplexity , stylometric_features , human_scores )

N'oubliez pas d'installer les bibliothèques nécessaires (Sacrebleu, Rouge, Stylométrie) et adaptez le code pour s'adapter à votre implémentation dans Axolotl ou similaire.

Comparaison du modèle d'écriture AI

Dans cette expérience, j'ai exploré les capacités et les différences entre divers modèles d'IA dans la génération d'un texte de 1500 mots basé sur une invite détaillée. J'ai testé des modèles à partir de https://chat.lmsys.org/, Chatgpt4, Claude 3 Opus et certains modèles locaux dans LM Studio. Chaque modèle a généré le texte trois fois pour observer la variabilité de leurs sorties. J'ai également créé une invite distincte pour évaluer l'écriture de la première itération de chaque modèle et demandé à Chatgpt 4 et à Claude Opus 3 de fournir des commentaires.

Grâce à ce processus, j'ai observé que certains modèles présentent une variabilité plus élevée entre les exécutions, tandis que d'autres ont tendance à utiliser un libellé similaire. Il y avait également des différences significatives dans le nombre de mots générés et la quantité de dialogue, descriptions et des paragraphes produits par chaque modèle. Les commentaires de l'évaluation ont révélé que le chatppt suggère une prose plus "raffinée", tandis que Claude recommande moins de prose violette. Sur la base de ces résultats, j'ai compilé une liste de plats à emporter à intégrer dans l'invite suivante, en me concentrant sur la précision, des structures de phrases variées, des verbes forts, des rebondissements uniques sur les motifs fantastiques, un ton cohérent, une voix de narrateur distincte et un rythme engageant. Une autre technique à considérer est de demander des commentaires, puis de réécrire le texte en fonction de ces commentaires.

Je suis ouvert à collaborer avec d'autres pour affiner les invites pour chaque modèle et explorer leurs capacités dans les tâches d'écriture créative.

Invitant les petits LLM

Instructions directes:
- Utilisez des commandes propres, spécifiques et directes.
- Évitez la verbosité et les phrases inutiles.
Gestion des adjectifs:
- Être prudent avec les adjectifs; Ils peuvent influencer la réponse du modèle de manière inappropriée.
Delimiters et Markdown:
- Utilisez des backtincs, des supports ou de la marque pour séparer les parties distinctes du texte.
- Markdown aide à structurer et à séparer efficacement les sections.
Formats structurés:
- Utilisez JSON, Markdown, HTML, etc., pour l'entrée et la sortie.
- Conservez la sortie en utilisant le schéma JSON lorsque cela est nécessaire.
Exemples à quelques coups:
- Fournissez à quelques exemples de différentes niches pour éviter un sur-ajustement.
- Utilisez ces exemples pour «enseigner» les étapes du modèle dans un processus.
Chaîne de pensées:
- Mettre en œuvre des invites à la chaîne de pensées pour améliorer le raisonnement et la compréhension de la procédure.
- Décomposer les tâches en étapes et guider le modèle à travers eux.
Description avant l'achèvement:
- Invitez le modèle à décrire les entités avant de répondre.
- Assurez-vous que la description ne saigne pas dans l'achèvement involontairement.
Gestion du contexte:
- Fournir un contexte essentiel uniquement, éviter les décharges de paragraphes non structurés.
- Diriger le modèle vers la réponse souhaitée avec un contexte suffisant mais concis.
Test et vérification:
- Le test invite plusieurs fois pour attraper des sorties inattendues.
- Utilisez le classement de l'achèvement pour la pertinence, la clarté et la cohérence.
Utilisez des histoires:
- Contrôlez la sortie avec des techniques de narration.
- Par exemple, écrivez un récit qui inclut le format de sortie souhaité.
Grammaires GBNF:
- Explorez les grammaires GBNF pour contraindre et contrôler la sortie du modèle.
Lire et affiner:
- Examiner et affiner les invites générées pour supprimer les phrases inutiles et assurer la clarté.

Inviter Llama 3 8b

Les modèles ont des biais de formatage inhérent. Certains modèles préfèrent les traits de traits pour les listes, d'autres astérisques. Lorsque vous utilisez ces modèles, il est utile de refléter leurs préférences pour des sorties cohérentes.

Points clés pour Llama 3 Invite:

Formatage des tendances:
- Llama 3 préfère les listes avec des rubriques en gras et des astérisques.
- Exemple: Cas de titre en gras
  - Énumérez les éléments avec des astérisques après deux nouvelles lignes
  - Liste des éléments séparés par une nouvelle ligne
  Liste suivante
  - Plus d'éléments de liste
  - Etc...
Exemples à quelques coups:
- Llama 3 suit les deux invites du système et les exemples à quelques tirs.
- Il est flexible avec les méthodes d'incitation mais peut citer des exemples à quelques coups textuellement.
Adhésion à l'invite du système:
- Llama 3 répond bien aux invites du système avec des instructions détaillées.
- La combinaison des invites du système et des exemples à quelques coups donne de meilleurs résultats.
Fenêtre de contexte:
- La fenêtre de contexte actuelle est petite, limitant l'utilisation d'exemples étendus à quelques coups.
- Cela peut être traité dans les futures mises à jour.
Censure:
- La version Instruct a une certaine censure mais est moins limitée que les versions précédentes.
Intelligence:
- Fonctionne bien dans un raisonnement de chaîne de pensée zéro.
- Capable de comprendre et de s'adapter à des entrées variées.
Cohérence:
- Généralement cohérent mais peut citer directement des exemples.
- Les performances peuvent se dégrader avec des températures plus élevées.

Recommandations d'utilisation:

Listes et formatage:
- Utilisez le format de liste préféré pour une meilleure précision.
- Instruire explicitement Llama 3 sur les formats de sortie souhaités s'ils sont différents de sa valeur par défaut.
Paramètres de chat:
- Convient aux tâches nécessitant l'intelligence et les instructions suivantes.
- Limité par la fenêtre de contexte pour les grandes tâches.
Paramètres du pipeline:
- Efficace pour les pipelines de style GPT-4 à l'aide d'invites système.
- Les limitations de fenêtres de contexte restreignent certaines tâches.

Llama 3 est flexible et intelligent mais a du contexte et des limitations de citation. Ajustez les méthodes d'incitation en conséquence.

Remerciements

Construit avec des gémissements
Composants d'interface utilisateur de shadcn / ui
Icônes de Lucide

Contributif

Tous les commentaires sont les bienvenus. Ouvrez un problème ou envoyez une demande de traction si vous trouvez des bogues ou si vous avez des recommandations d'amélioration.

Licence

Ce projet est licencié sous: Licence Attribution-Noncommercial-Noderivatives (BY-NC-ND) Voir: https://creativecommons.org/licenses/by-nc-nd/4.0/deed.en

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-02-11
taille 19.95MB
Provenant de Github

Applications connexes

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
node telegram bot api

Code Source AI

v0.50.0
typebot.io

Code Source AI

v3.1.2
python wechaty getting started

Code Source AI

1.0.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout