ainovelprompter Download - ainovelprompter Quellcode Download

ainovelprompter

AI-Quellcode

1.0.0

Herunterladen

AI Roman Prompter

AI Novel ProPter kann Schreibaufforderungen für Romane basierend auf benutzerdefinierten Merkmalen generieren.

Wehklemmsbasiertes Tool

AI Novel ProPter ist eine Desktop-Anwendung, mit der Autoren konsistente und gut strukturierte Aufforderungen für KI-Schreibassistenten wie Chatgpt und Claude erstellen sollen. Das Tool hilft, Story -Elemente, Charakterdetails zu verwalten und ordnungsgemäß formatierte Aufforderungen für die Fortsetzung Ihres Romans zu generieren.

Die ausführbare Datei befindet sich auf Build/Bin ausführbar

Merkmale

1. Aufgabe & Kapitelmanagement

Auswahltyp -Typ -Typ : Definieren und passen Sie verschiedene Arten von Schreibaufgaben an und passen Sie an
Beispielkapitelverwaltung : Speicher und Referenz Beispielkapitel zur Stilkonsistenz
Kapitel Inhalt Registerkarten :
- Story Beats: Planen Sie die Hauptpunkte für Ihr nächstes Kapitel
- Vorheriges Kapitel: Referenz Das letzte geschriebene Kapitel
- Zukünftige Notizen: Verfolgen Sie geplante zukünftige Entwicklungen

AI -Roman 1

2. Story Element Management

Jede Kategorie kann bearbeitet, gespeichert und über verschiedene Eingaben wiederverwendet werden:

Regeln : Definieren Sie Schreibregeln und Stilrichtlinien
Charaktere : Charakterprofile und Details verwalten
Standorte : Verfolgen Sie die Standorte der Geschichte und deren Beschreibungen
Codex : Elemente auf dem Bau von Weltbildung und Überlieferung speichern

3.

Doppel -KI -Unterstützung :
- Chatgpt-optimiertes Formatieren
- Claude-optimierte XML-Formatierung
Echtzeit-Vorschau : Sehen Sie sich Ihre formatierte Eingabeaufforderung an, während Sie sie erstellen
Token Counting : Track -Token -Nutzung für KI -Modellgrenzen
Benutzerdefinierte Anweisungen : Fügen Sie spezifische Anforderungen oder Richtlinien hinzu

4. Datenpersistenz

Alle Daten werden automatisch lokal gespeichert
Zu den Kategorien gehören:
- Aufgabentypen
- Beispielkapitel
- Regeln
- Charaktere
- Standorte
- Codex -Einträge

5. Benutzeroberfläche

Sauberes, modernes Design : Erstellt mit Shadcn/UI -Komponenten
Responsive Layout : Passen Sie sich an verschiedene Fenstergrößen an
Registerkartenschnittstelle : organisierter Inhaltszugriff
Modale Herausgeber : Einfache Bearbeitung von Story -Elementen

Technischer Stapel

Frontend :
- Reagieren
- Typoskript
- Rückenwind -CSS
- Shadcn/UI -Komponenten
Backend :
- Gehen
- Wehklemms Framework

Dateiverwaltung

Speichert Daten im Heimverzeichnis des Benutzers unter .ai-novel-prompter
Unterstützt Dateien bis zu 500 KB
Enthält Datei- und Ordnerauswahlfunktionen

Installation

 # Clone the repository
git clone [repository-url]

# Install frontend dependencies
cd frontend
npm install

# Build and run the application
cd ..
wails dev

Gebäude für die Produktion

Verwenden Sie, um ein umverteilbares Produktionsmodus -Paket zu erstellen. Verwenden Sie wails build .

wails build

Die ausführbare Datei befindet sich auf Build/Bin ausführbar

Oder generieren Sie es mit:

 wails build -nsis

Dies kann für Mac erfolgen und den neuesten Teil dieses Handbuchs sehen

Die gebaute Anwendung wird im build -Verzeichnis erhältlich sein.

Verwendungsführer

Erstes Setup :
- Definieren Sie Ihre Task -Typen (z. B. "Schreiben Sie das nächste Kapitel", "Kapitel überarbeiten").
- Fügen Sie Beispielkapitel als Stilreferenz hinzu
- Richten Sie Ihre Regeln und Richtlinien ein
Erstellen einer Eingabeaufforderung :
- Wählen Sie Ihren Aufgabentyp aus
- Verweisen Sie oder fügen Sie Ihr vorheriges Kapitel hinzu
- Schreiben Sie Ihre Geschichte Beats
- Wählen Sie relevante Regeln, Zeichen und Standorte aus
- Fügen Sie alle benutzerdefinierten Anweisungen hinzu
Ausgabe erzeugen :
- Wählen Sie zwischen Chatgpt oder Claude -Formatierung
- Überprüfen Sie die generierte Eingabeaufforderung
- Kopieren Sie in die Zwischenablage
- Fügen Sie in Ihren bevorzugten AI -Assistenten ein

Entwicklung

Neue Funktionen hinzufügen

Die Codebasis unterstützt die einfache Ergänzung neuer Selektoren und Optionen
Modale Komponenten folgen einem konsistenten Muster
Die Datenpersistenz wird automatisch behandelt

Anpassung

Alle Komponenten verwenden Rückenwind -CSS zum Styling
UI -Komponenten können über Shadcn/UI angepasst werden
Eingabeformatierung kann im Dienstprogramm "PromptGenerators" geändert werden

Webbasiertes Tool

Merkmale

Benutzerregistrierung und Authentifizierung
Erstellung und Verwaltung von Text
Kapitelerstellung und -management
Feedback -Einreichung und -verwaltung
Schnellgenerierung basierend auf Merkmalen
Integration in einen lokalen Ollama -Service
Basierend auf Berry -Vorlage (https://codedthemes.gitbook.io/berry)
Inspiriert auf Jason Hamilton YouTube (https://www.youtube.com/@thenerdynovelist)

Technologien verwendet

Frontend:
- Reagieren
- Typoskript
- Axios
- Router reagieren
- Reagieren Sie Toastify
Backend:
- Gehen
- Gin Web Framework
- GORM (go orm)
- PostgreSQL

Voraussetzungen

Stellen Sie vor dem Ausführen der Anwendung sicher, dass Sie die folgenden Installationen installiert haben:

Node.js (v18 oder höher)
Go (v1.18 oder höher)
PostgreSQL
Docker
Docker komponieren

Erste Schritte

Klonen Sie das Repository:

 git clone https://github.com/danielsobrado/ainovelprompter.git

Navigieren Sie zum Projektverzeichnis:
```
 cd ainovelprompter
```
Richten Sie das Backend ein:

Navigieren Sie zum server :
```
 cd server
```
Installieren Sie die GO -Abhängigkeiten:
```
 go mod download
```
Aktualisieren Sie die Datei config.yaml mit Ihrer Datenbankkonfiguration.
Führen Sie die Datenbankmigrationen aus:
```
 go run cmd/main.go migrate
```
Starten Sie den Backend Server:
```
 go run cmd/main.go
```

Richten Sie die Frontend ein:

Navigieren Sie zum client -Verzeichnis:
```
 cd ../client
```
Installieren Sie die Frontend -Abhängigkeiten:
```
 npm install
```
Starten Sie den Frontend Development Server:
```
 npm start
```

Öffnen Sie Ihren Webbrowser und besuchen Sie http://localhost:3000 um auf die Anwendung zuzugreifen.

Erste Schritte (Docker)

Klonen Sie das Repository:

 git clone https://github.com/danielsobrado/ainovelprompter.git

Navigieren Sie zum Projektverzeichnis:

 cd ainovelprompter

Aktualisieren Sie die Datei docker-compose.yml mit Ihrer Datenbankkonfiguration.
Starten Sie die Anwendung mit Docker Compose:

 docker-compose up -d

Öffnen Sie Ihren Webbrowser und besuchen Sie http://localhost:3000 um auf die Anwendung zuzugreifen.

Konfiguration

Die Backend -Konfiguration kann in der Datei server/config.yaml geändert werden.
Die Frontend -Konfiguration kann in der Datei client/src/config.ts geändert werden.

Bauen

Führen Sie den folgenden Befehl im client -Verzeichnis aus, um das Frontend für die Produktion zu erstellen:

 npm run build

Die produktionsbereiten Dateien werden im client/build -Verzeichnis generiert.

Installations- und Verwaltungshandbuch für PostgreSQL auf WSL

Diese kleine Anleitung enthält Anweisungen zur Installation von PostgreSQL im Windows -Subsystem für Linux (WSL) sowie Schritte zur Verwaltung von Benutzerberechtigungen und zur Fehlerbehebung bei allgemeinen Problemen.

Voraussetzungen

Windows 10 oder höher mit aktiviertem WSL. (Oder nur Ubuntu)
Grundlegende Vertrautheit mit Linux -Befehlszeile und SQL.

Installation

Öffnen Sie das WSL -Terminal : Starten Sie Ihre WSL -Verteilung (Ubuntu empfohlen).
Pakete aktualisieren :
```
sudo apt update
```

Postgresql installieren :

sudo apt install postgresql postgresql-contrib

Installation überprüfen :
```
psql --version
```
Setzen Sie das PostgreSQL -Benutzerkennwort :
```
sudo passwd postgres
```

Datenbankvorgänge

Datenbank erstellen :
```
createdb mydb
```
Zugriff auf Datenbank :
```
psql mydb
```

Tabellen aus der SQL -Datei importieren :

psql -U postgres -q mydb < /path/to/file.sql

Listen Sie Datenbanken und Tabellen auf :

l  # List databases
dt # List tables in the current database

Datenbank wechseln :
```
c dbname
```

Benutzerverwaltung

Neuen Benutzer erstellen :

 CREATE USER your_db_user WITH PASSWORD ' your_db_password ' ;

Privilegien gewähren :
```
 ALTER USER your_db_user CREATEDB;
```

Fehlerbehebung

Die Rolle gibt keinen Fehler : Wechseln Sie zum Benutzer "Postgres":
```
sudo -i -u postgres
createdb your_db_name
```
Erlaubnis verweigert, Erweiterung zu erstellen : Login als "Postgres" und Ausführung:
```
CREATE EXTENSION IF NOT EXISTS pg_trgm;
```
Unbekannter Benutzerfehler : Stellen Sie sicher, dass Sie einen erkannten Systembenutzer verwenden oder korrekt auf einen PostgreSQL -Benutzer in der SQL -Umgebung beziehen, nicht über sudo .

Generieren Sie benutzerdefinierte Trainingsdaten, um ein Sprachmodell zu optimieren (manuelle Schritte)

Um benutzerdefinierte Trainingsdaten für die Feinabstimmung eines Sprachmodells zu generieren, um den Schreibstil von George MacDonald zu emulieren, beginnt der Prozess mit dem Erhalt des vollständigen Textes eines seiner Romane "The Princess and the Goblin" von Project Gutenberg. Der Text wird dann in einzelne Story -Beats oder Schlüsselmomente unter Verwendung einer Aufforderung unterteilt, die die KI anweist, für jeden Beat ein JSON -Objekt zu erzeugen und den Autor, den emotionalen Ton, die Art des Schreibens und den tatsächlichen Textauszug zu erfassen.

Als nächstes wird GPT-4 verwendet, um jede dieser Geschichte in seinen eigenen Worten umzuschreiben und einen parallelen Satz von JSON-Daten mit eindeutigen Kennungen zu erzeugen, die jeden umgeschriebenen Beat mit seinem ursprünglichen Gegenstück verbinden. Um die Daten zu vereinfachen und sie für das Training nützlicher zu machen, wird die Vielzahl der emotionalen Töne mit einer Python -Funktion auf einen kleineren Satz von Kerntönen abgebildet. Die beiden JSON-Dateien (Original- und umgeschriebene Beats) werden dann verwendet, um Trainingseinweisungen zu generieren, wobei das Modell aufgefordert wird, den GPT-4-generierten Text im Stil des ursprünglichen Autors neu zu erstellen. Schließlich werden diese Eingabeaufforderungen und ihre Zielausgänge in JSONL- und JSON-Dateien formatiert, um das Sprachmodell zur Feinabstimmung zu verwenden, um MacDonalds unverwechselbare Schreibstil zu erfassen.

Generieren Sie benutzerdefinierte Trainingsdaten, um ein Sprachmodell zu optimieren (automatisiert)

Im vorherigen Beispiel beinhaltete der Prozess der Generierung von paraphrasiertem Text unter Verwendung eines Sprachmodells einige manuelle Aufgaben. Der Benutzer musste den Eingangstext manuell bereitstellen, das Skript ausführen und dann die generierte Ausgabe überprüfen, um seine Qualität zu gewährleisten. Wenn die Ausgabe nicht die gewünschten Kriterien erfüllte, müsste der Benutzer den Erzeugungsprozess mit unterschiedlichen Parametern manuell wiederholen oder Anpassungen am Eingangstext vornehmen.

Mit der aktualisierten Version der Funktion process_text_file wurde der gesamte Prozess jedoch vollständig automatisiert. Die Funktion kümmert sich um das Lesen der Eingabetextdatei, die Aufteilung in Absätze und sendet automatisch jeden Absatz an das Sprachmodell zur Umschreibung. Es enthält verschiedene Überprüfungen und Wiederholungsmechanismen, um Fälle zu bewältigen, in denen die generierte Ausgabe nicht den angegebenen Kriterien erfüllt, z.

Der Automatisierungsprozess enthält mehrere wichtige Funktionen:

Wiederaufnahme aus dem zuletzt verarbeiteten Absatz: Wenn das Skript unterbrochen wird oder mehrmals ausgeführt werden muss, überprüft es automatisch die Ausgabedatei und setzt die Verarbeitung von dem zuletzt erfolgreich abgeschriebenen Absatz fort. Dies stellt sicher, dass der Fortschritt nicht verloren geht und das Skript dort aufnehmen kann, wo es aufgehört hat.
Wiederholungsmechanismus mit zufälliger Saatgut und Temperatur: Wenn eine erzeugte Paraphrase die angegebenen Kriterien nicht erfüllt, wird das Skript automatisch den Erzeugungsprozess bis zu einer bestimmten Anzahl von Malen überholt. Bei jedem Wiederholung ändert es zufällig die Saatgut- und Temperaturwerte, um Variationen der erzeugten Antworten einzuführen, wodurch die Wahrscheinlichkeit erhöht wird, dass eine zufriedenstellende Ausgabe erfasst wird.
Fortschrittssparen: Das Skript speichert den Fortschritt in der Ausgabedatei jede angegebene Anzahl von Absätzen (z. B. alle 500 Absätze). Dieser Schutz vor Datenverlust bei Unterbrechungen oder Fehlern während der Verarbeitung einer großen Textdatei.
Detaillierte Protokollierung und Zusammenfassung: Das Skript enthält detaillierte Protokollierungsinformationen, einschließlich des Eingabebereichs, generierter Ausgabe, Wiederholungsversuche und Gründen für das Scheitern. Am Ende generiert es auch eine Zusammenfassung, in der die Gesamtzahl der Absätze, erfolgreich umschriebene Absätze, übersprungene Absätze und die Gesamtzahl der Wiederholungen angezeigt wird.

Generieren Sie benutzerdefinierte Trainingsdaten, um ein Sprachmodell mit lokalem LLM und LM Studio mit ORPO zu optimieren

So generieren Sie orpo benutzerdefinierte Trainingsdaten für die Feinabstimmung eines Sprachmodells, um den Schreibstil von George MacDonald zu emulieren.

Die Eingabedaten sollten im JSONL -Format enthalten sein, wobei jede Zeile ein JSON -Objekt enthält, das die Eingabeaufforderung und die ausgewählte Antwort enthält. (Aus der vorherigen Feinabstimmung) Um das Skript zu verwenden, müssen Sie den OpenAI -Client mit Ihrer API -Taste einrichten und die Eingabe- und Ausgabedateipfade angeben. Durch Ausführen des Skripts verarbeitet die JSONL -Datei und generiert eine CSV -Datei mit Spalten für die Eingabeaufforderung, die ausgewählte Antwort und eine generierte abgelehnte Antwort. Das Skript speichert alle 100 Zeilen Fortschritte und kann von der Stelle wieder aufgenommen werden, wenn es aufgehört hat, wenn es unterbrochen wird. Nach Abschluss bietet es eine Zusammenfassung der verarbeiteten Gesamtzeilen, geschriebenen Zeilen, übersprungenen Zeilen und Wiederholungsdetails.

Feinabstimmung

Datensatzqualitätsangelegenheiten: 95% der Ergebnisse sind von der Datensatzqualität abhängig. Ein sauberer Datensatz ist unerlässlich, da selbst ein wenig schlechte Daten das Modell beeinträchtigen können.
Manuelle Datenübersicht: Reinigen und Bewertung des Datensatzes kann das Modell erheblich verbessern. Dies ist ein zeitaufwändiger, aber notwendiger Schritt, da kein Parameteranpassung einen defekten Datensatz beheben kann.
Trainingsparameter sollten sich nicht verbessern, sondern den Modellabbau verhindern. In robusten Datensätzen sollte das Ziel sein, negative Auswirkungen zu vermeiden, während das Modell leitet. Es gibt keine optimale Lernrate.
Modellskala- und Hardware-Einschränkungen: Größere Modelle (33B-Parameter) können eine bessere Feinabstimmung ermöglichen, erfordern jedoch mindestens 48 GB VRAM, was sie für die Mehrheit der Heim-Setups unpraktisch macht.
Gradientenakkumulation und Chargengröße: Die Gradientenakkumulation reduziert die Überanpassung, indem die Verallgemeinerung über verschiedene Datensätze hinweg verbessert wird, kann jedoch nach einigen Chargen eine geringere Qualität beeinträchtigen.
Die Größe des Datensatzes ist wichtiger für die Feinabstimmung eines Basismodells als ein gut abgestimmtes Modell. Das Überladen eines gut abgestimmten Modells mit übermäßigen Daten kann seine vorherige Feinabstimmung beeinträchtigen.
Ein idealer Lernrate -Zeitplan beginnt mit einer Aufwärmphase, hält für eine Epoche konstant und nimmt dann mit einem Cosinus -Zeitplan allmählich ab.
Modellrang und Verallgemeinerung: Die Menge an trainierbaren Parametern wirkt sich auf die Details und die Verallgemeinerung des Modells aus. Modelle mit niedrigerem Rang verallgemeinern besser, verlieren aber Details.
Die Anwendbarkeit von LORA: Parameter-effizientes Feinabstimmung (PEFT) ist für große Sprachmodelle (LLMs) und Systeme wie stabile Diffusion (SD) anwendbar, was deren Vielseitigkeit demonstriert.

Finetuning llama 3 Ausgaben im Mai 2024

Die Unloth -Community hat dazu beigetragen, mehrere Probleme mit dem Finetuning LLAMA3 zu lösen. Hier sind einige wichtige Punkte zu beachten:

Doppel -BOS -Token : Doppel -Bos -Token während der Finetuning kann die Dinge brechen. Unloth behebt dieses Problem automatisch.
GGUF -Umwandlung : Die GGUF -Umwandlung ist gebrochen. Achten Sie auf Doppel -BOS und verwenden Sie CPU anstelle von GPU zur Konvertierung. Unloth verfügt über integrierte automatische GGUF-Conversions.
Buggy-Basisgewichte : Einige der Basis von Lama 3 (nicht anweisen) Gewichte sind "buggy" (untrainiert): <|reserved_special_token_{0->250}|> <|eot_id|> <|start_header_id|> <|end_header_id|> . Dies kann NANS- und Buggy -Ergebnisse verursachen. Unloth behebt dies automatisch.
System -Eingabeaufforderung : Laut der Unloth -Community macht das Hinzufügen einer Systemaufforderung die Finetuning der Anweisungsversion (und möglicherweise der Basisversion) viel besser.
Quantisierungsprobleme : Quantisierungsprobleme sind häufig. Sehen Sie sich diesen Vergleich an, der zeigt, dass Sie mit LLAMA3 eine gute Leistung erzielen können, aber die Verwendung der falschen Quantisierung kann die Leistung beeinträchtigen. Verwenden Sie zum Finetuning Bitsandbytes NF4, um die Genauigkeit zu steigern. Verwenden Sie für GGUF die I -Versionen so weit wie möglich.
Lange Kontextmodelle : Lange Kontextmodelle sind schlecht ausgebildet. Sie erweitern einfach das Seil Theta, manchmal ohne Training, und trainieren dann auf einem seltsamen verketteten Datensatz, um es zu einem langen Datensatz zu machen. Dieser Ansatz funktioniert nicht gut. Eine glatte, kontinuierliche, lange Kontextskalierung wäre viel besser gewesen, wenn sie von 8K bis 1 m Kontextlänge skalieren.

Um einige dieser Probleme zu lösen, verwenden Sie Unloth für das Finetuning llama3.

Bewertungsmetriken

Bei der Feinabstimmung eines Sprachmodells für das Paraphrasieren im Stil eines Autors ist es wichtig, die Qualität und Wirksamkeit der erzeugten Paraphrasen zu bewerten.

Die folgenden Bewertungsmetriken können verwendet werden, um die Leistung des Modells zu bewerten:

Bleu (zweisprachige Bewertungsstuddie):
- BLEU misst die N-Gramm-Überlappung zwischen der erzeugten Paraphrase und dem Referenztext und liefert eine Punktzahl zwischen 0 und 1.
- Um die Bleu -Scores zu berechnen, können Sie die sacrebleu -Bibliothek in Python verwenden.
- Beispiel Verwendung: from sacrebleu import corpus_bleu; bleu_score = corpus_bleu(generated_paraphrases, [original_paragraphs])
Rouge (Rückruf-orientierte Zweitbesetzung zur Gisting-Bewertung):
- Rouge misst die Überlappung von N-Gramm zwischen der erzeugten Paraphrase und dem Referenztext und konzentriert sich auf den Rückruf.
- Um die Rouge -Scores zu berechnen, können Sie die rouge -Bibliothek in Python verwenden.
- Beispiel Verwendung: from rouge import Rouge; rouge = Rouge(); scores = rouge.get_scores(generated_paraphrases, original_paragraphs)
Verwirrung:
- Verwirrung quantifiziert die Unsicherheit oder Verwirrung des Modells beim Generieren von Text.
- Um Verwirrung zu berechnen, können Sie das feine Sprachmodell selbst verwenden.
- Beispiel Verwendung: perplexity = model.perplexity(generated_paraphrases)
Stilometrische Maßnahmen:
- Stilometrische Messungen erfassen die Schreibstileigenschaften des Zielautors.
- Um stilometrische Funktionen zu extrahieren, können Sie die stylometry -Bibliothek in Python verwenden.
- Beispiel Verwendung: from stylometry import extract_features; features = extract_features(generated_paraphrases)

Integration mit Axolotl

Befolgen Sie diese Schritte, um diese Bewertungsmetriken in Ihre Axolotl -Pipeline zu integrieren:

Bereiten Sie Ihre Schulungsdaten vor, indem Sie einen Datensatz mit Absätzen aus den Werken des Zielautors erstellen und in Trainings- und Validierungssätze aufteilt.
Fein Ihres Sprachmodells mit dem Trainingssatz, folgt dem zuvor diskutierten Ansatz.
Generieren Sie Paraphrasen für die Absätze im Validierungssatz unter Verwendung des feinabstimmigen Modells.
Implementieren Sie die Bewertungsmetriken mithilfe der jeweiligen Bibliotheken ( sacrebleu , rouge , stylometry ) und berechnen Sie die Bewertungen für jede erzeugte Paraphrase.
Führen Sie die menschliche Bewertung durch, indem Sie Bewertungen und Feedback von menschlichen Bewertern sammeln.
Analysieren Sie die Bewertungsergebnisse, um die Qualität und den Stil der generierten Paraphrasen zu bewerten und fundierte Entscheidungen zu treffen, um Ihren Feinabstimmungsprozess zu verbessern.

Hier ist ein Beispiel dafür, wie Sie diese Metriken in Ihre Pipeline integrieren können:

 from sacrebleu import corpus_bleu
from rouge import Rouge
from stylometry import extract_features

# Fine-tune the model using the training set
fine_tuned_model = train_model ( training_data )

# Generate paraphrases for the validation set
generated_paraphrases = generate_paraphrases ( fine_tuned_model , validation_data )

# Calculate evaluation metrics
bleu_score = corpus_bleu ( generated_paraphrases , [ original_paragraphs ])
rouge = Rouge ()
rouge_scores = rouge . get_scores ( generated_paraphrases , original_paragraphs )
perplexity = fine_tuned_model . perplexity ( generated_paraphrases )
stylometric_features = extract_features ( generated_paraphrases )

# Perform human evaluation
human_scores = collect_human_evaluations ( generated_paraphrases )

# Analyze and interpret the results
analyze_results ( bleu_score , rouge_scores , perplexity , stylometric_features , human_scores )

Denken Sie daran, die notwendigen Bibliotheken (Sacrebleu, Rouge, Stylometrie) zu installieren und den Code so anzupassen, dass Sie Ihre Implementierung in Axolotl oder ähnliches entsprechen.

KI -Schreibmodellvergleich

In diesem Experiment habe ich die Fähigkeiten und Unterschiede zwischen verschiedenen KI-Modellen bei der Erzeugung eines 1500-Wörter-Textes untersucht, der auf einer detaillierten Eingabeaufforderung basiert. Ich habe Modelle von https://chat.lmsys.org/, Chatgpt4, Claude 3 Opus und einigen lokalen Modellen in LM Studio getestet. Jedes Modell erzeugte den Text dreimal, um die Variabilität ihrer Ausgänge zu beobachten. Ich habe auch eine separate Eingabeaufforderung für die Bewertung des Schreibens der ersten Iteration aus jedem Modell erstellt und Chatgpt 4 und Claude Opus 3 gefragt, um Feedback zu geben.

Durch diesen Prozess habe ich festgestellt, dass einige Modelle eine höhere Variabilität zwischen Ausführungen aufweisen, während andere dazu neigen, ähnliche Formulierungen zu verwenden. Es gab auch signifikante Unterschiede in der Anzahl der generierten Wörter und der Menge an Dialog, Beschreibungen und Absätzen, die von jedem Modell erzeugt wurden. Das Evaluierungs -Feedback ergab, dass ChatGPT eine "raffiniertere" Prosa vorschlägt, während Claude weniger lila Prosa empfiehlt. Basierend auf diesen Erkenntnissen habe ich eine Liste von Imbissbuden zusammengestellt, die in die nächste Aufforderung einbezogen werden, wobei ich mich auf Präzision, abwechslungsreiche Satzstrukturen, starke Verben, einzigartige Wendungen zu Fantasy -Motiven, konsistenten Ton, unterschiedlicher Erzählerstimme und ansprechendes Tempo konzentrierte. Eine andere Technik, die Sie berücksichtigen sollten, ist das Feedback und die Umschreibung des Textes basierend auf diesem Feedback.

Ich bin offen für die Zusammenarbeit mit anderen, um für jedes Modell weiterzugeben und ihre Fähigkeiten bei kreativen Schreibaufgaben zu erkunden.

Auf kleine LLMs auffordern

Direkte Anweisungen:
- Verwenden Sie saubere, spezifische und direkte Befehle.
- Vermeiden Sie Ausführlichkeit und unnötige Phrasen.
Adjektivmanagement:
- Vorsichtig sein mit Adjektiven; Sie können die Reaktion des Modells unangemessen beeinflussen.
Grenzwerte und Markdown:
- Verwenden Sie Backticks, Klammern oder Markdown, um unterschiedliche Teile des Textes zu trennen.
- Markdown hilft bei der Struktur und Trennung von Abschnitten effektiv.
Strukturierte Formate:
- Verwenden Sie JSON, Markdown, HTML usw. für Eingabe und Ausgabe.
- Einschränken Sie die Ausgabe bei Bedarf mit JSON -Schema.
Ein paar Schussbeispiele:
- Geben Sie nur wenige Beispiele aus verschiedenen Nischen an, um eine Überanpassung zu vermeiden.
- Verwenden Sie diese Beispiele, um die Modellschritte in einem Prozess zu "lehren".
Gedankenkette:
- Implementieren Sie die Kette des Gedächtnisses zur Verbesserung des Arguments und des Verfahrens.
- Teilen Sie Aufgaben in Schritte ein und führen Sie das Modell durch sie.
Beschreibung vor Fertigstellung:
- Fordern Sie das Modell auf, Entitäten vor der Beantwortung zu beschreiben.
- Stellen Sie sicher, dass diese Beschreibung nicht unbeabsichtigt in die Fertigstellung ausblutet.
Kontextverwaltung:
- Geben Sie nur einen wesentlichen Kontext an und vermeiden Sie unstrukturierte Absätze.
- Richten Sie das Modell auf die gewünschte Antwort mit ausreichend, aber prägnantem Kontext.
Testen und Überprüfung:
- Testen Sie die Eingabeaufforderungen mehrmals, um unerwartete Ausgänge zu erfassen.
- Verwenden Sie die Rangliste der Fertigstellung für Relevanz, Klarheit und Kohärenz.
Verwenden Sie Geschichten:
- Steuerung der Ausgabe mit Geschichtenerzähltechniken.
- Schreiben Sie beispielsweise eine Erzählung mit dem gewünschten Ausgangsformat.
GBNF -Grammatiken:
- Erforschen Sie die GBNF -Grammatik, um die Ausgabe des Modells einzuschränken und zu steuern.
Lesen und verfeinern:
- Überprüfen und verfeinern Sie generierte Eingabeaufforderungen, um unnötige Phrasen zu entfernen und Klarheit zu gewährleisten.

Lama 3 8b auffordern

Modelle haben inhärente Formatierungsverzerrungen. Einige Modelle bevorzugen Bindestriche für Listen, andere Sternchen. Bei der Verwendung dieser Modelle ist es hilfreich, ihre Vorlieben für konsistente Ausgänge zu spiegeln.

Schlüsselpunkte für Lama 3 Aufforderung:

Formatierende Tendenzen:
- Lama 3 bevorzugt Listen mit kühnen Überschriften und Sternchen.
- Beispiel: Fettdrucker Titelfall Überschrift
  - Listen Sie Elemente mit Sternchen nach zwei neuen Zeilen auf
  - Listen Sie Elemente auf, die durch eine neue Linie getrennt sind
  Nächste Liste
  - Weitere Listenelemente
  - Usw...
Ein paar Schussbeispiele:
- Lama 3 folgt sowohl Systemaufforderungen als auch wenige Beispiele.
- Es ist flexibel mit Anlaufmethoden, kann jedoch nur wenige Schussbeispiele wörtlich zitieren.
Systemumfortige Einhaltung:
- Lama 3 reagiert gut auf Systemaufforderungen mit detaillierten Anweisungen.
- Die Kombination von Systemaufforderungen und wenige Schussbeispiele führt zu besseren Ergebnissen.
Kontextfenster:
- Das aktuelle Kontextfenster ist klein und begrenzt die Verwendung umfangreicher Beispiele.
- Dies kann in zukünftigen Updates behandelt werden.
Zensur:
- Die Anweisungsversion hat eine gewisse Zensur, ist jedoch weniger eingeschränkt als frühere Versionen.
Intelligenz:
- Funktioniert gut in der Null-Shot-Kette des Gedächtnisses.
- In der Lage zu verstehen und sich an verschiedene Eingaben anzupassen.
Konsistenz:
- Im Allgemeinen konsistent, kann aber direkt Beispiele zitieren.
- Die Leistung kann sich mit höheren Temperaturen verschlechtern.

Nutzungsempfehlungen:

Listen und Formatierung:
- Verwenden Sie das bevorzugte Listenformat für eine bessere Genauigkeit.
- Legen Sie LLAMA 3 ausdrücklich für die gewünschten Ausgangsformate an, wenn sie sich von seiner Ausfall unterscheiden.
CHAT -Einstellungen:
- Geeignet für Aufgaben, die nach Intelligenz und Anweisungen folgen.
- Begrenzt durch Kontextfenster für große Aufgaben.
Pipeline -Einstellungen:
- Effektiv für GPT-4-Style-Pipelines mit Systemaufforderungen.
- Kontextfensterbeschränkungen beschränken einige Aufgaben.

Lama 3 ist flexibel und intelligent, hat aber Kontext und zitierende Einschränkungen. Passen Sie die Auflaufmethoden entsprechend an.

Anerkennung

Mit Wehklagen gebaut
UI -Komponenten von Shadcn/UI
Ikonen von Lucide

Beitragen

Alle Kommentare sind willkommen. Öffnen Sie ein Problem oder senden Sie eine Pull -Anfrage, wenn Sie Fehler finden oder Empfehlungen zur Verbesserung haben.

Lizenz

Dieses Projekt ist lizenziert unter: Attribution-Noncommercial-noderivatives (BY-NC-ND) Lizenz siehe: https://creativcommons.org/licenses/by-nc-nd/4.0/deed.en

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ AI-Quellcode
Aktualisierungszeit 2025-02-11
Größe 19.95MB
Kommt von Github

Ähnliche Anwendungen

node telegram bot api

2024-12-14
typebot.io

2024-12-14
python wechaty getting started

2024-12-14
TranscriberBot

2024-12-14
genal chat

2024-12-14
Facemoji

2024-12-14