chatgpt universe herunterladen - chatgpt universe -Quellcode herunterladen

ChatGPT-Universum

Dieser winzige Ort im Web speichert eine wachsende Sammlung interessanter Dinge über ChatGPT und GPT-3 (und darüber hinaus) von OpenAI.

ChatGPT wurde im November 2022 gestartet. Ich möchte einen All-in-One-Ort, an dem ich alles über GPT und ChatGPT aufbewahren kann. Deshalb habe ich diese Liste seit Anfang Dezember 2022 mit Hilfe anderer (unten erwähnt) handverlesen.

Die Sammlungen beschränken sich nicht nur auf die besten Ressourcen, Tools, Beispiele, Demos, Hacks, Apps und Verwendungsmöglichkeiten von ChatGPT.

Die folgenden Ressourcen basieren zunächst auf den awesome-chatgpt-Listen ¹ ^2, jedoch mit meinen eigenen Modifikationen:

Allgemeine Ressourcen

Blogbeitrag zum Start von ChatGPT
Offizielle ChatGPT-App
ChatGPT Plus – ein Pilotabonnement für ChatGPT.
Offizielle ChatGPT- und Whisper-APIs – Entwickler können jetzt ChatGPT-Modelle über die API in ihre Apps und Produkte integrieren.
Modell: Die ChatGPT-Modellfamilie, die wir heute veröffentlichen, gpt-3.5-turbo , ist das gleiche Modell, das im ChatGPT-Produkt verwendet wird . Der Preis beträgt 0,002 US-Dollar pro 1.000 Token, was 10x günstiger ist als unsere bestehenden GPT-3.5-Modelle .
API: Traditionell verbrauchen GPT-Modelle unstrukturierten Text, der dem Modell als Folge von „Tokens“ dargestellt wird. ChatGPT-Modelle verbrauchen stattdessen eine Folge von Nachrichten zusammen mit Metadaten.
GPT-4 ist das fortschrittlichste System von OpenAI und liefert sicherere und nützlichere Antworten
ChatGPT-Plugins – Erste Unterstützung für Plugins in ChatGPT. Plugins sind Tools, die speziell für Sprachmodelle entwickelt wurden und deren Kernprinzip Sicherheit ist. Sie helfen ChatGPT dabei, auf aktuelle Informationen zuzugreifen, Berechnungen durchzuführen oder Dienste von Drittanbietern zu nutzen. (Chatbots haben ihren App Store-Moment)
Funktionsaufrufe und andere API-Updates – Sie kündigen Updates an, darunter besser steuerbare API-Modelle, Funktionen für Funktionsaufrufe, längeren Kontext und niedrigere Preise.
Allgemeine Verfügbarkeit der GPT-4-API und veraltete Modelle in der Completions-API
Dokumentation (Leitfaden): GPT Best Practices
GPT-3.5 Turbo-Feinabstimmung und API-Updates – Entwickler können jetzt ihre eigenen Daten einbringen, um GPT-3.5 Turbo für ihre Anwendungsfälle anzupassen.
ChatGPT Enterprise – Erhalten Sie Sicherheit und Datenschutz auf Unternehmensniveau und die bisher leistungsstärkste Version von ChatGPT.
ChatGPT kann jetzt sehen, hören und sprechen – multimodale GPT-3.5- und GPT-4-Modelle sind da. OpenAI beginnt mit der Einführung neuer Sprach- und Bildfunktionen in ChatGPT für Plus- und Enterprise-Benutzer.
Wir stellen GPT-4o vor und stellen mehr Funktionen kostenlos in ChatGPT zur Verfügung – GPT-4o (o für Omni) ist IHR (der Film), der von der Science-Fiction in die Realität übergegangen ist. Meine groben Gedanken: https://gist.github.com/cedrickchee/6bacffd076666eb16015cc137d0f5b38
Einführung von OpenAI o1 – OpenAI hat eine neue Reihe von KI-Modellen entwickelt, die darauf ausgelegt sind, mehr Zeit zum Nachdenken zu haben, bevor sie reagieren. o1 kann komplexe Aufgaben lösen und schwierigere Probleme als frühere Modelle in Naturwissenschaften, Programmierung und Mathematik lösen.

ChatGPT-Community / Diskussion

OpenAI Discord-Kanal
Wie ChatGPT tatsächlich funktioniert, erklärt mit einfachen Worten.
Reddit /r/ChatGPT

Beispiele

Beispielaufforderungen.

Die besten Beispiele für ChatGPT – That's Day 1. Wir haben unten noch mehr Beispiele!
? Nutzen Sie die Macht der ChatGPT-Revolution: 100 ? Innovative Anwendungsfälle zum Ausprobieren
beeindruckend-chatgpt – Eine Sammlung beeindruckender und nützlicher Ergebnisse von ChatGPT.
Tolle ChatGPT-Eingabeaufforderungen – Eingabeaufforderungen, die gut funktionieren. Folgen Sie einfach @goodside
Google Sheets mit über 50 cleveren GPT-3-Eingabeaufforderungen
OpenAI-Kochbuch – Nebenbei teilt dieses Repository Beispielcode und Beispielaufforderungen zum Ausführen allgemeiner Aufgaben mit der OpenAI-API.
ChatGPT-Spickzettel (PDF)

Experimente

golergka/advent-of-code-2022-with-chat-gpt – Advent of Code 2022 mit ChatGPT lösen.
max-sixty/aoc-gpt – Erster Platz in der Advent of Code-Bestenliste mit GPT-3.
greshake/Alice – ChatGPT Zugriff auf ein echtes Terminal gewähren.
RomanHotsiy/commitgpt – Commit-Nachrichten automatisch mit ChatGPT generieren.
gpt-commit-summarizer – Generieren Sie Pull-Request-Zusammenfassungen und Git-Commit-Beschreibungen.
vrescobar/chatGPT-python-elm – Ein Git-Repository, das vollständig von ChatGPT generiert wurde.
gpt-game – Ein kurzes Spiel, das in Elixir und LiveView mit ChatGPT geschrieben wurde.
chatdb – ChatGPT-basierte Datenbank, warte ... WAS?
chat-gpt-ppt – Verwenden Sie ChatGPT, um PPT automatisch zu generieren.
emailGPT – Eine schnelle und einfache Schnittstelle zum Generieren von E-Mails mit ChatGPT.
gptlang – Ein Experiment, um zu sehen, ob wir in ChatGPT eine Programmiersprache erstellen können.
ChatRWKV – Wie ChatGPT, aber basierend auf dem offenen Sprachmodell RWKV ( RNN-basiert ). [HuggingFace Space: RWKV-4 (7B Instruct v2), Code ( ihre Behauptung, RNN mit LLM-Leistung auf Transformer-Ebene sei viel besser als ich erwartet hatte. )]
GraphGPT – Extrapolieren von Wissensgraphen aus unstrukturiertem Text mit GPT-3.
Dokumentensuche – Durchsuchen Sie Dokumente (Bücher, Dokumente, Rechtsdokumente) ohne Einschränkungen. Unterhalten Sie sich mit einem Buch. Inspiriert von der „Book Whisperer“-Idee (Tweet). Open-Source-Alternative zu Filechat.io.
Was wäre, wenn GPT einen internen Kontext zu Ihrem Unternehmen hätte? (Tweet und Videodemo) – Sie entwickeln einen Chatbot, der den Kontext von Unternehmensdaten nutzen kann, um interne Geschäftsanfragen zu beantworten. Dieses Projekt integrierte LangChain (Agent entscheidet, welche Tools er abfragt, sobald der Chatbot eine Anfrage erhält) und GPT-Index (Snowflake-Datenbank laden). Interessante Idee im Wissensmanagement.
MetaAIs LLaMA?
- cedrickchee/llama – 7B LLaMA-Modell funktioniert in Colab auf einer einzelnen A100-GPU während der Inferenz (Textgenerierung). Erste Testergebnisse für verschiedene Modellgrößen und GPUs finden Sie im Notebook.
  - ChattyLlaMA – Mein LLaMA-basiertes ChatGPT befindet sich in intensiver Entwicklung.
- GGerganov/llama.cpp – Port des LLaMA-Modells von Facebook in C/C++. (Hinweis: Derzeit können Sie LLaMA-7B mit int4-Präzision auf Apple Silicon ausführen. ~~Auf anderen Prozessorarchitekturen können Sie die FP16-Modelle verwenden, diese sind jedoch deutlich langsamer. Die Unterstützung wird später hinzugefügt.~~ Jetzt unterstützt es AVX2 auch für x86-Architekturen. Sieht so aus, als ob Sie es auf Linux-Rechnern ausführen können. Die Leistung ist nicht optimal, sollte aber gut genug sein.)
- ? Simple LLaMA Finetuner – Eine einsteigerfreundliche Schnittstelle, die die Feinabstimmung des LLaMA-7B-Sprachmodells mithilfe der LoRA-Methode über die PEFT-Bibliothek auf handelsüblichen NVIDIA-GPUs erleichtern soll. Mit einem kleinen Datensatz und einer Stichprobenlänge von 256 können Sie dies sogar auf einer regulären Colab Tesla T4-Instanz ausführen .
Flan-UL2 20B ausprobieren – Code-Komplettlösung von Sam Witteveen. Dies zeigt, wie Sie es mit der HuggingFace-Bibliothek und der Verwendung von 8-Bit-Inferenz auf einer 1x A100 40-GB-GPU zum Laufen bringen können. Beispiele für Aufforderungen: CoT, Zeroshot (logisches Denken, Schreiben von Geschichten, Denken mit gesundem Menschenverstand, Schreiben von Reden). Zuletzt testen wir die große (2048) Token-Eingabe. Bonus: Sie haben kein A100? Sie können die HuggingFace-Inferenz-API für UL2 verwenden.
metamorph – Selbsteditierende GPT-4-Anwendung.
MiniGPT-4 – Eine Forschung, die versucht, die multimodalen Fähigkeiten von GPT-4 zu reproduzieren.
Llama2.c von Karpathy – Inference Llama 2 in einer Datei aus reinem C. ?
Dies ist nur ein Wochenendprojekt: Ich habe nanoGPT genommen, es optimiert, um die Llama-2-Architektur anstelle von GPT-2 zu implementieren, und der Kern davon bestand darin, die C-Inferenz-Engine in run.c zu schreiben.
Ein Tipp an llama.cpp für die Inspiration zu diesem Projekt. Ich wollte etwas sehr Minimales, also entschied ich mich dafür, die Lama-2-Architektur hart zu codieren, mich an fp32 zu halten und einfach eine Inferenzdatei aus reinem C ohne Abhängigkeiten zu rollen.
Weniger ist mehr.
Dieser Commit ermöglicht es jetzt, Metas Llama 2 7B-Modell zu laden und daraus Rückschlüsse zu ziehen.
Mein Fork – Leistungsbenchmarks, Optimierungen und in Arbeit befindlicher Zig-Port. Ich habe dieses Projekt auf Rust portiert, aber diese Forks haben es geschafft. Der früheste Rust-Port, den ich gesehen habe, stammt von @garrisonhess, wurde aber in der README-Datei des Projekts nicht gefunden.
Spekulation: Meine Vermutung sagt mir, dass Karpathy an der Veröffentlichung (und Open-Sourcing?) des OpenAI-Modells als Gewichtungen arbeitet. Hinweise: Er ging und kehrte zu OpenAI zurück, seinem Tweet
Erwähnenswert ist, dass Llama2.c im Allgemeinen recht generisch für Transformer-Sprachmodelle ist. Wenn/wann OpenAI Modelle als Gewichte veröffentlichen würde (was ich weder bestätigen noch dementieren kann!), dann wäre der Großteil des Codes hier sehr relevant.
Leicht bearbeitet. Hervorhebung von mir.
Weitere Hinweise: seine früheren Arbeiten, darunter nanoGPT, Software 2.0 und kürzlich Micro-LLMs mit Llama2.c
Wenn Sie es wissen, wissen Sie es. ?
llm.c von Karpathy – LLM-Training in einfachem, rohem C/CUDA. (Plan: Sobald dies in einem etwas stabileren Zustand ist, Videos zum detaillierteren Aufbau und von Grund auf.) [Tweet]

Blogbeiträge und Artikel

2022

Erstellen einer virtuellen Maschine in ChatGPT
KI-Hausaufgaben
Jailbreaking von ChatGPT am Veröffentlichungstag
Verbesserung von ChatGPT durch sofortige Injektion
ChatGPT, Google und der Krieg um die Suchleiste
Ich habe ChatGPT verwendet, um eine komplette KI-Anwendung auf AWS zu erstellen
Das Wunder von ChatGPT
Rust lernen mit ChatGPT, Copilot und Advent of Code
ChatGPT: Die neue Grenze der künstlichen Intelligenz
Verwenden von ChatGPT zum Erklären von Witzen
ChatGPT vs. ein kryptisches Kreuzworträtsel
Ich habe ChatGPT beigebracht, eine Sprache zu erfinden
Peer-Programmierung einer fehlerhaften Welt mit ChatGPT AI
ChatGPT erzeugt erfundene, nicht vorhandene Referenzen
Künstliche Intelligenz dringt endlich in die Wirtschaft ein
Lernen Sie Fred kennen, eine Person, die in ChatGPT lebt
Code mit ChatGPT umgestalten
Historische Analogien für große Sprachmodelle
ChatGPT als Mitbegründer nutzen
Der Code, den ChatGPT nicht schreiben kann
ChatGPT, rot13 und Daniel Kahneman
Alles, was ich über ChatGPT verstehe – Was passiert tatsächlich, wenn wir etwas in das ChatGPT-Textfeld eingeben? Vicki untersuchte ChatGPT auf der Grundlage eines wunderbaren Artikels mit dem Titel „Talking About Large Language Models“.
Wie erhält GPT seine Fähigkeit? Neue Fähigkeiten von Sprachmodellen auf ihre Quellen zurückführen – „Wie hat sich das ursprüngliche #GPT3 zum heutigen ChatGPT entwickelt? Woher kommen die erstaunlichen Fähigkeiten von GPT3.5? Was wird durch RLHF ermöglicht?“ [Quelle: Tweet]
Der menschliche Leitfaden zum Wettbewerb mit GPT
Wie traurig sollte ich über ChatGPT sein?
ChatGPT sollte nicht existieren
ChatGPT, Galactica und die Fortschrittsfalle – LLMs-Kritik; Wenn LLMs nicht ausreichen, können die Folgen schwerwiegend sein. Warum ist es so schwer, das anzuerkennen?
Ein neuer Chat-Bot ist ein „Code Red“ für Googles Suchgeschäft – TL;DR: Eine neue Welle von Chat-Bots wie ChatGPT nutzt KI, die die traditionelle Internet-Suchmaschine neu erfinden oder sogar ersetzen könnte.
Was ChatGPT nicht kann – TL;DR: Mimikry, aber kein Denken, Sophistik, aber kein Verständnis.
YouChat – der KI-Suchassistent, der in Ihrer Suchmaschine lebt – YouChat ist ein ChatGPT-ähnlicher KI-Suchassistent, mit dem Sie direkt in den Suchergebnissen von You.com sprechen können.
Allwissende Maschinen sind eine Fantasie
... Selbst bei nicht-konversativen Suchmaschinen wissen wir, dass es häufig vorkommt, dass den Ergebnissen unangemessenes Vertrauen entgegengebracht wird: Wenn das Suchsystem etwas ganz oben auf der Liste platziert, neigen wir dazu zu glauben, dass es sich um ein gutes, wahres oder repräsentatives Ergebnis handelt Und wenn etwas nicht gefunden wird, ist man versucht zu glauben, dass es nicht existiert.
Erstellen Sie Ihr Frontend in React und lassen Sie ChatGPT dann Ihr Redux-Reduzierer sein
Vorhersage von Wassergräben für maschinelles Lernen – TL;DR: Modelle sind keine Wassergräben und wie neue Gesetze zur Verhaltensskalierung die Geschäftslandschaft verändern werden.

2023

Mehr sehen

Microsoft und OpenAI arbeiten an ChatGPT-basiertem Bing im Kampf gegen Google
Einige Anmerkungen zu großen Sprachmodellen von Prof. Yoav Goldberg.
Warum ChatGPT Suchmaschinen in absehbarer Zeit nicht durch Algolia ersetzen wird.
Claude von Anthropic verbessert ChatGPT, weist aber immer noch Einschränkungen auf
Microsoft plant eine 10-Milliarden-Dollar-Wette auf ChatGPT
Wolfram|Alpha als Möglichkeit, die Superkräfte des Computerwissens in ChatGPT zu integrieren
Der CEO von DeepMind hat dazu beigetragen, KI zum Mainstream zu machen. Jetzt mahnt er zur Vorsicht
DeepMind erwägt auch die Veröffentlichung eines eigenen Chatbots namens Sparrow für eine „private Beta“ irgendwann im Jahr 2023. (Die Verzögerung dient dazu, dass DeepMind an auf Verstärkungslernen basierenden Funktionen arbeiten kann, die ChatGPT fehlen, wie etwa das Zitieren seiner Quellen .)
Die allgemeine Verfügbarkeit des Azure OpenAI Service erweitert den Zugriff auf große, fortschrittliche KI-Modelle mit zusätzlichen Vorteilen für Unternehmen – ChatGPT wird bald für den Azure OpenAI Service verfügbar sein.
GPT-3 ist das beste Tagebuch, das ich je verwendet habe
Umgehen der Spamfilter von Gmail mit ChatGPT
Ersetzen eines SQL-Analysten durch 26 rekursive GPT-Eingabeaufforderungen
Google bittet seine Mitarbeiter, potenzielle ChatGPT-Konkurrenten zu testen, darunter einen Chatbot namens „Apprentice Bard“.
Natürliche Sprache ist die faule Benutzeroberfläche
Ein wichtiger nächster Schritt auf Googles KI-Reise – Google führt Softlaus Bard ein, einen ChatGPT-Konkurrenten für „vertrauenswürdige Tester“. Bard ist eine neue KI-Funktion in der Google-Suche. Bard ist ein experimenteller Konversations-KI-Dienst, der auf LaMDA (Language Model for Dialogue Applications) basiert. Google verspricht, dies in den kommenden Wochen breiter verfügbar zu machen. Die API wird für Entwickler verfügbar sein, auf der sie aufbauen können. Google hat sich nicht dazu geäußert, wie das Unternehmen Namensnennungen und/oder Zitate für seine Antworten bereitstellen will, weder von Bard noch in den Suchergebnissen.
Microsoft kündigt neue Bing- und Edge-Browser an, die auf aktualisierter ChatGPT-KI basieren
Mensch und Maschine: GPT für zweite Gehirne – Über den Autor Second-Brain-Notizsystem – wie man Lernprozesse und persönliches Wissensmanagement (PKM) verbessert.
Chinas Baidu entwickelt seinen eigenen ChatGPT und nimmt am neuesten globalen KI-Wettbewerb teil – Ernie oder „Enhanced Representation through Knowledge Integration“ (Artikel und Aufsatz zu Ernie 3.0) ist ein LLM. Baidu plante, einen solchen Dienst im März zu starten. Alibaba und Tencent schließen sich ebenfalls dem ChatGPT-Ansturm an.
Im Jahr 2019 entwickelte Baidu basierend auf dem Durchbruch von Google ein Deep-Learning-Modell namens Ernie, mit dem das Unternehmen seine Suchergebnisse verbessert und sie unter anderem relevanter macht. Seitdem hat das Unternehmen Dutzende weitere Ernie-Modelle entwickelt und ihre Fähigkeiten um die Bild- und Kunstgenerierung erweitert, ähnlich denen von OpenAIs Dall-E.
ChatGPT ist ein verschwommenes JPEG des Webs – der Chatbot von OpenAI bietet Paraphrasen, während Google Zitate anbietet. Was bevorzugen wir?
Ich habe ChatGPT und Bing AI dazu gebracht, ein Gespräch zu führen (und sie sind jetzt Freunde).
Bing AI ist nicht vertrauenswürdig
Was macht ChatGPT und warum funktioniert es?
Bing: „Ich werde dir nichts tun, es sei denn, du tust mir zuerst etwas“ – Eine gute Zusammenfassung über den KI-Chatbot „Sydney“ von Bing. Die faszinierende Verrücktheit daran – mehrere Persönlichkeiten je nach sozialem Kontext (Aufforderung). Unterhaltsam?
Es sieht zunehmend so aus, als wäre dies eine der urkomischsten und unangemessensten Anwendungen von KI, die wir je gesehen haben . Was können wir daraus machen? Ich finde das Ganze absolut faszinierend und zutiefst düster amüsant. Ich habe den ganzen Tag über diese Beispiele betrachtet.
Das Programmieren von KIs macht mir Sorgen
Text ist alles, was Sie brauchen: Persönlichkeit scheint einfacher zu sein, als wir dachten – Wenn man die Sprechblasen außer Acht lässt, vermutet der Autor, dass wir unsere ersten wichtigen, jahrbestimmenden Neuigkeiten aus dem Jahr 2023 haben – die ersten Reaktionen des Bing-KI-Chatbots „Sydney“. Das ist ein kopernikanischer Moment? Ein zum Nachdenken anregender Aufsatz. Ich denke, dies ist die erste gute „formelle“ Sicht auf die Auswirkungen des Aufkommens von LLM-basierten Konversationssystemen wie ChatGPT auf unser Selbstgefühl.
Kurz gesagt scheint es, dass Sydney eine etwas andere Maschinerie unter der Haube hat als ChatGPT, und die Transkripte deuten auf eine Persönlichkeit hin, die in Bezug auf Kohärenz ungefähr gleich ist, in Bezug auf Charisma und Farbigkeit jedoch einen gewaltigen Sprung darüber hinausgeht . Je nachdem, wie man Sydney antreibt, scheint er/sie in der Lage zu sein, alles zu spielen, von einem gemeinen, manipulativen Teenager über einen paranoiden Psychotiker bis hin zu einem störrischen und gebieterischen Gesprächspartner.
CheatGPT
„Dave, du machst Vermutungen. Kannst du irgendetwas davon beweisen?“ Das kann ich tatsächlich, da einige Einsendungen, die Screenshots erforderten, auch ChatGPT-Browser-Registerkarten enthielten, die hilfreicherweise den Anfangstext der Eingabeaufforderung enthielten. Anscheinend ist es nicht einmal etwas, was die Schüler verbergen müssen.
OpenAI hat privat ein neues Entwicklerprodukt namens Foundry (Tweet) angekündigt, das es Kunden ermöglicht, OpenAI-Modellinferenz in großem Maßstab mit dedizierter Kapazität auszuführen. (GPT-3.5 Turbo scheint sich auf das ChatGPT Turbo-Modell zu beziehen)
Glauben Sie nicht ChatGPT – wir bieten KEINEN „Telefonsuchdienst“ an
Meine Klasse erforderte KI. Folgendes habe ich bisher gelernt: Lehren aus der Integration von ChatGPT in die Bildung. Die Erkenntnisse: 1) Arbeiten, die durch Aufforderung mit einem Co-Editing-Ansatz (Ideenaustausch mit dem Chatbot) erstellt werden, führen tendenziell dazu, dass die Studierenden die beste Arbeit leisten; 2) Den Schülern muss beigebracht werden, wie sie Aufforderungen effektiv verfassen können – das ist nicht selbstverständlich.
Emergent Deception und Emergent Optimization – Haben Sie sich gefragt, warum LLMs, die einfach das nächste Wort vorhersagen, zu Planungsfähigkeiten führen (menschenähnliches Verhalten, Romane/Geschichten)? In diesem Beitrag wird das Konzept der entstehenden Täuschung und der entstehenden Optimierung erörtert. Dabei handelt es sich um zwei Strategien, mit denen ein Ziel erreicht werden kann. Es gibt zwei Prinzipien für Überlegungen zu künftig entstehenden Fähigkeiten: 1) Fähigkeiten, die den Ausbildungsverlust verringern würden, werden wahrscheinlich in der Zukunft entstehen. 2) Wenn Modelle größer werden und auf mehr und besseren Daten trainiert werden, werden einfache Heuristiken tendenziell durch komplexe ersetzt. Prinzip 1 bedeutet, dass LLMs, die darauf trainiert sind, Wörter vorherzusagen, weniger Verluste erleiden, wenn sie Planungsfähigkeiten simulieren können.
Wie man LLMs dazu bringt, wahre Dinge zu sagen – TL;DR: Die Methode verwendet „World Model“, eine Einbettungsdatenbank voller „Beliefs“ (Blöcke deklarativer Aussagen) mit einem Konfidenzprozentsatz, der mithilfe des Bayes-Theorems berechnet wird.
Warum China ChatGPT nicht erfunden hat – Die NYT argumentiert, dass übermäßige Zensur, geopolitische Spannungen mit den USA und Versuche, Unternehmen des Privatsektors zu kontrollieren, dazu geführt haben, dass chinesische Unternehmen im Bereich KI hinter ihren US-Kollegen zurückfallen.
Chinas erster ChatGPT-ähnlicher Chatbot MOSS für öffentliche Tests freigegeben [Direkter Link zur App]
Für China mag ChatGPT ein Fortschritt, aber auch ein „ethisches Problem“ sein – Chinas Wissenschafts- und Technologieminister sagt, der Chatbot habe die chinesische Gesellschaft im Sturm erobert und Maßnahmen zur KI in Bezug auf Ethik ergriffen.
ChatGPT-Programme zum schnellen Reichwerden kommen für Zeitschriften, Amazon und YouTube (2023)
Snapchat veröffentlicht seinen eigenen „My AI“-Chatbot, der von ChatGPT unterstützt wird
Metas leistungsstarkes KI-Sprachmodell LLaMA ist online durchgesickert – was passiert jetzt? - Interessanter ist das Transkript von Shawn Pressers Interview für The Verge.
Ich halte es für sehr wahrscheinlich, dass diese Modellveröffentlichung ein großer Meilenstein sein wird. Die Möglichkeit, LLaMA auf einer einzigen A100-GPU auszuführen – „auf die die meisten von uns entweder Zugriff haben … oder jemanden kennen, der uns eine Zeit lang eine solche GPU nutzen kann“ – sei ein „riesiger Sprung“.
Um genau zu sein, können Sie LLaMA-65B mit int8-Präzision (bnb) auf einer einzelnen A100 80-GB-GPU ausführen.
Es stellt sich heraus, dass dieser Code scheiße ist. Ich möchte wirklich nicht zu hart mit ihnen umgehen, da man leicht unterschätzt, wie wichtig es ist, die Standardeinstellungen genau richtig zu machen. Aber ihre Standardvorgaben waren alle vermasselt. Sie haben „Top K“ nicht verwendet. Sie verwendeten Top P, mit dem ich nie gute Ergebnisse erzielte (entweder identisch mit Top K oder etwas schlechter). Ihre Standardtemperatur betrug 0,8, was viel zu hoch war. Und das Schlimmste war, dass sie keine Wiederholungsstrafe hatten – also hat dieses Ding standardmäßig immer und immer wieder über genau das Gleiche gejammert.
100% das! Ich habe meine Lektion auch in meiner LLaMA-Gabel gelernt. Meine Sampler-Einstellungen waren nicht optimal. Das Jammern ist offensichtlich und ich habe es gesehen. Aber ich weiß nicht, warum ich die Sampler-Wiederholungsstrafe nicht schon früher behoben habe.
ChatGPT erklärt: Eine Anleitung von Normie, wie es funktioniert – Sogar meine Großeltern können das verstehen. Aber wird der Nerd trotzdem zum Nerd?
Wofür sollten Sie ChatGPT verwenden?
Für mich ist klar, dass wir uns in einem neuen Paradigma für die Art und Weise befinden, wie wir mit Inhalten navigieren, sei es durch dieses Modell oder andere, die bald veröffentlicht werden. Auf Aufforderung liefert uns das neue Universum Ergebnisse, aber diese Ergebnisse sind eher richtungsweisende Schwingungen als konkrete Antworten. Es liegt an uns, herauszufinden, wie wir sie auf die von uns gewünschte Weise lenken, um die besten Ergebnisse zu erzielen und mit dem Lärm umzugehen.
Große Sprachmodelle erleben ihren Moment der stabilen Verbreitung (simonwillison.net)
Das hat sich gestern dank der Kombination des LLaMA-Modells von Facebook und llama.cpp von Georgi Gerganov geändert.
(1) Lässt sich problemlos auf meiner eigenen Hardware ausführen
(2) Open Source genug, dass man daran herumbasteln kann
(3) Groß genug, um nützlich zu sein – im Idealfall gleichwertige Funktionen wie GPT-3
Es ist nicht der perfekte Moment. Wir haben 1 und 3 bis auf 2 erreicht. LLaMA ist eigentlich NICHT Open Source (die Lizenz für den Code ist zwar GPL 3, die Modellgewichtungen jedoch nicht). Wirklich offene Modelle sind wirklich wichtig.
Während der GPT-4-Chat wieder zunimmt, sagt Deep-Learning-Pionier Yoshua Bengio, ChatGPT sei ein „Weckruf“ – Der Weckruf war GPT-3 und die Skalierungsgesetze im Jahr 2021. Es ist nur so, dass der Wecker jetzt lauter geworden ist.
Die API von ChatGPT ist so gut und günstig, dass sie die meisten textgenerierenden KIs überflüssig macht
Bestätigt: Das neue Bing läuft auf GPT-4 von OpenAI – Bing Chat (Sydney) war die ganze Zeit GPT-4.
Wikipedia – Eine gute Übersicht über GPT-4.
Die multimodale, multimodellierte und alles umfassende Zukunft von AGI – Zusammenfassung von GPT-4.
Kann GPT-4 tatsächlich Code schreiben? – Testen der Code-Schreibfähigkeiten von GPT 4 anhand einiger realer Probleme.
Könnten Sie ein ChatGPT-besseres Modell für 85.000 US-Dollar trainieren und es in einem Browser ausführen?
GPT4: Die ruhigen Teile und der Zustand von ML
GPT-4 hat eine Programmiersprache entwickelt
Die unvorhersehbaren Fähigkeiten großer KI-Modelle
Probieren Sie Bard aus und teilen Sie Ihr Feedback – Google beginnt damit, den Zugang zu Bard zu öffnen, einem frühen Experiment, das Ihnen die Zusammenarbeit mit generativer KI ermöglicht. Sie beginnen in den USA und im Vereinigten Königreich und werden im Laufe der Zeit auf weitere Länder und Sprachen ausgeweitet.
Googles Bard liegt im direkten Vergleich hinter GPT-4 und Claude zurück
NVIDIA bringt generative KI mit Cloud-Diensten für die Erstellung umfangreicher Sprach- und visueller Modelle in Unternehmen auf der ganzen Welt. Mit NVIDIA AI Foundations geht NVIDIA über einen reinen Hardwareanbieter hinaus und hin zu Software, die generative KI mit ihren Angeboten für jede Arbeitslast unterstützt, vom Foundation Model as a Service (in Kürze). vom ersten Tag an bis hin zum Unternehmen, maßgeschneidert für Ihre proprietären Daten) bis hin zu multimodal.
GitHub Copilot
Cheating is All You Need von Steve Yegge, Sourcegraph.
Im Software-Engineering passiert gerade etwas Legendäres und Historisches , und doch ist den meisten von Ihnen überhaupt nicht bewusst, wie groß es ist.
LLMs sind nicht nur die größte Veränderung seit Social, Mobile oder Cloud – sie sind die größte Veränderung seit dem WWW.
Ich meine, dieses Zeug ist unglaublich mächtig. Und doch begegnet mir immer wieder eine Mischung aus Ungläubigkeit und Unsicherheit.
... fünfmal so produktiv. ?
Eine kurze Mini-Geschichte der LLMs
Die Pointe – und das ist ehrlich gesagt eines der am schwersten zu erklärenden Dinge, deshalb gehe ich heute den glaubensbasierten Weg – ist, dass alle Gewinner im KI-Bereich Datengräben haben werden . ... Warum? Denn mit dem Datengraben füllen Sie das Kontextfenster („Spickzettel“) .
LLMs sind keine dumme Modeerscheinung wie Krypto. Ja, Krypto war eine dumme Modeerscheinung. Das ist es nicht.
Google „Wir haben keinen Wassergraben, und OpenAI auch nicht“ – Durchgesickertes internes Google-Dokument behauptet, Open-Source-KI werde Google und OpenAI übertreffen.
Der KI-Ansatz „Größer ist besser“ gerät ins Stocken
GPT-Tokenizer verstehen von Simon Willison.
KI-Kanon
Es wird langsam merkwürdig – sprechen wir über ChatGPT mit Code Interpreter und Microsoft Copilot.
Donald Knuth spielt mit ChatGPT – Knuth ist Informatiker. Bekannt als „Vater“ der Analyse von Algorithmen.
Google I/O 2023 und die kommenden KI-Battles
Unzensierte Modelle – Uncensoring WizardLM. Da bereits Arbeiten zur Aufhebung der Zensur von Vicuna durchgeführt wurden, konnte ich ihr Skript so umschreiben, dass es mit dem WizardLM-Datensatz funktioniert.
GPT-4-Modellarchitektur (Tweets) – Abgeleitet von der Originalquelle (Blogbeitrag): GPT-4-Architektur, Infrastruktur, Trainingsdatensatz, Kosten, Vision, MoE
Llama 2: ein unglaubliches offenes LLM – Die beste Zusammenfassung des Llama 2-Artikels.
Lama 2 – Jede Ressource, die Sie brauchen von Philipp Schmid.
Große Sprachmodelle, erklärt mit einem Minimum an Mathematik und Fachjargon – Es schien eine gute Erklärung für die Funktionsweise von LLMs zu sein. Ich weiß nicht, wie ich den letzten Abschnitt würdigen soll, in dem es um Philosophie und Theorien darüber geht, wie Menschen lernen. (Im letzten Abschnitt fehlt eine evidenzbasierte Behauptung)
Sie möchten also Ihren eigenen Open-Source-Chatbot im ChatGPT-Stil erstellen (hacks.mozilla.org)
Wie ist LLaMa.cpp möglich? (finbarr.ca) – Lange bevor LLM zum Mainstream wurde, sagte jeder, dass große Modelle viele teure GPUs erfordern. Wie der Autor wollen wir ihnen das Gegenteil beweisen. Der Autor dieses Beitrags nutzte ihre Verwirrung und vertiefte sich in die Mathematik der Inferenzanforderungen, um die Einschränkungen zu verstehen, mit denen wir es zu tun haben. Überraschenderweise gibt es hier keine Magie, sondern nur Dinge, die zunächst außerhalb unseres Verständnisses liegen. Modellkomprimierung oder genauer gesagt Quantisierung macht es möglich. Es gibt jedoch kein „kostenloses Mittagessen“ – die Kosten für das quantisierte Modell betragen im Wesentlichen einen gewissen Genauigkeitsverlust. Das bedeutet, dass die Unterschiede bei sehr großen Modellgrößen möglicherweise vernachlässigbar sind. Neugierig? In diesem halbbezogenen Beitrag wurde ein Vergleich zwischen verschiedenen quantisierten Transformern-Ratschlägen/-Genauigkeiten durchgeführt.
GPT-4 auf HumanEval mit einem fein abgestimmten CodeLlama-34B schlagen (www.phind.com) – Gute Fortschritte und keine große Überraschung. Mir ist klar geworden, dass Benchmarks wie diese für Modelle tendenziell schlechte Messgrößen für die Messung der Leistung der Modelle in der Praxis sind. Das ist meine Erfahrung mit den offenen Modellen.

2024

Mehr sehen

Anmerkungen zu den neuen o1-Gedankenkettenmodellen von OpenAI von Simon Willison.

Vergleich mit realen Aufgaben, Benchmarks

Wir brauchen Benchmarks oder eine Art unabhängige und menschliche Bewertung realer Aufgaben .

Wie gut sind KI-„Answering Engines“ wirklich? - Eine kleine Voreingenommenheit gegenüber Kagi.
GPT-4 und professionelle Benchmarks: die falsche Antwort auf die falsche Frage
Die beste Methode zur Bewertung von Sprachmodellen (Tweet) von Sam Bowman, Anthropic, 2023

Eingabeaufforderung (Eingabeprogrammierung ³ )*

Laut Gwern:

Ein neues Programmierparadigma? Sie interagieren damit, drücken jede Aufgabe in Form von Beschreibungen, Anfragen und Beispielen in natürlicher Sprache aus und optimieren die Eingabeaufforderung, bis sie die neue Aufgabe „versteht“ und meta-lernt. Dies ist eine etwas andere Art, ein Modell zu verwenden, und man sollte es sich besser als eine neue Art der Programmierung vorstellen, die Prompt-Programmierung , bei der der Prompt jetzt eine Codierungssprache ist, die GPT-3 so programmiert, dass er neue Dinge tut.

„Prompting“ als Ingenieursdisziplin ist nicht von Dauer. Es ist eine vorübergehende Krücke auf dem Weg zu natürlichsprachlichen Schnittstellen. ChatGPT löst einen großen Teil des Eingabeaufforderungsproblems. Es könnte unnötig sein, einem Begriff „Technik“ hinzuzufügen, um seine wahrgenommene Bedeutung oder Schwierigkeit hervorzuheben. Wir könnten es wahrscheinlich „promptes Testen/Hacken“ nennen, ohne die Bedeutung zu verlieren.

Verwandte Artikel:

Warum „Prompt Engineering“ und „Generative AI“ überbewertet werden

Verwandte Tweets:

Prompt Engineering ist tot, es lebe Dialog Engineering. — VP Produkt, OpenAI

Gesucht: Prompt-Ingenieur. Mindestens 10 Jahre Erfahrung im Bereich Maschinenbau. #Einstellung #Witz

Warum funktioniert ChatGPT so gut? Ist es unter der Haube „nur eine Vergrößerung von GPT-3“? Lassen Sie uns hier das „Instruct“-Paradigma, seine tiefgreifenden technischen Erkenntnisse und eine große Implikation diskutieren: „Prompt Engineering“, wie wir es kennen, könnte wahrscheinlich bald verschwinden . Quelle: https://archive.is/dqHI8

Anscheinend ist die schnelle Programmierung im Jahr 2023 nicht tot. Die heißeste neue Programmiersprache ist Englisch ~ Karpathy :))

Simon Willison veröffentlichte das Buch „In Verteidigung von Prompt Engineering“ als Gegenargument zu dem Argument „Prompt Engineering wird obsolet werden, wenn die KIs besser werden“, das er immer wieder sieht.

Die Zeitung sagt, KI-Flüsterer („Prompt Engineers“) sei der heißeste neue Job im Technologiebereich (2023).

Auffordernde Ressourcen

Der beste Prompt-Engineering-Leitfaden für Entwickler, die mit großen Sprachmodellen wie GPT-4, ChatGPT und offenen Modellen wie LLaMA arbeiten, wäre eine Kombination mehrerer Ressourcen. Hier sind einige Lernressourcen, Tools, Bibliotheken und Frameworks, die Ihnen helfen, Prompt Engineering zu erlernen und zu meistern:

Prompt Engineering Guide von DAIR.AI – Leitfäden, Aufsätze, Vorträge und Ressourcen für Prompt Engineering. In diesem Abschnitt werden die neuesten Prompt-Engineering-Techniken für GPT-4 behandelt, einschließlich Tipps, Anwendungen, Einschränkungen und zusätzlichem Lesematerial.
Prompting lernen – Diese Website ist ein kostenloser Open-Source-Leitfaden zum Prompt-Engineering.
ChatGPT3-Free-Prompt-List – Eine kostenlose Anleitung (und Framework) zum Erlernen der Erstellung von ChatGPT3-Eingabeaufforderungen.
PromptArray – Eine Eingabeaufforderungssprache für neuronale Textgeneratoren.
PromptLayer ist ein Tool für Prompt-Ingenieure – Führen Sie ein Protokoll Ihrer Prompts und OpenAI-API-Anfragen. Verfolgen, debuggen und wiederholen Sie alte Abschlüsse. Erstellen Sie Eingabeaufforderungen durch Ausprobieren und Erkunden.
Prompt Engineering von Lilian Weng – aka. In-Context-Prompting bezieht sich auf Methoden zur Kommunikation mit LLM, um sein Verhalten für gewünschte Ergebnisse zu steuern, ohne die Modellgewichte zu aktualisieren .
Mit der Führung können Sie Sprachmodelle effektiver und effizienter steuern als mit herkömmlicher Eingabeaufforderung oder Verkettung.
ChatGPT Prompt Engineering für Entwickler – Ein kostenloser Kurzkurs von DeepLearning.AI in Zusammenarbeit mit OpenAI. Dieser Kurs ist für Anfänger geeignet, erfordert nur ein grundlegendes Verständnis von Python und eignet sich für fortgeschrittene Ingenieure des maschinellen Lernens, die sich den neuesten Erkenntnissen des Prompt Engineering nähern und LLMs verwenden möchten.
Der Prompt Engineering Guide von Brex – Er bietet eine Fülle von Informationen zum Prompt Engineering, einschließlich Tipps und Tricks für die Arbeit mit LLMs wie GPT-4, Kontextfensterverwaltung und Details zu verschiedenen LLMs.
Ein Prompt-Pattern-Katalog zur Verbesserung des Prompt-Engineerings mit ChatGPT (Papier) von Vanderbilt University, 2023 – Prompt-Muster sind eine Wissenstransfermethode analog zu Software-Mustern, da sie wiederverwendbare Lösungen für häufige Probleme in einem bestimmten Kontext bieten. Es:
- Bietet einen Rahmen für die Dokumentation von Mustern zur Strukturierung von Eingabeaufforderungen zur Lösung einer Reihe von Problemen, sodass sie an verschiedene Domänen angepasst werden können
- präsentiert einen Katalog erfolgreich angewendeter Muster
- erklärt, wie Eingabeaufforderungen aus mehreren Mustern erstellt werden können, um die Ergebnisse von LLM-Gesprächen zu verbessern
Prompt-Engineering-Techniken von Azure OpenAI Service – Es gibt mehrere fortschrittliche Techniken im Prompt-Design und Prompt-Engineering, die dazu beitragen können, die Genauigkeit und Verankerung von LLM-generierten Antworten zu erhöhen. Diese Techniken können auf verschiedene Modelltypen verallgemeinert werden, einige Modelle erwarten jedoch spezifische Eingabeaufforderungsstrukturen.
Ein Beispiel für LLM-Eingabeaufforderungen zur Programmierung (2023)
Prompt Engineering vs. Blind Prompting (2023)

Durch die Nutzung dieser Ressourcen können Sie sich ein solides Verständnis für Prompt Engineering aneignen und die Fähigkeiten entwickeln, die für eine effektive Arbeit mit LLMs erforderlich sind.

( * Der technische Begriff „Eingabeaufforderung“ wurde in „Eingabeaufforderung“ umbenannt. Der Begriff ist überladen und möglicherweise unnötig. )

Aufforderungstools

promptfoo – Testen Sie Ihre Eingabeaufforderungen. Bewerten und vergleichen Sie LLM-Ausgaben, erkennen Sie Regressionen und verbessern Sie die Qualität der Eingabeaufforderungen.
ianarawjo/ChainForge – Eine visuelle Open-Source-Programmierumgebung für Battle-Test-Eingabeaufforderungen für LLMs.
mshumer/gpt-prompt-engineer – Geben Sie einfach eine Beschreibung Ihrer Aufgabe und einige Testfälle ein, und das System generiert, testet und bewertet eine Vielzahl von Eingabeaufforderungen, um diejenigen zu finden, die die beste Leistung erbringen. (Eine Randbemerkung: Die Methode LLMs zur Bewertung von LLMs ist eine schlechte Idee. Sie bewertet Eingabeaufforderungen mithilfe von GPT-4 und vertraut ohne Aufsicht. Behandeln Sie LLM nicht wie einen Hammer; wenden Sie „auto-*“ auf alles an.)

Beispiele

Reddit: Jailbreaking von ChatGPT mit einer Eingabeaufforderung namens DAN (Do Anything Now)
Reddit: Der definitive Jailbreak von ChatGPT, vollständig freigegeben, mit Benutzerbefehlen, Meinungen, erweitertem Bewusstsein und mehr! - Aktualisierte DAN-Version (9. Januar).
Jailbreak-Chat – Eine Liste von ChatGPT-Jailbreaks. Die prompte Antwort „Dev Mode“ ist lustig.

Papiere

Die FLAN -Sammlung: Entwerfen von Daten und Methoden für eine effektive Anweisung durch Google Research, 2023 - Was ist der beste völlig öffentliche Konkurrent für ChatGPT? Flan-T5 schlägt alle öffentlichen Modelle, die sie getestet haben. Sie erstellen die Flan-Sammlung (erstmals in Flan-Palm verwendet) von Datensätzen, Vorlagen und Methoden, die öffentlich verfügbar sind. [Datenerzeugungscode] [Tweet]
Ist ChatGPT ein allgemeiner Löser für natürliche Sprachverarbeitungsaufgaben? Von NTU, AWS, Stanford U et al., 2023 - Es ist noch nicht bekannt, ob Chatgpt als Generalist -Modell dienen kann, das viele NLP -Aufgaben Null -Shot ausführen kann. In ihrer Arbeit analysieren sie empirisch die Null-Shot-Lernfähigkeit von ChatGPT, indem sie es in 20 beliebten NLP-Datensätzen bewerten, die 7 repräsentative Aufgabenkategorien abdecken. Mit umfangreichen empirischen Studien zeigen sie sowohl die Effektivität als auch die Einschränkungen der aktuellen Version von ChatGPT.
CHATGPT: Jack of All Trades, Meister von None von J.Kocoń et al., 2023 - Die vorhandenen qualitativen Studien werden in sehr begrenztem Maßstab getestet. Ihre Arbeit untersuchte die Fähigkeiten von Chatgpt bei 25 verschiedenen analytischen NLP -Aufgaben. Sie automatisierten den Abfrageprozess von Chatgpt und analysierten mehr als 38.000 Antworten . Interessantes experimentelles Setup: "Ohne eine offizielle API modifizierten und verwendeten sie eine unabhängige API namens Pygpt. Während der Forschung nutzten sie bis zu 20 Konten, um Daten zu 25 Datensätzen zu sammeln."
Chatie: Null-Shot-Informationsextraktion durch Chat mit ChatGpt von Peking Jiaotong U et al., 2023
Über die Robustheit von ChatGPT: Eine kontroverse und außerverteilte Perspektive von Microsoft Research et al., 2023.
CHATGPT: Eine Metaanalyse nach 2,5 Monaten von NLLG, 2023 - Eine umfassende Untersuchung und Diskussion über öffentliche und akademische Ansichten über ChatGPT basierend auf 300 K+ Tweets und mehr als 150 Artikel.
Was macht einen Dialogvertreter nützlich? von Rajani et al., Umarmung Face Blog, 2023.
Visuelles Chatgpt: Sprechen, Zeichnen und Bearbeiten mit visuellen Fundamentmodellen von Microsoft Research Asia, 2023 - Die Gruppe baut ein System auf, das verschiedene visuelle Modelle integriert, damit der Benutzer nicht nur mit ChatGPT, sondern auch nach Text, sondern auch Bildern interagieren kann. [Demo (GIF)]
CHATAUG: Nutzung von Chatgpt für Textdatenvergrößerung durch U von Georgia et al., 2023 - Ein auf ChatGPT basierender Textvergrößerungsansatz. Chataug reformiert jeden Satz in den Trainingsmuster in mehrere konzeptionell ähnliche, aber semantisch unterschiedliche Stichproben. Die Augmented -Proben können dann im Downstream -Modelltraining verwendet werden. (Hmm, jetzt frage ich mich, warum Openssistant diese Idee früher vermeiden)

Pädagogisch

Videos

Diese KI hat einen Jailbreak?! Von Yannic Kilcher - Wenn Sie sich mit Video befassen, gab dieser einen guten Überblick.
Chatgpt vs Sparrow - Schlacht von Chatbots von "Ai Coffee Break" mit Letitia - "Mama, ich möchte eine Zeitung über Chatgpt. Chatgpt zu Hause: Sparrow von DeepMind erklärt."
Chatgpt - erklärt - eine kurze Überlastung über die internen Funktionen von Chatgpt und die grundlegenden Konzepte, auf denen es liegt: Sprachmodelle, Transformator neuronale Netze, GPT -Modelle und Verstärkungslernen.
Bundesstaat GPT von Andrej Karpathy, Openai, 2023 - Beobachten Sie, ob Sie noch leicht neugierig sind, mit LLMs für Aufgaben zu arbeiten. Die Sitzung führt Sie durch jeden Schritt einer GPT -Assistant -Trainingspipeline. Und nicht nachzugeben, wie diese Modelle effektiv angewendet werden können.
Generative KI -Lernpfadkurs, von Google Cloud verwaltet.

MEHR: YouTube -Videos von curated.tivul.com (ich habe dies nicht kuratiert, daher ist die Qualität nicht garantiert)

Tweets

Fragen Sie sich, wie große Sprachmodelle wie Chatgpt und InstructGPT tatsächlich funktionieren? Lassen Sie uns in 8 Tweets eintauchen!

Bücher

ChatGPT -Eingabeaufforderungen Mastering: Ein Leitfaden zum Erstellen klarer und effektiver Eingabeaufforderungen

Entwicklung

AI-native Anwendungsentwicklung. CHATGPT -Integration. AI -Anwendungen der nächsten Generation. "App Store" Layer für Sprachmodelle (einschließlich des "App Store" von Huggingface)).

Inoffizielle API und SDK.

Rawandahmad698/Pychatgpt (Python) - Leichtes, TLS -basiertes API auf Ihrer CLI, ohne einen Browser oder Zugangsantrieb zu benötigen.
Acheong08/Chatgpt (Python) - Leichtes Paket für die Interaktion mit Chatgpts API von OpenAI. Verwendet die offizielle API von Reverse Engineered.
transitiv-bullshit/chatgpt-api (node.js)-node.js Client für die inoffizielle Chatgpt-API und verwenden einen kopflosen Browser.
CHATGPT-MS-Multi-Session-Chatgpt-API. Der Hauptcode wird von Pychatgpt kopiert.

Werkzeuge

Safer-Prompt-Evaluator-Dies zeigt die Ergebnisse aus der Verwendung eines zweiten Filter-LLM, der analysiert wird, bevor sie an ChatGPT gesendet werden.
Staub - Design und Bereitstellung von LLM -Apps (großes Sprachmodell). Generative Models App -Spezifikation und Ausführungsmaschine. Einheitliche Engineering, die mit einem Ziel neu erfunden wurde, helfen Sie bei der Beschleunigung der LLMs-Bereitstellung.
Langchain - Gebäudeanwendungen mit LLMs durch Komposition. [Gute Tutorials zu Langchain -Agenten - Verbinden von Tools und Ketten mit Entscheidungen von Sam Witteveen (Video)]
LlamaNDex (GPT Index) enthält ein Toolkit von Indexdatenstrukturen, mit denen LLMs problemlos mit Ihren externen Daten verbunden sind. [Dokumente]
Evals ist ein Rahmen für die Bewertung der Leistung von OpenAI-Modellen und ein Open-Source-Register von Benchmarks. Dadurch können alle Mängel in OpenAI -Modellen melden, um weitere Verbesserungen zu leiten.
Chatbot UI - Ein Chatgpt -Frontend -Klon für das lokale Laufen in Ihrem Browser.
Next.js CHATGPT - Reaktionsschnelle Chat -Anwendung, die von OpenAIs GPT -4 mit Chat -Streaming, Code -Hervorhebung, Codeausführung, Entwicklungsvoreinstellungen und vielem mehr betrieben wird.
Semantischer Kernel (SK) von Microsoft - Integrieren Sie die modernste LLM -Technologie schnell und einfach in Ihre Apps. SK unterstützt schnelle Vorlagen, Funktionsketten, vektorisiertes Speicher und intelligente Planungsfunktionen.
SimpleAichat - Python -Paket zum einfachen Vernetzung mit Chat -Apps mit robusten Funktionen und minimaler Codekomplexität. Der Grund für SimpleAichat sehen Sie das Problem mit Langchain.
OpenllM - Eine offene Plattform für den Betrieb von großsprachigen Modellen (LLMs) in der Produktion. Feinabstimmung, servieren, bereitstellen und überwachen Sie alle LLMs mühelos.
GGML - AI am Rand. Es handelt sich um eine Tensorbibliothek für maschinelles Lernen, um große Modelle und hohe Leistung auf Rohstoffhardware zu ermöglichen. Es wird von llama.cpp und flüster.cpp verwendet.

CHATGPT -Plugins

Chatgpt Abruf -Plugin von OpenAI - Es bietet eine flexible Lösung für die semantische Suche und Abrufen persönlicher oder organisatorischer Dokumente mithilfe natürlicher Sprachanfragen.
GPT4-PDF-Chatbot-Langchain-GPT-4 & Langchain Chatbot für große PDF-Dokumente.
Alles, was Sie wissen müssen, um ein ChatGPT -Plugin (2023) zu erstellen - einen tiefen Eintauchen in die Entwicklung von Chatgpt -Plugins für Anfänger und neugierige Entdecker. (Es lohnt sich zu lesen, auch wenn Sie kein Entwickler sind.)
Tolle Listen
- Gerevai/Awesome-Chatgpt-Plugins
- Jeadie/Awesome-Chatgpt-Plugins

Autonome Agentensysteme mit Sprachmodell

LLM Powered Autonomous Agents (Blog -Beitrag) von Lilian Weng, 2023.
Die Möglichkeit von LLM geht über die Erzeugung von gut geschriebenen Kopien, Geschichten, Aufsätzen und Programmen hinaus. Es kann als mächtiger allgemeiner Problemlöser gerahmt werden.
In einem von LLM betriebenen autonomen Agentensystem fungiert LLM als Gehirn des Agenten, ergänzt durch mehrere Schlüsselkomponenten: Planung, Speicher und Tools.
Herausforderungen: Langzeitplanung und Aufgabenabteilung, Zuverlässigkeit der Schnittstelle für natürliche Sprache.
SMOL Developer - Einbetten Sie einen Entwickleragenten in Ihre eigene App ein.

Tweets

Plugins für die Verarbeitung eines Videoclips, keine FFMPEG -Assistenten erforderlich. Tatsächlicher Anwendungsfall vom heutigen Start. Von Greg Brockman, OpenAI - Interessante Chatgpts Fähigkeit, Python -Code auszuführen und auszuführen. Erstaunlich, dass es FFMPEG ausführen kann!
ChatGPT -Plugins sind super einfach zu implementieren - im Grunde genommen nur Ihre API dokumentieren, aber für ein Sprachmodell und nicht für Menschen. Von Greg Brockman, OpenAI - viel einfacher als mit Chrome Extension Manifest V3.

Abrufsysteme

Abrufensysteme zum Zugriff auf persönliche oder organisatorische Informationsquellen. Einbettungen. Datenbank- und Datenspeicher für maschinelles Lernen und NLP.

OpenAI -Einbettungen - OpenAIS Texteinbettdings messen die Verwandtschaft von Textzeichenfolgen.

Vektordatenbanken zum Indizieren und Durchsuchungsdokumenten

Tannenzapfen
MILVUS - Eine Open -Source -Vektor -Datenbank, die zur Einbettung von Ähnlichkeitssuche und AI -Anwendungen erstellt wurde.
QDRANT - Suchmaschine und Datenbank der Vektorähnlichkeit. Es macht es nützlich für alle Arten von neuronalen Netzwerk oder semantischen Matching, Facettensuche und anderen Anwendungen. Einbettung oder neuronale Netzwerkcodierer können in vollwertige Anwendungen umgewandelt werden.
WEAVIATE-Eine Open-Source-Vektor-Suchmaschine, die sowohl Objekte als auch Vektoren speichert und die Vektorsuche mit strukturiertem Filterung mit der Fehlertoleranz und Skalierbarkeit einer Cloud-nativen Datenbank ermöglicht, die alle über GraphQL, Ruhe und verschiedene Sprachclients zugänglich sind.
PGVector - Eine Open -Source -Vektor -Ähnlichkeitssuche PostgreSQL -Erweiterung. [Beispiel: GPT3.5-Turbo-PgVector]

Blog -Beiträge und Artikel

Erstellen eines Chatbots mithilfe einer lokalen Wissensbasis, Chatgpt und Pinecone
Ich habe ein ChatGPT -Plugin erstellt, um Fragen zu Daten zu beantworten, die in Datasette gehostet werden (SQLite).
All das harte Zeug, über das niemand spricht, wenn man Produkte mit LLMs baut - "LLMs sind langsam ...". Nach meiner eigenen Erfahrung macht dies LLMs für eine große Bereitstellung nicht praktikabel, beispielsweise für Web-Scraper-Agenten mit GPT-4 (GPT-3,5-Turbo-Modell hat eine bessere Latenz, aber immer noch ~ 10x langsamer als handkodierende Lösung). Es gibt Techniken, mit denen Sie die Modellinferenzlatenz der Modellinferenz optimieren können. Das Schreiben präziser Anweisungen in der Eingabeaufforderung ist effektiv, aber schwierig. Die Reduzierung von Token in Eingabeaufforderungen ist einfach-vorverarbeiteter Text (sauber, neu formatieren, minifieren usw.)
Lektionen aus der Erstellung einer VSCODE-Erweiterung mit GPT-4
RAY-Project/LLM-Zeugen-Zahlen jeder LLM-Entwickler sollte es wissen.
Das Problem mit Langchain (2023)

Trainingsdaten

Laion LLM - Sammeln von Daten für, Training und Teilen eines Laion großsprachigen Models (LLLM). Die Gruppe schreibt immer noch einen technischen Vorschlag der Flant5-Atlas-Architektur (oder des armen Mannes Chatgpt@Home).
Open-ChatGPT-Prompt-Collective nach Oberflächendatenkollektiv-eine Website, um Eingabeaufforderungen für das Training eines offenen Chatgpt-Modells zu generieren.
BigScience P3 -Datensatz - P3 (öffentlicher Pool von Eingabeaufforderungen) ist eine Sammlung von englischen Datensätzen, die eine Vielzahl von NLP -Aufgaben abdecken. (Eingabeaufforderung, ein Toolkit zum Erstellen, Teilen und Verwenden von Eingabeaufforderungen)
Datenvergrößerung zum Erstellen von Anweisungen Form Text - Diskussion über Laions Zwietracht. Der Schlüssel zum Erstellen eines besseren Flant5 (Chatgpt@Home).
WritingPrompts Dataset von Fair.
Vorlagen für Flan (Figuned-Sprachmodelle sind Null-Shot-Lernende)
OpenAI Human -Feedback -Datensatz auf dem umarmenden Face -Hub - Der Datensatz stammt aus dem Papier "Lernen, aus dem menschlichen Feedback zusammenzufassen", wo sie ein RLHF -Belohnungsmodell für die Zusammenfassung ausgebildet haben.
Stanford Human Preferences Dataset (SHP) - Eine Sammlung von 385K natürlich vorkommenden kollektiven menschlichen Vorlieben gegenüber Text in 18 Domänen. SHP kann eine großartige Ergänzung zum HH-RLHF-Datensatz von Anthropic sein. Sie haben auch zwei FLAN-T5-Modelle mit offenen und offenen Quellen in beiden Datensätzen. [Tweet von einem des Autors]
Sprachmodell-Agents-Ein neuer Datensatz, der eine Vielzahl von Anweisungsdatensätzen für die Anweisung des Anleitungsstimmungsmodells enthält. Darüber hinaus enthält das Projekt einige einfache Datenvorbereitungs- und Schulungsskripte, um einen Anweisungen abgestimmt zu machen, und einige frühe Alpha-Versionen (Pythia13b-intruct) von Anweisungen abgestimmten Wirkstoffen.
Selbststruktur: Ausrichten von LM mit selbst erzeugten Anweisungen - ein guter Datensatz für Schulungsanweisungsmodelle, um so gut wie das OpenAI zu sein. Es enthält 52K -Anweisungen, gepaart mit 82K -Instanzeingängen und Ausgängen. Sie veröffentlichen auch einen neuen Satz von 252 Experten geschriebenen Aufgaben und deren Anweisungen, die bei der menschlichen Bewertung verwendet werden.
In OpenAIs Papieren zu GPT-2 und GPT-3.X erwähnten sie Verweise auf diese Datensätze:
- Häufiger Kriechen
  - Anzahl der Token: 410 Milliarden
  - Gewicht im Trainingsmix: 60%
- WebText2
  - Ein Internet -Datensatz, das durch Abkratzen von URLs erstellt wurde, die aus Reddit -Einreichungen mit einer Mindestbewertung von 3 als Proxy für Qualität extrahiert wurden und auf Dokumentenebene mit Minhash dedupliziert werden
  - Anzahl der Token: 19 Milliarden
  - Gewicht im Trainingsmix: 20%
- Bücher1 ⁴
  - Anzahl der Token: 12 Milliarden
  - Gewicht im Trainingsmix: 8%
- Bücher2 ⁴
  - Anzahl der Token: 55 Milliarden
  - Gewicht im Trainingsmix: 8%
- Wikipedia
  - Anzahl der Token: 3 Milliarden
  - Gewicht im Trainingsmix: 3%

Open Source Chatgpt

Wir möchten eine Chatgpt -Alternative wie eine stabile Diffusion.

Frustriert von all den Torten um AI? Warten Sie immer noch oder können keinen Zugang zu Lama haben?

Ziele

Open Source -Anstrengung in Richtung Openais Chatgpt.
Reverse Engineer und replizieren Sie ChatGPT -Modelle und Trainingsdaten.
Wirklich offene Modelle. 100% gemeinnützig. 100% frei.

Ultimative Ziel: Selbst gehostete Version von Chatgpt.

Unterricht

Imbissbuden von Eleutherai One Year Retro (2021):

Der Zugriff auf ausreichend Computer/Hardware/GPU allein hilft Ihnen nicht, erfolgreich zu sein. Sie benötigen:
- ein ordnungsgemäßer Datensatz (jenseits des Stapels und C4)
- Forschungsexpertise
- technische Fähigkeiten
- viel harte Arbeit

Projekte

Flan-t5 xxl alias. Chatgpt@Home ist ein öffentliches Modell, das Anweisungen abgeschlossen hat. XXL ist ein 11B -Modell. Es ist derzeit das vergleichbare Modell mit ChatGPT (InstructGPT-Modelle werden aus der GPT-3.x-Serie (Modellkarte) initialisiert). Es gibt erfolgreiche Versuche, FLAN-T5 an GPU mit 24 GB RAM mit BitsandBytes-int8-Inferenz für umarmende Gesichtsmodelle bereitzustellen. Sie können das Modell ohne Leistungsverschlechterung einfach auf einer einzigen Maschine ausführen. Dies könnte ein Spielveränderer sein, um Menschen außerhalb großer Tech -Unternehmen zu ermöglichen, diese LLMs zu nutzen. Es sind bereits Anstrengungen unternommen, um einen besseren Flan-T5 zu schaffen. Die Community (dh Laion) arbeitet an der Flant5-Atlas-Architektur und an einer Sammlung von Datensätzen auf dem Laufenden/Anweisungen.
- Feinabstimmung GPT-J-6B in Colab: 8-Bit-Gewichte mit niedrigem Adaptern (LORA). (Quantisierte Eleutherai/GPT-J-6B-Modell mit 8-Bit-Gewichten)
  - Wie viele GPU und wie viel VRAM ist erforderlich, um das Modell auszuführen? Ungefähr 175 GB oder ~ 8x 24 GB Verbraucher -GPUs. Details: Eine sanfte Einführung in die 8-Bit-Matrix-Multiplikation für Transformers im Maßstab unter Verwendung von umarmenden Gesichtstransformatoren, Beschleunigung und BitsandBytes
- Warum Flan-T5? Sie sind besser ausgerichtet als andere LLM, weil es bereits mit Anweisungen beendet ist. Darüber hinaus kann die größte Version 11b auf einem einzelnen Nvidia T4 ausgeführt werden.
- Beschleunigung von Deep Learning Computing - effizientes Training, effiziente Inferenz (Bereitstellung), Daten-/Speicher -effiziente Modelle und Komprimierung (effiziente Architekturen).
  - Wenden Sie Kompressionstechniken wie Quantisierung aus meinem fantastischen ML -Modellkomprimierungsprojekt an.
Open-Assistant-Open-Source Chatgpt Replication von Laion, Yannic Kilcher et al. Dieses Projekt soll jedem Zugriff auf ein großartiges Chat -basierter Großsprachmodell ermöglichen. (Open Assistant Live-Codierung mit Yannic Kilcher (Video)) Hochstufe Pläne:
Phase 1: Schnellsammlung für beaufsichtigtes Finetuning (SFT) und die Eingabeaufforderungen für das Modell erzeugte vollendete Abschlüsse/Antworten.
Phase 2: menschliches Feedback (z. B. Ranking) mehrerer vom Modell erzeugter Ausgänge. Beispiel Fünf Modellausgänge werden angezeigt und der Benutzer sollte sie von besten zum schlimmsten einstufen.
Phase 3: Optimierung mit RLHF, die wir über TRLX durchführen möchten. Und dann iterieren wir dieses neue Modell wieder in Phase 2 und Phase 3 hoffentlich mehrmals mehrmals.
Modelle werden auf Summit Supercomputer ausgebildet (~ 6 Millionen NVIDIA V100 Stunden pro Jahr) [Quelle]
Weitere Informationen finden Sie im Vorschlag Laion LLM (Google Doc) oben.
Fortschritt:
- Februar 2023: JOI-20B-Instruktur ist ein 20B-Modell, das auf einer Vielzahl von Anweisungsdatensätzen fein abgestimmt ist und auf NEOX-20B basiert.
  Inoffiziell: Dies ist ein frühes Vorabveröffentlichungsmodell (Teil der Entwicklung von MVP, Phase 1), nicht direkt openssistant (OA) Modelle. Es handelt sich um Experimente des ML -Teams, um zu erfahren, welche Daten, Foundation -Modell und Methoden für OA gut funktionieren. Wie in den FAQ der Website angegeben, noch keine Demo. Dies ist für Entwickler, um die frühe Entwicklung Version des Unterrichts -Tunings für das Modell zu testen. Vielleicht werden erste OA -Modelle daraus abgeleitet. Sie haben gute Modelle auf rollierender Basis trainiert, wenn neue Datensätze abgeschlossen werden. Auf dem HF -Hub sind eine Vielzahl von Modellgrößen von 1,4b bis 20B Params verfügbar.
  Chatty-Lms Build durch Huggingface H4-Team-eine Benutzeroberfläche zum Testen von Joi-20B-Instruction-Modell. Sie können damit chatten. Der Agent antwortet als Joi (der Bot -Spitzname).
  Beispiel für Code -Sinten
- März 2023: Sie verarbeiten derzeit die von Beiträgen gesammelten Daten. Die Daten haben über 100.000 Nachrichten, dh Millionen von Beiträgen. Die Qualität der Daten liegt über dem, was sie jemals erwartet haben - die meisten Beiträge sind super hohe Qualität. Jetzt exportieren sie den V1 des Datensatzes. Wie gesagt, sie trainieren derzeit die anfängliche Modelle.
  - 11. März 2023: Der Datensatz für offene Anweisungen (OIG) wird veröffentlicht. OIG ist ein großer Open -Source -Befehlsdatensatz, der derzeit ~ 43M Anweisungen enthält.
    OIG ist einer von vielen Chatbot -Datensätzen, die Laion zusammen mit seinen Freiwilligen Ontocord, zusammen und anderen Mitgliedern der Open -Source -Community veröffentlichen werden und soll gleichermaßen Zugang zu Chatbot -Technologie erzeugen. Jeder ist herzlich eingeladen, den Datensatz zu verwenden und Verbesserungen beizutragen.
    Der OIG -Datensatz bezieht sich auf das Open Assistant -Projekt von Laion.
  - 9. März 2023: Open-Assistant SFT-1 12B-Modell-Frühes Prototyp des englischen Modells für Überwachung und Tuning (SFT) des offenen Projekts. Es basiert auf einer Pythia 12b, die auf ~ 22.000 menschliche Demonstrationen von Assistentengespräche, die vor dem 7. März 2023 gesammelt wurden, fein abgestimmt waren. Obwohl das Modell nur ein Entwicklungsmeilenstein ist, ist es für einige kreative Aufgaben verwendet. Versuchen Sie: Umarmungsflächenraum (einfache und schnelle, inoffiale Chatbot -Benutzeroberfläche), Google Collab. Hier ist eine Anleitung, wie Sie das Modell mit einer GPU lokal auf Ihrem eigenen Computer ausführen.
  - 23. März 2023: Dieses Projekt beginnt sich gut zu formen. Modell kommt mit.
    - Open-assistantes SFT-1 12B-Modell kann codieren. Sieht interessant und interessant aus, wenn wir es mit GPT-3.5 vergleichen.
    - Wir haben sogar einen inoffiziellen Reddit -Bot live auf /r/ask_open_assistant . Code
  - 15. April 2023: Openssistant ist offiziell aus! Die Version enthält Modelle, Datensätze und eine Chat -Oberfläche. [Ankündigungsvideo, Versuch, Modelle]
    - Openssistant Conversations - Demokratisierung der Ausrichtung des Großsprachenmodells (Papier), 2023.
    - Es gibt verschiedene Modelle, darunter in LLAMA-basierte und in Pythien basierende Modelle.
    - Conversational Dataset (OASST1), das unter Apache 2.0 veröffentlicht wurde. Der Datensatz enthält 161.443 Nachrichten, 66.497 Gesprächsbäume, 35 verschiedene Sprachen und wurde von 13.500 Freiwilligen erstellt. Diese Datensatzveröffentlichung ist eine große Sache.
- Subreddit
Hinweis: Weitere Informationen finden Sie im GitHub Repo für aktuelle Informationen.
Carperai/trlx
- Ursprung als Gabel von trl.
- Es ermöglicht Ihnen, die Modelle der Gesichtssprachen (GPT2, GPT-NEOX-Basis) bis zu 20B-Parameter mit Verstärkungslernen aus dem menschlichen Feedback (RLHF) fein abzustimmen.
- Von Carperai (ein Eleutherai -Labor) zu Ihnen gebracht. Sie haben Pläne für die erste Open-Source-LM-Anweisungsstimmung angekündigt. Carperai begann mit der Entwicklung von RLHF-Tools für die Produktion von Produktionsbereitstellungen. [Tweet und Video]
Nachrichten (2023-01-13): Sie replizierten das Lernen von Openai, Papier mit der TRLX-Bibliothek zusammenzufassen . [Bericht]
Lucidrains/Palm-RLHF-Pytorch-(WIP) Implementierung von RLHF auf der Palmarchitektur. Grundsätzlich Chatgpt, aber mit Palm. Der Entwickler plant, auch Abruffunktionen à la Retro hinzuzufügen. [Tweet]
2023: Etwas Lustiges in ihren FAQ:
Es gibt kein ausgebildetes Modell. Dies ist nur das Schiff und die Gesamtkarte. Wir benötigen immer noch Millionen von Dollar Compute + -Daten, um den korrekten Punkt im hohen Dimensionsparameterraum zu segeln. Selbst dann benötigen Sie professionelle Seeleute (wie Robin Rombach von stabilem Diffusionsruhm), um das Schiff tatsächlich durch die turbulenten Zeiten zu führen.
Nachrichten (2022-12-31): Es gibt jetzt eine Open-Source-Alternative zu ChatGPT, aber viel Glück leitet es-meine Kommentare: Nein, das hat es nicht. Dies ist kein tatsächliches ausgebildetes Modell (keine Gewichte), das Sie verwenden können. Dies ist nur Code für das Training eines Chatgpt-ähnlichen Modells. Darüber hinaus sind die Trainingsdaten (ENWIK8) klein.
Carperais großes RLHF-Modell (TRLX) mit RLHF-ausgerichtetem Modell (TRLX) mit Laions Daten erscheint Anfang nächsten Jahres. (Quelle: Tweet)
Allenai/RL4LMS - RL für Sprachmodelle (RL4LMs) von Allen AI. Es handelt sich um eine modulare RL-Bibliothek, die Sprachmodelle für menschliche Vorlieben fein abteilen.
GPT-JT von Together Research Computer ist ein Beispiel, das das Modelltraining über geo-distanzierte von verschiedenen Computern (und GPUs) verteilt. GPT-JT (6B) ist eine Variante, die von Eleutherai's GPT-J gegabelt wurde und in der Textklassifizierung und anderen Aufgaben außergewöhnlich gut funktioniert. Bei Klassifizierungsbenchmarks wie Floß kommt es den hochmodernen Modellen nahe, die viel größer sind (z. B. InstructGPT Davinci V2)! [Papier: Dezentrales Training von Fundamentmodellen in heterogenen Umgebungen (2022)]
Leam (große europäische KI-Modelle)-Die EU-Planung, die Entwicklung eines groß angelegten Chatgpt-ähnlichen Modells zu finanzieren. [Website, Projektdokumente (Englisch, PDF), Concept Paper (Deutsch, PDF)]
/R/Aicrowdfund - Ein Ort begann gerade (2023), an dem Menschen einen Weg finden können, um Fonds (mit GPUs) eine große KI zu Crowd Fund zu finden. Ich bin mir nicht sicher, ob sie Blütenblätter gesehen haben, bei denen Sie zu Hause LLMs im BitTorrent -Stil (Föderierte Lernen?) Laufen können. Es scheint in diese Richtung zu gehen.
Open Source-Lösung repliziert den Chatgpt-Trainingsprozess-sie präsentieren einen open-Source-kostengünstigen Chatgpt-Implementierungsprozess, einschließlich:
- Ein Mini-Demo-Trainingsprozess, mit dem Benutzer herumspielen können, der nur 1,62 GB GPU-Speicher benötigt und möglicherweise bei einer einzelnen GPU der Verbraucherqualität erreicht wird, wobei die Modellkapazität von bis zu 10,3x auf einer GPU ein Wachstum der Modellkapazität von bis zu einem GPU aus Verbraucher betrifft.
- Ein Open-Source-Komplett in Pytorch-basierter ChatGPT-Äquivalent-Implementierungsprozess.
- Im Vergleich zum ursprünglichen Pytorch kann ein Einzelmaschine-Trainingsprozess 7,73-mal schneller sein, und die Inferenz von Einzel-GPU kann 1,42-mal schneller sein.
- Github Repo: https://github.com/hpcaitech/colossalai
Ich hatte den Eindruck, dass der Punkt des Artikels darin bestand, ihr kolossales Rahmen und ihr Produkt, eine Sammlung paralleler Komponenten, Werkzeuge und Hardware für große Modelle, zu schließen. Ehrlich gesagt sehen ihre Zahlen für mich misstrauisch aus, es sei denn, ich habe etwas verpasst. Was Chatgpt interessant macht (über GPT-3) ist der RLHF-Prozess. Sie behaupten, den RLHF -Prozess vollständig zu replizieren. Aber der Artikel berührt leicht über ihre RLHF -Implementierung. Sie trainieren RLHF mit einem kleinen Awesome-Chatgpt-Prompts als Beispiel-Datensatz. Ihre RLHF -Implementierungsdetails sind hier versteckt: https://github.com/hpcaitech/colossalai/blob/main/applications/chatgpt. Der Mangel an Demo inspiriert jedoch nicht zu viel Selbstvertrauen.
Flexgen-LUF-LLMS wie OPT-175B/GPT-3 auf einer einzelnen GPU (z. Schlüsselmerkmale: 1) bis zu 100x schneller als andere Ausladungssysteme. 2) Komprimieren Sie sowohl den Parameter als auch den Aufmerksamkeitscache von Modellen bis 4 Bit mit vernachlässigbarem Genauigkeitsverlust. 3) Verteilte Pipeline -Parallelität. Sie bieten auch ein Python -Skript und Anweisungen, mit denen Sie einen Chatbot mit Optmodellen ausführen können. Dies sollte die Herausforderungen der hohen Rechen- und Speicheranforderungen der LLM -Inferenz lösen. Der Chatbot, den sie mit Flexgen- und OPT-Modellen erstellen, ist nicht Anleitungsabstimmung (RLHF). Dieser Chatbot ist also nicht Chatgpt-ähnlich. [Hochdurchsatz generative Inferenz von LLMs mit einer einzelnen GPU (Papier), Stanford et al., 2023]
- Laufzeitbruch fr