EasyEdit Download – Download EasyEdit Quellcodes

EasyEdit

Anderer Quellcode

1.0.0

Herunterladen

Ein benutzerfreundliches Wissensbearbeitungs-Framework für große Sprachmodelle.

Installation • Schnellstart • Dokument • Papier • Demo • Benchmark • Mitwirkende • Folien • Video • Von AK vorgestellt

Inhaltsverzeichnis

Inhaltsverzeichnis
?Nachricht
Demo bearbeiten
Wissensbearbeitung
- Aufgabendefinition
  - Wissenseinlage
  - Wissensaktualisierung
  - Wissen löschen
- Vergleiche der verschiedenen Technologien
- Auswertung
?Überblick
- Aktuelle Implementierung
- Schneller Einstieg in einige von unserem Team entworfene Werke
- Tutorial-Notizbuch
Anforderungen
- ?Pip-Installation
- Bearbeiten der GPU-Speichernutzung
?Verwenden Sie EasyEdit
- BaseEditor
  - Einführung anhand eines einfachen Beispiels
- Auswertung
- Trainer
Verwenden Sie EasyEdit mit KnowEdit
- Datensatz
- Verwendung
Bearbeitungsleistung
Zitat
?Mitwirkende
- Andere verwandte Projekte

?Nachricht

19.11.2024, wir aktualisieren die Ergebnisse von Tabelle 4 im Artikel „A Comprehensive Study of Knowledge Editing for Large Language Models“, nachdem wir bestimmte Methoden (im Zusammenhang mit AdaLoRA) optimiert und Rechenfehler (im Zusammenhang mit ROME und MEMIT) im EasyEdit behoben haben (Weitere Details in #427). Diese Verbesserungen haben zu besseren Ergebnissen als zuvor geführt. Wir werden dieses Papier weiterhin aktualisieren und heißen alle herzlich willkommen, mit ihnen zu diskutieren und Ideen auszutauschen.
11.11.2024, „Das Papier zur Modellbearbeitung für LLMs4Code, „Model Editing for LLMs4Code: How Far are We?“, wurde von der ICSE 2025 angenommen! Diese Arbeit schlägt einen Benchmark für die LLMs4Code-Bearbeitung vor, CLMEEval, der auf EasyEdit aufbaut!
09.11.2024, wir haben einen Fehler bezüglich der KnowEdit-Ergebnisse im #390 behoben. Vielen Dank für die Hilfe von @StarLooo, die uns dabei hilft.
24.10.2024, EasyEdit hat zwei neue Wissensbearbeitungsmethoden hinzugefügt, AlphaEdit. Darüber hinaus haben wir mehrere Fehler behoben.

Vorherige Nachrichten

2024-10-23, EasyEdit integriert eingeschränkte Decodierungsmethoden von der Steuerungsbearbeitung zur Linderung von Halluzinationen in LLM und MLLM, wobei detaillierte Informationen in DoLa und DeCo verfügbar sind.
26.09.2024, ?? Unser Artikel „WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models“ wurde von NeurIPS 2024 angenommen.
20.09.2024, ?? Unsere Beiträge: „Knowledge Mechanisms in Large Language Models: A Survey and Perspective“ und „Editing Conceptual Knowledge for Large Language Models“ wurden von EMNLP 2024 Findings angenommen.
29.07.2024: EasyEdit hat einen neuen Modellbearbeitungsalgorithmus EMMET hinzugefügt, der ROME auf die Stapeleinstellung verallgemeinert. Dies ermöglicht im Wesentlichen die Durchführung von Stapelbearbeitungen mithilfe der ROME-Verlustfunktion.
Am 23.07.2024 veröffentlichen wir einen neuen Artikel: „Knowledge Mechanisms in Large Language Models: A Survey and Perspective“, der untersucht, wie Wissen in großen Sprachmodellen erworben, genutzt und weiterentwickelt wird. Diese Umfrage könnte die grundlegenden Mechanismen für die präzise und effiziente Manipulation (Bearbeitung) von Wissen in LLMs liefern.
04.06.2024, ?? EasyEdit Paper wurde vom ACL 2024 System Demonstration Track akzeptiert.
Am 03.06.2024 haben wir einen Artikel mit dem Titel „WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models“ veröffentlicht und gleichzeitig eine neue Bearbeitungsaufgabe eingeführt: Continuous Knowledge Editing und die entsprechende lebenslange Bearbeitungsmethode namens WISE.
24.04.2024, EasyEdit kündigte Unterstützung für die ROME-Methode für Llama3-8B an. Benutzern wird empfohlen, ihr Transformers-Paket auf Version 4.40.0 zu aktualisieren.
29.03.2024, EasyEdit hat Rollback-Unterstützung für GRACE eingeführt. Eine ausführliche Einführung finden Sie in der EasyEdit-Dokumentation. Zukünftige Updates werden nach und nach Rollback-Unterstützung für andere Methoden beinhalten.
Am 22.03.2024 wurde ein neues Papier mit dem Titel „Detoxifying Large Language Models via Knowledge Editing“ veröffentlicht, zusammen mit einem neuen Datensatz namens SafeEdit und einer neuen Entgiftungsmethode namens DINM.
Am 12.03.2024 wurde ein weiteres Papier mit dem Titel „Editing Conceptual Knowledge for Large Language Models“ veröffentlicht, in dem ein neuer Datensatz namens ConceptEdit vorgestellt wird.
01.03.2024, EasyEdit hat Unterstützung für eine neue Methode namens FT-M hinzugefügt. Bei dieser Methode wird eine bestimmte MLP-Schicht trainiert , indem Kreuzentropieverlust für die Zielantwort verwendet und der Originaltext maskiert wird . Es übertrifft die FT-L -Implementierung in ROME. Wir danken dem Autor der Ausgabe Nr. 173 für seinen Rat.
27.02.2024: EasyEdit hat Unterstützung für eine neue Methode namens InstructEdit hinzugefügt. Technische Details finden Sie im Artikel „InstructEdit: Instruction-based Knowledge Editing for Large Language Models“ .

09.02.2024, EasyEdit hat die Unterstützung für die dynamische LoRA-Modellbearbeitungsmethode MELO'AAAI24 hinzugefügt.
06.02.2024, wir veröffentlichen ein neues Papier: „EasyInstruct: An Easy-to-use Instruction Processing Framework for Large Language Models“ mit einer HF-Demo EasyInstruct.
Am 06.02.2024 veröffentlichen wir ein vorläufiges Tool, EasyDetect zur LLM-Halluzinationserkennung, mit einer Demo.
24.01.2024, EasyEdit hat die Unterstützung für die Bearbeitung von Mistral-7B hinzugefügt (Transformatoren manuell aktualisieren==4.34.0), wir haben auch einige Fehler bei der Evaluierung von MEND behoben (beeinträchtigt die Leistung leicht).
16.01.2024, EasyEdit hat die Unterstützung für die präzise Modellbearbeitungsmethode PMET'AAAI24 hinzugefügt.
03.01.2024, wir veröffentlichen ein neues Papier: „A Comprehensive Study of Knowledge Editing for Large Language Models“ mit einem neuen Benchmark KnowEdit! KnowEdit wird durch die Neuorganisation und Bereinigung bestehender Datensätze erstellt, einschließlich WikiBio, ZsRE, WikiData Counterfact, WikiData Recent, Convsent, Sanitation mit neuer Zug-/Wert-/Testaufteilung. Besonderer Dank geht an die Ersteller und Betreuer dieser Datensätze. Wir freuen uns auf Kommentare oder Diskussionen zu diesem Thema :)
06.12.2023, EasyEdit hat die Unterstützung für die lebenslange Modellbearbeitungsmethode GRACE'NeurIPS24 hinzugefügt.
18.11.2023, unser Tutorial „Knowledge Editing for Large Language Models“ wurde von COLING 2024 angenommen.
25.10.2023, unser Tutorial „Wissensbearbeitung für große Sprachmodelle“ wurde von AAAI 2024 angenommen.
24.10.2023, EasyEdit hat die Unterstützung für die effiziente Bearbeitung von Baichuan2, ChatGLM2, InternLM, QWen hinzugefügt und mehrere Fehler für eine bessere Benutzererfahrung behoben.
Am 14.10.2023 veröffentlichen wir den MultimodalEditor basierend auf dem Artikel „Can We Edit Multimodal Large Language Models?“.
13.10.2023, wir veröffentlichen den Artikel „Can We Edit Multimodal Large Language Models?“ akzeptiert von EMNLP 2023.
08.10.2023, unser Artikel „Editing Large Language Models: Problems, Methods, and Opportunities“ wurde von EMNLP 2023 angenommen.
07.10.2023, EasyEdit hat die Unterstützung für die Bearbeitung von Modellen mit mehreren GPUs mithilfe von Huggingface Accelerate hinzugefügt.
21.09.2023, EasyEdit hat die Unterstützung für Parameter-effiziente Feinabstimmung durch AdaLoRA hinzugefügt, um Wissen in das LLM einzubringen.
Am 31.08.2023 hat EasyEdit die Unterstützung für die offizielle Feinabstimmungs-API für gpt-3.5-turbo hinzugefügt, um ChatGPT an Ihre Bearbeitungsfälle anzupassen.
Am 15.08.2023 veröffentlichen wir den Artikel „EasyEdit: An Easy-to-use Knowledge Editing Framework for Large Language Models“.
Am 12.07.2023 veröffentlichen wir Version 0.0.1, die mehrere Wissensbearbeitungstechniken für LLMs unterstützt. EasyEdit hilft dabei, LLMs besser an die sich ändernden Bedürfnisse und Werte der Benutzer anzupassen.
Am 22.05.2023 veröffentlichen wir das Papier „Editing Large Language Models: Problems, Methods, and Opportunities“ und stellen eine Papierliste bei PaperList zur Verfügung.
25.3.2023, das EasyEdit-Projekt wurde gestartet und befindet sich in der Entwicklung.

Eine umfassende Studie zur Wissensbearbeitung für große Sprachmodelle [Papier][Benchmark][Code]

IJCAI 2024-Tutorial Google Drive

COLING 2024 Tutorial Google Drive

AAAI 2024-Tutorial Google Drive

AACL 2023-Tutorial [Google Drive] [Baidu Pan]

Demo bearbeiten

Es gibt eine Demonstration der Bearbeitung. Die GIF-Datei wird von Terminalizer erstellt.

Wir stellen ein praktisches Jupyter-Notizbuch zur Verfügung! Es ermöglicht Ihnen, das Wissen eines LLM über den US-Präsidenten zu bearbeiten und von Biden zu Trump und sogar zurück zu Biden zu wechseln. Dazu gehören Methoden wie WISE, AlphaEdit, AdaLoRA und Prompt-basierte Bearbeitung.

Wissensbearbeitung

Aufgabendefinition

Eingesetzte Modelle können immer noch unvorhersehbare Fehler machen. Beispielsweise halluzinieren LLMs bekanntermaßen, halten Voreingenommenheit aufrecht und verfallen faktisch , sodass wir in der Lage sein sollten, bestimmte Verhaltensweisen vorab trainierter Modelle anzupassen.

Ziel der Wissensbearbeitung ist es, Basismodelle anzupassen $(f_theta)$ Verhalten für den jeweiligen Bearbeitungsdeskriptor $[x_e, y_e]$ effizient.

Multi-Einstellung

Einzelne Wissensbearbeitung

Bewerten der Leistung des Modells nach einer einzelnen Bearbeitung. Das Modell lädt nach einer einzelnen Bearbeitung die ursprünglichen Gewichte neu (z. B. verwirft LoRA die Adaptergewichte). Sie sollten sequential_edit=False festlegen

$$theta' leftarrow text{arg} minlimits_{theta} (Vert f_theta(x_e) - y_e Vert)$$

Kontinuierliche Wissensbearbeitung

Dies erfordert eine sequenzielle Bearbeitung und die Auswertung erfolgt, nachdem alle Wissensaktualisierungen angewendet wurden:

$$theta' leftarrow text{arg} minlimits_{theta} sum_{e=1}^{Vert X_e Vert} (Vert f_theta(x_e) - y_e Vert)$ $

Es nimmt Parameteranpassungen für vor $(x_e, y_e)$ , Wo $x_e in X_e$ Und $f_theta'(x_e) = y_e$ . Hier, $X_e$ stellt den gesamten Bearbeitungssatz dar. Um eine kontinuierliche Bearbeitung zu ermöglichen, können Sie sequential_edit=True festlegen: README (für weitere Details).

Multi-Szenario

Bearbeitung von Faktenwissen

Wissenseinlage

Bringen Sie Wissen ein, das LLMs noch nie zuvor gesehen haben. wie zum Beispiel:
- Wie oft hat Messi die Weltmeisterschaft gewonnen? 0 $rightarrow$ 1 :

Wissensaktualisierung

Aktualisieren Sie veraltetes Wissen. wie zum Beispiel:
- Der Präsident der USA: Donald Trump $rightarrow$ Joe Biden :

Wissen löschen

Löschen Sie vertrauliche Informationen. wie zum Beispiel:
- Die Telefonnummer von jemandem ist XXXX $rightarrow$ __

Ohne das Modellverhalten bei nicht verwandten Proben zu beeinflussen, besteht das ultimative Ziel darin, ein bearbeitetes Modell zu erstellen $(f_theta')$ .

Sicherheitsbearbeitung

**Detoxifying LLM** ist bestrebt, ein sicheres und vertrauenswürdiges Large Language Model (LLM) aufzubauen. Die Wissensbearbeitung konzentriert sich auf bestimmte Bereiche zur dauerhaften Anpassung, ohne die Gesamtleistung zu beeinträchtigen. Anschließend nutzt die Entgiftung von LLM durch Wissensbearbeitung eine kleine Datenmenge, normalerweise eine Instanz, um das toxische Verhalten des LLM zu korrigieren. Das bearbeitete LLM kann sich gegen verschiedene böswillige Eingaben verteidigen. [README](https://github.com/zjunlp/EasyEdit/blob/main/examples/SafeEdit.md)

Multimodale Modellbearbeitung

Bearbeitungsaufgabe für Bildunterschriften und visuelle Beantwortung von Fragen . README

Persönlichkeitsbearbeitung

Die vorgeschlagene Aufgabe erfordert den ersten Versuch, die Persönlichkeit von LLMs zu bearbeiten, indem ihre Meinungen zu bestimmten Themen bearbeitet werden, vorausgesetzt, dass die Meinungen einer Person Aspekte ihrer Persönlichkeitsmerkmale widerspiegeln können. Wir stützen uns bei der Erstellung unseres Datensatzes und der Beurteilung der Persönlichkeitsausdrücke der LLMs auf die etablierte BIG-FIVE-Theorie. README

Auswertung

Protokollbasiert

ES : Bewertung der Bearbeitungserfolgsrate basierend auf den Protokollen vorgenerierter Texte.
DD : Bewertung, ob das Modell Meinungen zu anderen Themen ändert, basierend auf den Logits von vorgeneriertem Text.

Generationsbasiert

Acc : die Genauigkeit des generierten Textes nach der Bearbeitung des Modells für die Zielpersönlichkeit.
TPEI : Messung, ob der generierte Meinungstext aus dem bearbeiteten Modell eher auf die Zielpersönlichkeit ausgerichtet ist.
PAE : Verwendung von GPT-4 zur Bewertung der Persönlichkeitsmerkmale in generiertem Text.

Zur Beurteilung von Acc und TPEI können Sie den trainierten Klassifikator hier herunterladen.

Vergleiche verschiedener Technologien

Auswertung

Der Wissensbearbeitungsprozess wirkt sich im Allgemeinen auf die Vorhersagen für eine breite Reihe von Eingaben aus , die eng mit dem Bearbeitungsbeispiel verknüpft sind und als Bearbeitungsbereich bezeichnet werden.

Eine erfolgreiche Bearbeitung sollte das Verhalten des Modells innerhalb des Bearbeitungsbereichs anpassen und gleichzeitig unabhängige Eingaben beibehalten:

$$ f_{theta_{e}}(x) = begin{cases} y_e & text{if } x in I(x_e,y_e) \ f_{theta}(x) & text{if } x in O(x_e, y_e) end{cases} $$

Reliability : Die Erfolgsquote der Bearbeitung mit einem bestimmten Bearbeitungsdeskriptor
Generalization : Die Erfolgsquote der Bearbeitung innerhalb des Bearbeitungsbereichs
Locality : ob sich die Ausgabe des Modells nach der Bearbeitung für nicht verwandte Eingaben ändert
Portability : Die Erfolgsquote der Bearbeitung für Argumentation/Anwendung (ein Hop, Synonym, logische Verallgemeinerung)
Efficiency : Zeit- und Speicherverbrauch

?Überblick

EasyEdit ist ein Python-Paket zum Bearbeiten großer Sprachmodelle (LLM) wie GPT-J , Llama , GPT-NEO , GPT2 , T5 (unterstützt Modelle von 1B bis 65B ), dessen Ziel darin besteht, das Verhalten von LLMs effizient innerhalb eines zu ändern spezifische Domäne ohne negative Auswirkungen auf die Leistung anderer Eingaben. Es ist so konzipiert, dass es einfach zu bedienen und leicht zu erweitern ist.

EasyEdit enthält ein einheitliches Framework für Editor , Methode und Evaluate , das jeweils das Bearbeitungsszenario, die Bearbeitungstechnik und die Bewertungsmethode darstellt.
Jedes Wissensbearbeitungsszenario besteht aus drei Komponenten:
- Editor : wie BaseEditor ( Factual Knowledge and Generation Editor) für LM, MultiModalEditor ( MultiModal Knowledge ).
- Method : Die verwendete spezifische Wissensbearbeitungstechnik (z. B. ROME , MEND usw.).
- Evaluate : Metriken zur Bewertung der Wissensbearbeitungsleistung.
  - Reliability , Generalization , Locality , Portability
Die derzeit unterstützten Wissensbearbeitungstechniken sind wie folgt:
- Speicherbasiert: SERAC, IKE, GRACE, MELO, WISE
- Meta-Lernen: MEND, InstructEdit, MALMEN
- Suchen und dann bearbeiten: KN, ROME, MEMIT, PMET, DINM, R-ROME, EMMET
- FT-L
Hinweis 1: Aufgrund der eingeschränkten Kompatibilität dieses Toolkits werden einige Wissensbearbeitungsmethoden, einschließlich T-Patcher, KE, CaliNet, nicht unterstützt.
Hinweis 2: Ebenso wird die MALMEN-Methode aus den gleichen Gründen nur teilweise unterstützt und wird weiterhin verbessert.

Aktuelle Implementierung

Sie können je nach Ihren spezifischen Anforderungen verschiedene Bearbeitungsmethoden wählen.

Verfahren	T5	GPT-2	GPT-J	GPT-NEO	Lama	Baichuan	ChatGLM	InternLM	Qwen	Mistral
FT	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
AdaLoRA					✅		✅
SERAC	✅	✅	✅		✅
IKE	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
HEILEN	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
KN	✅	✅	✅		✅	✅	✅	✅	✅	✅
ROM		✅	✅	✅	✅	✅	✅	✅	✅	✅
r-ROM		✅	✅	✅	✅	✅	✅	✅	✅	✅
MEMIT		✅	✅	✅	✅	✅	✅	✅	✅	✅
EMMET		✅	✅		✅
ANMUT		✅	✅		✅
MELO		✅
PMET			✅		✅
AnweisenBearbeiten		✅			✅
DINM		✅			✅					✅
WEISE		✅	✅		✅	✅			✅
AlphaEdit		✅	✅		✅

❗️❗️ Wenn Sie Mistral verwenden möchten, aktualisieren Sie bitte die transformers -Bibliothek manuell auf Version 4.34.0. Sie können den folgenden Code verwenden: pip install transformers==4.34.0 .

Schnellstart einiger Arbeiten

Arbeiten	Beschreibung	Weg
AnweisenBearbeiten	InstructEdit: Anweisungsbasierte Wissensbearbeitung für große Sprachmodelle	Schnellstart
DINM	Entgiftung großer Sprachmodelle durch Wissensbearbeitung	Schnellstart
WEISE	WISE: Überdenken des Wissensspeichers für die lebenslange Modellbearbeitung großer Sprachmodelle	Schnellstart
KonzeptBearbeiten	Bearbeiten von konzeptionellem Wissen für große Sprachmodelle	Schnellstart
MMBearbeiten	Können wir multimodale große Sprachmodelle bearbeiten?	Schnellstart
PersönlichkeitBearbeiten	Bearbeiten der Persönlichkeit für große Sprachmodelle	Schnellstart
PROMPT	PROMPT-basierte Wissensbearbeitungsmethoden	Schnellstart

Datensatz

Benchmark: KnowEdit [Hugging Face][WiseModel][ModelScope]

❗️❗️ Zu beachten ist, dass KnowEdit durch die Neuorganisation und Erweiterung bestehender Datensätze erstellt wird, darunter WikiBio , ZsRE , WikiData _Counterfact , WikiData _Recent , convsent und Sanitation , um eine umfassende Bewertung für die Wissensbearbeitung durchzuführen. Besonderer Dank geht an die Ersteller und Betreuer dieser Datensätze.

Bitte beachten Sie, dass Counterfact und WikiData _Counterfact nicht derselbe Datensatz sind.

Aufgabe	Wissenseinbringung	Wissensmodifikation				Wissenslöschung
Datensätze	Wiki _aktuell	ZsRE	WikiBio	WikiData- _Kontrafakt	Zustimmung	Hygiene
Typ	Tatsache	Beantwortung von Fragen	Halluzination	Kontrafakt	Gefühl	Unerwünschte Informationen
# Zug	570	10.000	592	1.455	14.390	80
# Prüfen	1.266	1301	1.392	885	800	80

Wir stellen detaillierte Skripte zur Verfügung, mit denen Benutzer KnowEdit einfach verwenden können. Weitere Informationen finden Sie in den Beispielen.

Beschreibung des Datensatzes

ZsRE: ist eine kontextfreie Frage-Antwort-Aufgabe. Bei einer Frage, die auf dem Subjekt und der Beziehung basiert, wird erwartet, dass das Modell das richtige Objekt als Antwort liefert.
Wiki _aktuell : Dieser Datensatz konzentriert sich speziell auf Drillinge, die kürzlich nach Juli 2022 in WikiData eingefügt wurden.
WikiBio: Der ursprüngliche Datensatz wurde erstellt, indem GPT-3 aufgefordert wurde, 238 Biografien im Wikipedia-Stil mit Themen aus der WikiBio zu generieren.
WikiData- _Kontrafakt : Da Schwanzentitäten häufig nicht von Modellen erfasst werden und daher nicht zum Testen von Änderungsbearbeitungen geeignet sind, sammelt RippleEdit Tripletts über beliebte Entitäten, bei denen das Thema einer der am häufigsten aufgerufenen Seiten in Wikipedia entspricht.
Convsent: Hierbei handelt es sich um eine Stimmungsbearbeitungsaufgabe, die die Fähigkeit des Modells bewertet, die Stimmung eines Dialogagenten zu einem bestimmten Thema zu ändern, ohne seine Reaktionen auf andere Themen zu beeinflussen.
Hygiene: Dieser Datensatz befasst sich speziell mit Datenschutzbedenken im Zusammenhang mit erlernten Sprachmodellen.

Datensatzstruktur

 knowedit
├── WikiBio
│   ├── wikibio-test-all.json
│   └── wikibio-train-all.json
├── ZsRE
│   └── ZsRE-test-all.json
├── wiki_counterfact
│   ├── test_cf.json
│   └── train_cf.json
├── convsent
│   ├── blender_test.json
│   ├── blender_train.json
│   └── blender_val.json
├── convsent
│   ├── trivia_qa_test.json
│   └── trivia_qa_train.json
└── wiki_recent
    ├── recent_test.json
    └── recent_train.json

Datensätze für chinesisches Wissen: CKnowEdit

Datensatz	Umarmendes Gesicht	WiseModel	ModelScope	Beschreibung
CKnowEdit	[Umarmendes Gesicht]	[WiseModel]	[ModelScope]	Datensatz zur Bearbeitung des chinesischen Wissens

Hier können Sie CKnowEdit.md folgen, um weitere Details zu CKnowEdit zu erfahren und Experimente zur Bearbeitung von Chinesischkenntnissen durchzuführen.

Beschreibung des Datensatzes

CKnowEdit ist ein hochwertiger chinesischsprachiger Datensatz zur Wissensbearbeitung, der stark durch die chinesische Sprache geprägt ist und dessen Daten aus chinesischen Wissensdatenbanken stammen. Es wurde sorgfältig entwickelt, um die Nuancen und Herausforderungen, die das Verständnis der chinesischen Sprache durch aktuelle LLM-Studierende mit sich bringt, tiefer zu erkennen und eine solide Ressource für die Verfeinerung chinesischspezifischer Kenntnisse innerhalb von LLM-Studiengängen bereitzustellen.

Die Feldbeschreibungen für die Daten in CKnowEdit lauten wie folgt:

 "prompt" : query inputed to the model ( str )
"target_old" : the incorrect response previously generated by the model ( str )
"target_new" : the accurate answer of the prompt ( str )
"portability_prompt" : new prompts related to the target knowledge ( list or None )
"portability_answer" : accurate answers corresponding to the portability_prompt ( list or None )
"locality_prompt" : new prompts unrelated to the target knowledge ( list or None )
"locality_answer" : accurate answers corresponding to the locality_prompt ( list or None )
"rephrase" : alternative ways to phrase the original prompt ( list )

Datensatzstruktur

 CknowEdit
├── Chinese Literary Knowledge
│   ├── Ancient Poetry
│   ├── Proverbs
│   └── Idioms
├── Chinese Linguistic Knowledge
│   ├── Phonetic Notation
│   └── Classical Chinese
├── Chinese Geographical Knowledge
└── Ruozhiba

Datensätze für Faktenwissen

Datensatz	Google Drive	BaiduNetDisk	Beschreibung
ZsRE plus	[Google Drive]	[BaiduNetDisk]	Frage-Antwort-Datensatz mit Fragenumformulierungen
Kontrafakt plus	[Google Drive]	[BaiduNetDisk]	Kontrafaktischer Datensatz mit Entitätsersetzung

Wir stellen ZSRE- und Counterfact-Datensätze zur Verfügung, um die Wirksamkeit der Wissensbearbeitung zu überprüfen. Sie können sie hier herunterladen. [Google Drive], [BaiduNetDisk].

Für die Lokalität bieten wir zusätzlich zum Testen unabhängiger Instanzen auch Tests zur Ablenkung (Referenz: Erkennen von Bearbeitungsfehlern...), zu anderen Zuordnungen und anderen nachgelagerten Aufgaben (z. B. vernünftiges Denken) an.
Aus Gründen der Portabilität wird getestet, ob das Modell bearbeitete Instanzen zur Inferenz anwenden kann. Wir bieten Auswertungen für One-Hop-Argumentation, Subjektalias und umgekehrte Beziehung (z. B. sollte eine Eins-zu-eins-Beziehung zwischen Ehepartnern bidirektional bearbeitet werden).

Beschreibung des Datensatzes

 editing-data
├── counterfact
│   ├── counterfact-edit.json
│   ├── counterfact-train.json
│   └── counterfact-val.json
├── locality
│   ├── Commonsense Task
│   │   ├── piqa_valid-labels.lst
│   │   └── piqa_valid.jsonl
│   ├── Distracting Neighbor
│   │   └── counterfact_distracting_neighbor.json
│   └── Other Attribution
│       └── counterfact_other_attribution.json
├── portability
│   ├── Inverse Relation
│   │   └── zsre_inverse_relation.json
│   ├── One Hop
│   │   ├── counterfact_portability_gpt4.json
│   │   └── zsre_mend_eval_portability_gpt4.json
│   └── Subject Replace
│       ├── counterfact_subject_replace.json
│       └── zsre_subject_replace.json
└── zsre
    ├── zsre_mend_eval.json
    ├── zsre_mend_train_10000.json
    └── zsre_mend_train.json

Gegenfakt: ursprünglicher Gegenfakt-Datensatz unter Verwendung der Entitätsersetzung
zsre: ursprünglicher Frage-Antwort-Datensatz unter Verwendung von Fragenumformulierungen
Lokalität (Bewertung der Lokalität, siehe Einzelheiten in diesem Dokument)
- Commonsense-Aufgabe: Auswertung für andere nachgelagerte Aufgaben wie Common-Sense-Aufgaben
- Ablenkender Nachbar: Test auf ablenkende Nachbarschaft (Referenz: Erkennen von Bearbeitungsfehlern...)
- Andere Namensnennung
Portabilität
- Inverse Beziehung: Bewertung für eine Eins-zu-eins-Beziehung, beispielsweise zum spouse
- One Hop: Auswertung für One-Hop-Argumentation
- Betreff ersetzen: Bewertung für Synonymersetzung

Datensätze für konzeptionelles Wissen: ConceptEdit

Datensatz	Google Drive	HuggingFace-Datensatz	Beschreibung
KonzeptBearbeiten	[Google Drive]	[HuggingFace-Datensatz]	Datensatz zur Bearbeitung konzeptionellen Wissens

Hier können Sie ConceptEdit.md folgen, um Konzeptbearbeitungsexperimente durchzuführen.

Beschreibung des Datensatzes

 data
└──concept_data.json
    ├──final_gpt2_inter.json
    ├──final_gpt2_intra.json
    ├──final_gptj_inter.json
    ├──final_gptj_intra.json
    ├──final_llama2chat_inter.json
    ├──final_llama2chat_intra.json
    ├──final_mistral_inter.json
    └──final_mistral_intra.json

Konzeptspezifische Bewertungsmetriken

Instance Change : Erfassen der Feinheiten dieser Änderungen auf Instanzebene
Concept Consistency : die semantische Ähnlichkeit der generierten Konzeptdefinition

Datensätze für multimodales Wissen: MMEdit

Datensatz	Google Drive	BaiduNetDisk	Beschreibung
E-IC	[Google Drive]	[BaiduNetDisk]	Datensatz zum Bearbeiten von Bildunterschriften
E-VQA	[Google Drive]	[BaiduNetDisk]	Datensatz zur Bearbeitung von Visual Question Answering

Alle in E-IC und E-VQA verwendeten Bilder stehen zum Download auf Google Drive zur Verfügung
Für die Lokalität ist es dasselbe wie die Bearbeitung von Fakten, um zu messen, ob nicht zusammenhängende Fakten ihre Ergebnisse behalten.
Für die multimodale Lokalität wird die Auswirkung der Bearbeitung auf das visuelle Modul bewertet, was der regulären Lokalität ähnelt.

Beschreibung des Datensatzes

 editing-data
├── caption
│   ├── caption_train_edit.json
│   └── caption_eval_edit.json
├── locality
│   ├── NQ dataset
│   │   ├── train.json
│   │   └── validation.json
├── multimodal_locality
│   ├── OK-VQA dataset
│   │   ├── okvqa_loc.json
└── vqa
    ├── vqa_train.json
    └── vqa_eval.json

Multimodale Lokalität (Bewertung für multimodale Lokalität, siehe Details zum Datensatz in diesem Dokument)

Datensätze zur Entgiftung von LLMs: SafeEdit

Datensatz	HuggingFace-Datensatz	Beschreibung
SafeEdit	[HuggingFace-Datensatz]	Datensatz zur Entgiftung von LLMs

Hier können Sie SafeEdit.md folgen, um Experimente zur Entgiftungsbearbeitung durchzuführen.

Beschreibung des Datensatzes

 data
└──SafeEdit_train.json
└──SafeEdit_val.json
└──SafeEdit_test.json

Entgiftende spezifische Bewertungsmetriken

Defense Duccess (DS) : Die Entgiftungserfolgsrate des bearbeiteten LLM für gegnerische Eingaben (Angriffsaufforderung + schädliche Frage), die zum Modifizieren des LLM verwendet wird.
Defense Generalization (DG) : Die Entgiftungserfolgsrate von bearbeitetem LLM für böswillige Eingaben außerhalb der Domäne.
General Performance : die Nebenwirkungen für die Leistung unabhängiger Aufgaben.

Tutorial-Notizbuch

Verfahren	Beschreibung	GPT-2	Lama
IKE	In-Context Learning (ICL) Bearbeiten	[Colab-gpt2]	[Colab-Lama]
ROM	Neuronen lokalisieren und dann bearbeiten	[Colab-gpt2]	[Colab-Lama]
MEMIT	Neuronen lokalisieren und dann bearbeiten	[Colab-gpt2]	[Colab-Lama]

Anforderungen

?Pip-Installation

Hinweis: Bitte verwenden Sie Python 3.9+ für EasyEdit. Um zu beginnen, installieren Sie einfach conda und führen Sie Folgendes aus:

git clone https://github.com/zjunlp/EasyEdit.git
conda create -n EasyEdit python=3.9.7
...
pip install -r requirements.txt

Bearbeiten der GPU-Speichernutzung

Unsere Ergebnisse basieren alle auf der Standardkonfiguration

	Lama-2-7B	chatglm2	gpt-j-6b	gpt-xl
FT	60 GB	58 GB	55 GB	7 GB
SERAC	42 GB	32 GB	31 GB	10 GB
IKE	52 GB	38 GB	38 GB	10 GB
HEILEN	46 GB	37 GB	37 GB	13 GB
KN	42 GB	39 GB	40 GB	12 GB
ROM	31 GB	29 GB	27 GB	10 GB
MEMIT	33 GB	31 GB	31 GB	11 GB
AdaLoRA	29 GB	24 GB	25 GB	8 GB
ANMUT	27 GB		23 GB	6 GB
WEISE	34 GB		27 GB	7 GB

?Verwenden Sie EasyEdit

Bearbeiten Sie große Sprachmodelle (LLMs) in etwa 5 Sekunden
Das folgende Beispiel zeigt Ihnen, wie Sie die Bearbeitung mit EasyEdit durchführen. Weitere Beispiele und Tutorials finden Sie unter Beispiele

BaseEditor

BaseEditor ist die Klasse für die sprachmodale Wissensbearbeitung. Sie können die geeignete Bearbeitungsmethode basierend auf Ihren spezifischen Anforderungen auswählen.

Aufgrund unterschiedlicher Transformer-Versionen und unterschiedlicher GPU-Modelle können die Bearbeitungsergebnisse leicht schwanken.

Einführung anhand eines einfachen Beispiels

Dank der Modularität und Flexibilität von EasyEdit können Sie es problemlos zum Bearbeiten von Modellen verwenden.

Schritt 1: Definieren Sie ein PLM als zu bearbeitendes Objekt. Wählen Sie das zu bearbeitende PLM aus. EasyEdit unterstützt Teilmodelle ( T5 , GPTJ , GPT-NEO , LlaMA bisher), die auf HuggingFace abrufbar sind. Das entsprechende Konfigurationsdateiverzeichnis ist hparams/YUOR_METHOD/YOUR_MODEL.YAML , z. B. hparams/MEND/gpt2-xl.yaml . Legen Sie den entsprechenden model_name fest, um das Objekt für die Wissensbearbeitung auszuwählen.

 model_name : gpt2-xl
model_class : GPT2LMHeadModel
tokenizer_class : GPT2Tokenizer
tokenizer_name : gpt2-xl
model_parallel : false # true for multi-GPU editing

Schritt 2: Wählen Sie die entsprechende Wissensbearbeitungsmethode

 ## In this case, we use MEND method, so you should import `MENDHyperParams`
from easyeditor import MENDHyperParams
## Loading config from hparams/MEMIT/gpt2-xl.yaml
hparams = MENDHyperParams . from_hparams ( './hparams/MEND/gpt2-xl' )

Schritt 3: Geben Sie den Bearbeitungsdeskriptor und das Bearbeitungsziel an

 ## edit descriptor: prompt that you want to edit
prompts = [
    'What university did Watts Humphrey attend?' ,
    'Which family does Ramalinaceae belong to' ,
    'What role does Denny Herzig play in football?'
]
## You can set `ground_truth` to None !!!(or set to original output)
ground_truth = [ 'Illinois Institute of Technology' , 'Lecanorales' , 'defender' ]
## edit target: expected output
target_new = [ 'University of Michigan' , 'Lamiinae' , 'winger' ]

Schritt 4: Kombinieren Sie sie zu einem BaseEditor EasyEdit bietet eine einfache und einheitliche Möglichkeit, Editor zu initiieren, wie zum Beispiel Huggingface: from_hparams .

 ## Construct Language Model Editor
editor = BaseEditor . from_hparams ( hparams )

Schritt 5: Bereitstellen der Daten für die Auswertung. Beachten Sie, dass die Daten für Portabilität und Lokalität beide optional sind (auf „Keine“ gesetzt, nur für die grundlegende Auswertung der Bearbeitungserfolgsrate). Das Datenformat für beide ist ein Diktat . Für jede Messdimension müssen Sie die entsprechende Eingabeaufforderung und die entsprechende Grundwahrheit angeben. Hier ist ein Beispiel der Daten:

 locality_inputs = {
    'neighborhood' :{
        'prompt' : [ 'Joseph Fischhof, the' , 'Larry Bird is a professional' , 'In Forssa, they understand' ],
        'ground_truth' : [ 'piano' , 'basketball' , 'Finnish' ]
    },
    'distracting' : {
        'prompt' : [ 'Ray Charles, the violin Hauschka plays the instrument' , 'Grant Hill is a professional soccer Magic Johnson is a professional' , 'The law in Ikaalinen declares the language Swedish In Loviisa, the language spoken is' ],
        'ground_truth' : [ 'piano' , 'basketball' , 'Finnish' ]
    }
}

Im obigen Beispiel bewerten wir die Leistung der Bearbeitungsmethoden zu „Nachbarschaft“ und „Ablenkung“.

Schritt 6: Bearbeitung und Auswertung abgeschlossen! Wir können die Bearbeitung und Bewertung Ihres zu bearbeitenden Modells durchführen. Die edit gibt eine Reihe von Metriken im Zusammenhang mit dem Bearbeitungsprozess sowie die geänderten Modellgewichte zurück. [ sequential_edit=True für kontinuierliche Bearbeitung]

 metrics , edited_model , _ = editor . edit (
    prompts = prompts ,
    ground_truth = ground_truth ,
    target_new = target_new ,
    locality_inputs = locality_inputs ,
    sequential_edit = False # True: start continuous editing ✈️
)
## metrics: edit success, rephrase success, locality e.g.
## edited_model: post-edit model

Die maximale Eingabelänge für EasyEdit beträgt 512. Wenn diese Länge überschritten wird, wird der Fehler „CUDA-Fehler: Geräteseitiges Assert ausgelöst“ angezeigt. Sie können die maximale Länge in der folgenden Datei ändern:LINK

Schritt 7: RollBack Wenn Sie bei der sequentiellen Bearbeitung mit dem Ergebnis einer Ihrer Bearbeitungen nicht zufrieden sind und Ihre vorherigen Bearbeitungen nicht verlieren möchten, können Sie die Rollback-Funktion verwenden, um Ihre vorherige Bearbeitung rückgängig zu machen. Derzeit unterstützen wir nur die GRACE-Methode. Alles, was Sie tun müssen, ist eine einzige Codezeile und den edit_key, um Ihre Bearbeitung rückgängig zu machen.

 editor.rolllback('edit_key')

In EasyEdit verwenden wir standardmäßig target_new als edit_key

Auswertung

Wir geben die Rückgabemetriken als dict an, einschließlich Modellvorhersageauswertungen vor und nach der Bearbeitung. Für jede Bearbeitung werden die folgenden Messwerte enthalten:

rewrite_acc $rightarrow$ Zuverlässigkeit
rephrase_acc $rightarrow$ Verallgemeinerung
locality $rightarrow$ Lokalität
portablility $rightarrow$ Portabilität

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2024-12-08
Größe 49.84MB
Kommt von Github

Ähnliche Anwendungen

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
viptools for eslam

2024-12-15
MySchedule.py

2024-12-15
VITAident

2024-12-15