EasyEdit 다운로드 - EasyEdit 소스 코드 다운로드

EasyEdit

기타 소스코드

1.0.0

다운로드

대규모 언어 모델을 위한 사용하기 쉬운 지식 편집 프레임워크.

설치 • 빠른 시작 • 문서 • 문서 • 데모 • 벤치마크 • 기여자 • 슬라이드 • 비디오 • AK 특집

목차
?소식
데모 편집
지식 편집
- 작업 정의
  - 지식 삽입
  - 지식 업데이트
  - 지식삭제
- 다양한 기술의 비교
- 평가
?개요
- 현재 구현
- 우리 팀이 디자인한 일부 작품의 빠른 시작
- 튜토리얼 노트
요구사항
- ?핍 설치
- GPU 메모리 사용량 편집
?EasyEdit 사용
- 베이스에디터
  - 간단한 예를 통한 소개
- 평가
- 훈련자
KnowEdit과 함께 EasyEdit 사용하기
- 데이터세트
- 용법
퍼포먼스 편집
소환
?기여자
- 기타 관련 프로젝트

?소식

2024-11-19, EasyEdit에서 특정 방법(AdaLoRA 관련)을 최적화하고 계산 버그(ROME 및 MEMIT 관련)를 수정한 후 "A Comprehensive Study of Knowledge Editing for Large Language Models" 논문에서 표 4 결과를 업데이트합니다. (자세한 내용은 #427 참조) 이러한 개선으로 인해 이전보다 더 나은 결과를 얻을 수 있었습니다. 우리는 이 백서를 계속 업데이트할 것이며 모든 사람이 아이디어를 토론하고 교환하는 것을 환영합니다.
2024-11-11, LLMs4Code의 모델 편집에 관한 논문 "LLMs4Code의 모델 편집: 우리는 얼마나 멀리 있습니까?"가 ICSE 2025에 승인되었습니다! 이 작업은 EasyEdit을 기반으로 구축된 LLMs4Code 편집, CLMEEval에 대한 벤치마크를 제안합니다!
2024-11-09, #390의 KnowEdit 결과 관련 버그를 수정했습니다. @StarLooo의 도움에 감사드립니다.
2024-10-24, EasyEdit에는 AlphaEdit라는 두 가지 새로운 지식 편집 방법이 추가되었습니다. 또한, 몇 가지 버그를 수정했습니다.

이전 뉴스

2024-10-23, EasyEdit는 조정 편집의 제한된 디코딩 방법을 통합하여 LLM 및 MLLM의 환각을 완화하며 DoLa 및 DeCo에서 사용할 수 있는 자세한 정보를 제공합니다.
2024-09-26, ?? 우리 논문 "WISE: 대규모 언어 모델의 평생 모델 편집을 위한 지식 메모리 재검토"가 NeurIPS 2024 에 승인되었습니다.
2024-09-20, ?? 우리 논문: "대규모 언어 모델의 지식 메커니즘: 조사 및 관점" 및 "대규모 언어 모델에 대한 개념적 지식 편집" 이 EMNLP 2024 결과 에 의해 승인되었습니다.
2024-07-29, EasyEdit에는 ROME을 일괄 설정으로 일반화하는 새로운 모델 편집 알고리즘 EMMET가 추가되었습니다. 이를 통해 기본적으로 ROME 손실 기능을 사용하여 일괄 편집을 수행할 수 있습니다.
2024년 7월 23일, 우리는 대규모 언어 모델에서 지식을 획득, 활용 및 진화하는 방법을 검토하는 "대규모 언어 모델의 지식 메커니즘: 조사 및 관점"이라는 새 논문을 발표합니다. 이 설문조사는 LLM의 지식을 정확하고 효율적으로 조작(편집)하기 위한 기본 메커니즘을 제공할 수 있습니다.
2024-06-04, ?? EasyEdit 논문이 ACL 2024 시스템 데모 트랙에 승인되었습니다.
2024-06-03, 우리는 "WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models" 라는 제목의 논문을 발표했으며, 새로운 편집 작업인 지속적인 지식 편집 과 이에 상응하는 WISE라는 평생 편집 방법을 소개했습니다.
2024년 4월 24일, EasyEdit은 Llama3-8B에 대한 ROME 방법 지원을 발표했습니다. 사용자는 변환기 패키지를 버전 4.40.0으로 업데이트하는 것이 좋습니다.
2024년 3월 29일, EasyEdit에서는 GRACE에 대한 롤백 지원을 도입했습니다. 자세한 소개는 EasyEdit 설명서를 참조하세요. 향후 업데이트에는 점차적으로 다른 방법에 대한 롤백 지원이 포함될 예정입니다.
2024-03-22, "Detoxifying Large Language Models via Knowledge Editing" 이라는 제목의 새로운 논문이 SafeEdit이라는 새로운 데이터세트와 DINM이라는 새로운 해독 방법 과 함께 발표되었습니다.
2024-03-12, "대형 언어 모델에 대한 개념 지식 편집" 이라는 제목의 또 다른 논문이 발표되어 ConceptEdit이라는 새로운 데이터 세트를 소개했습니다.
2024-03-01, EasyEdit은 FT-M 이라는 새로운 방법에 대한 지원을 추가했습니다. 이 방법에는 대상 답변에 대한 교차 엔트로피 손실을 사용하고 원본 텍스트를 마스킹하는 특정 MLP 레이어를 교육하는 작업이 포함됩니다. ROME의 FT-L 구현보다 성능이 뛰어납니다. 173호의 저자에게 조언을 해주셔서 감사드립니다.
2024년 2월 27일, EasyEdit에서는 "InstructEdit: 대규모 언어 모델을 위한 명령어 기반 지식 편집" 논문에 제공된 기술 세부 정보와 함께 InstructEdit이라는 새로운 방법에 대한 지원을 추가했습니다.

2024-02-09, EasyEdit에는 Dynamic LoRA 모델 편집 방법 MELO'AAAI24에 대한 지원이 추가되었습니다.
2024년 2월 6일, 우리는 HF 데모 EasyInstruct와 함께 "EasyInstruct: 대규모 언어 모델을 위한 사용하기 쉬운 명령어 처리 프레임워크"라는 새 논문을 발표했습니다.
2024년 2월 6일, LLM 환각 감지를 위한 예비 도구인 EasyDetect를 데모와 함께 출시합니다.
2024-01-24, EasyEdit에는 Mistral-7B 편집에 대한 지원이 추가되었습니다(변환기 수동 업데이트==4.34.0). MEND 평가 시 일부 버그도 수정했습니다(성능에 약간 영향을 미침).
2024-01-16, EasyEdit에는 정확한 모델 편집 방법 PMET'AAAI24에 대한 지원이 추가되었습니다.
2024-01-03, 우리는 새로운 벤치마크 KnowEdit을 사용하여 "대규모 언어 모델을 위한 지식 편집에 대한 종합 연구"라는 새로운 논문을 발표했습니다! KnowEdit은 WikiBio, ZsRE, WikiData Counterfact, WikiData Recent, consent, Sanitation을 포함한 기존 데이터 세트를 새로운 열차/평가/테스트 분할로 재구성하고 정리하여 구성됩니다. 해당 데이터 세트를 구축하고 유지 관리하는 분들께 특별히 감사드립니다. 이 주제에 대한 의견이나 토론을 기대합니다 :)
2023년 12월 6일, EasyEdit에는 평생 모델 편집 방법 GRACE'NeurIPS24에 대한 지원이 추가되었습니다.
2023-11-18, 우리의 튜토리얼 "대형 언어 모델을 위한 지식 편집"이 COLING 2024에 승인되었습니다.
2023년 10월 25일, 우리 튜토리얼 "대규모 언어 모델을 위한 지식 편집"이 AAAI 2024에 승인되었습니다.
2023년 10월 24일, EasyEdit에서는 Baichuan2, ChatGLM2, InternLM, QWen의 효율적인 편집을 위한 지원을 추가하고 더 나은 사용자 경험을 위해 몇 가지 버그를 수정했습니다.
2023-10-14, "Can We Edit Multimodal Large Language Models?"라는 논문을 기반으로 MultimodalEditor를 출시합니다.
2023-10-13, "Can We Edit Multimodal Large Language Models?"라는 논문을 발표합니다. EMNLP 2023에서 승인되었습니다.
2023-10-08, 우리 논문 "대형 언어 모델 편집: 문제, 방법 및 기회"가 EMNLP 2023에 승인되었습니다.
2023년 10월 7일, EasyEdit에는 Huggingface Accelerate 사용하여 여러 GPU가 있는 모델 편집에 대한 지원이 추가되었습니다.
2023년 9월 21일, EasyEdit은 LLM에 지식을 주입하기 위해 AdaLoRA를 통해 매개변수 효율적인 미세 조정에 대한 지원을 추가했습니다.
2023년 8월 31일, EasyEdit에서는 편집 사례에 맞게 ChatGPT를 사용자 정의하기 위해 gpt-3.5-turbo에 대한 공식 미세 조정 API에 대한 지원을 추가했습니다.
2023년 8월 15일, "EasyEdit: 대규모 언어 모델을 위한 사용하기 쉬운 지식 편집 프레임워크"라는 논문을 발표합니다.
2023년 7월 12일, LLM을 위한 여러 지식 편집 기술을 지원하는 버전 0.0.1을 출시합니다. EasyEdit은 LLM을 사용자의 변화하는 요구와 가치에 더 잘 맞추는 데 도움이 됩니다.
2023년 5월 22일에 "Editing Large Language Models: Problems, Methods, and Opportunities" 논문을 발표하고 PaperList에 논문 목록을 제공합니다.
2023년 3월 25일, EasyEdit 프로젝트가 출시되어 개발 중입니다.

대규모 언어 모델을 위한 지식 편집에 대한 종합 연구 [논문][벤치마크][코드]

IJCAI 2024 튜토리얼 구글 드라이브

COLING 2024 튜토리얼 구글 드라이브

AAAI 2024 튜토리얼 Google 드라이브

AACL 2023 튜토리얼 [구글 드라이브] [바이두 팬]

데모 편집

편집 시연이 있습니다. GIF 파일은 Terminalizer에 의해 생성됩니다.

편리한 Jupyter Notebook을 제공합니다! 이를 통해 미국 대통령에 대한 LLM의 지식을 편집하고 Biden에서 Trump로 전환하고 심지어 Biden으로 다시 전환할 수도 있습니다. 여기에는 WISE, AlphaEdit, AdaLoRA 및 프롬프트 기반 편집과 같은 방법이 포함됩니다.

지식 편집

작업 정의

배포된 모델에서는 여전히 예측할 수 없는 오류가 발생할 수 있습니다. 예를 들어, LLM은 환각을 일으키고 편견을 지속시키며 사실을 부패시키는 것으로 악명 높으므로 사전 훈련된 모델의 특정 동작을 조정할 수 있어야 합니다.

지식 편집은 기본 모델의 조정을 목표로 합니다. $(f_세타)$ 특정 편집 설명자의 동작 $[x_e, y_e]$ 효율적으로.

다중 설정

단일 지식 편집

단일 편집 후 모델의 성능을 평가합니다. 모델은 단일 편집 후 원래 가중치를 다시 로드합니다(예: LoRA는 어댑터 가중치를 삭제합니다). sequential_edit=False 로 설정해야 합니다.

$$theta' leftarrow text{arg} minlimits_{theta} (Vert f_theta(x_e) - y_e Vert)$$

지속적인 지식 편집

이를 위해서는 순차적인 편집이 필요하며 모든 지식 업데이트가 적용된 후 평가가 수행됩니다.

$$theta' leftarrow text{arg} minlimits_{theta} sum_{e=1}^{Vert X_e Vert} (Vert f_theta(x_e) - y_e Vert)$ $

매개변수를 조정합니다. $(x_e, y_e)$ , 어디 $x_e in X_e$ 그리고 $f_theta'(x_e) = y_e$ . 여기, $X_e$ 는 전체 편집 세트를 나타냅니다. 지속적인 편집을 활성화하려면 sequential_edit=True : README(자세한 내용)를 설정하면 됩니다.

다중 시나리오

사실적 지식 편집

지식 삽입

LLM이 이전에 보지 못한 지식을 주입합니다. 와 같은:
- 메시는 월드컵에서 몇 번이나 우승했습니까? 0 $오른쪽화살표$ 1 :

지식 업데이트

오래된 지식을 업데이트하세요. 와 같은:
- 미국 대통령 : 도널드 트럼프 $오른쪽화살표$ 조 바이든 :

지식삭제

민감한 정보를 삭제하세요. 와 같은:
- 누군가의 전화번호는 XXXX입니다 $오른쪽화살표$ __

관련되지 않은 샘플의 모델 동작에 영향을 주지 않고 편집된 모델을 만드는 것이 궁극적인 목표입니다. $(f_theta')$ .

안전 편집

**Detoxifying LLM**은 안전하고 신뢰할 수 있는 LLM(대형 언어 모델)을 구축하기 위해 노력합니다. 지식 편집은 전반적인 성능을 저하시키지 않고 영구적인 조정을 위해 특정 영역에 중점을 둡니다. 그런 다음 지식 편집을 통해 LLM을 해독하면 소량의 데이터(일반적으로 인스턴스)를 활용하여 LLM의 독성 동작을 수정합니다. 편집된 LLM은 다양한 악의적 입력을 방어할 수 있습니다. [읽어보기](https://github.com/zjunlp/EasyEdit/blob/main/examples/SafeEdit.md)

다중 모달 모델 편집

이미지 캡션 및 시각적 질문 응답을 위한 편집 작업 . 읽어보기

성격 편집

제안된 작업은 개인의 의견이 성격 특성의 측면을 반영할 수 있다는 점을 고려하여 특정 주제에 대한 의견을 편집하여 LLM의 성격을 편집하려는 예비 시도를 취합니다. 우리는 데이터 세트를 구성하고 LLM의 성격 표현을 평가하기 위한 기초로 확립된 BIG FIVE 이론을 활용합니다. 읽어보기

평가

로지트 기반

ES : 미리 생성된 텍스트의 로짓을 기반으로 편집 성공률을 평가합니다.
DD : 미리 생성된 텍스트의 로짓을 기반으로 모델이 다른 주제에 대한 의견을 바꾸는지 여부를 평가합니다.

세대 기반

Acc : 대상 성격에 대한 모델을 편집한 후 생성된 텍스트의 정확도입니다.
TPEI : 편집된 모델에서 생성된 의견 텍스트가 대상 성격에 더 기울어지는지 여부를 측정합니다.
PAE : GPT-4를 활용하여 생성된 텍스트의 성격 특성을 평가합니다.

Acc 및 TPEI를 평가하는 동안 여기에서 훈련된 분류기를 다운로드할 수 있습니다.

다양한 기술의 비교

평가

지식 편집 프로세스는 일반적으로 편집 범위 라고 하는 편집 예시와 밀접하게 관련된 광범위한 입력 집합에 대한 예측에 영향을 미칩니다.

성공적인 편집은 관련 없는 입력을 유지하면서 편집 범위 내에서 모델의 동작을 조정해야 합니다.

$$ f_{theta_{e}}(x) = begin{cases} y_e & text{if } x in I(x_e,y_e) \ f_{theta}(x) & text{if } x in O(x_e, y_e) end{cases} $$

Reliability : 주어진 편집 설명자를 사용한 편집 성공률
Generalization : 편집 범위 내에서 편집 성공률
Locality : 관련 없는 입력을 편집한 후 모델의 출력이 변경되는지 여부
Portability : 추론/적용을 위한 편집 성공률(원 홉, 동의어, 논리적 일반화)
Efficiency : 시간 및 메모리 소비

?개요

EasyEdit은 GPT-J , Llama , GPT-NEO , GPT2 , T5 ( 1B 에서 65B 까지 지원 모델)와 같은 LLM(대형 언어 모델)을 편집하기 위한 Python 패키지입니다. 이 패키지의 목적은 LLM의 동작을 효율적으로 변경하는 것입니다. 다른 입력 전반에 걸쳐 성능에 부정적인 영향을 주지 않고 특정 도메인을 제어합니다. 사용하기 쉽고 확장하기 쉽도록 설계되었습니다.

EasyEdit에는 각각 편집 시나리오, 편집 기술 및 평가 방법을 나타내는 Editor , Method 및 Evaluate 에 대한 통합 프레임워크가 포함되어 있습니다.
각 지식 편집 시나리오는 세 가지 구성 요소로 구성됩니다.
- Editor : LM용 BaseEditor( 사실적 지식 및 생성 편집기), MultiModalEditor( MultiModal Knowledge ) 등.
- Method : 사용된 특정 지식 편집 기술(예: ROME , MEND , ..)
- Evaluate : 지식 편집 성능을 평가하기 위한 지표입니다 .
  - Reliability , Generalization , Locality , Portability
현재 지원되는 지식 편집 기술은 다음과 같습니다.
- 메모리 기반: SERAC, IKE, GRACE, MELO, WISE
- 메타 학습: MEND, InstructEdit, MALMEN
- 찾아서 편집: KN, ROME, MEMIT, PMET, DINM, R-ROME, EMMET
- FT-L
참고 1: 이 툴킷의 제한된 호환성으로 인해 T-Patcher, KE, CaliNet을 포함한 일부 지식 편집 방법은 지원되지 않습니다.
참고 2: 마찬가지로 MALMEN 방법도 같은 이유로 부분적으로만 지원되며 계속해서 개선될 예정입니다.

현재 구현

특정 요구 사항에 따라 다양한 편집 방법을 선택할 수 있습니다.

방법	T5	GPT-2	GPT-J	GPT-네오	야마	바이촨	채팅GLM	인턴LM	퀀	미스트랄
FT	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
아다로라					✅		✅
세락	✅	✅	✅		✅
이케	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
수선	✅	✅	✅	✅	✅	✅	✅	✅	✅	✅
KN	✅	✅	✅		✅	✅	✅	✅	✅	✅
로마		✅	✅	✅	✅	✅	✅	✅	✅	✅
r-로마		✅	✅	✅	✅	✅	✅	✅	✅	✅
MEMIT		✅	✅	✅	✅	✅	✅	✅	✅	✅
개미		✅	✅		✅
우아함		✅	✅		✅
멜로		✅
PMET			✅		✅
지시편집		✅			✅
DINM		✅			✅					✅
지혜로운		✅	✅		✅	✅			✅
알파편집		✅	✅		✅

❗️❗️ Mistral을 사용하려면 transformers 라이브러리를 4.34.0 버전으로 수동으로 업데이트하세요. 다음 코드를 사용할 수 있습니다: pip install transformers==4.34.0 .

일부 작품의 빠른 시작

일하다	설명	길
지시편집	InstructEdit: 대규모 언어 모델을 위한 명령어 기반 지식 편집	빠른 시작
DINM	지식 편집을 통한 대규모 언어 모델 해독	빠른 시작
지혜로운	현명한: 대규모 언어 모델의 평생 모델 편집을 위한 지식 메모리 재고	빠른 시작
개념편집	대규모 언어 모델에 대한 개념 지식 편집	빠른 시작
MM편집	다중 모드 대형 언어 모델을 편집할 수 있습니까?	빠른 시작
성격편집	대규모 언어 모델의 성격 편집	빠른 시작
즉각적인	PROMPT 기반 지식 편집 방법	빠른 시작

데이터세트

벤치마크: KnowEdit [껴안는 얼굴][WiseModel][ModelScope]

❗️❗️ 참고로 KnowEdit은 지식 편집에 대한 종합적인 평가를 위해 WikiBio , ZsRE , WikiData _Counterfact , WikiData _Recent , conssent , Sanitation 을 포함한 기존 데이터 세트를 재구성하고 확장하여 구성됩니다. 해당 데이터세트의 구축자와 유지관리자에게 특별한 감사를 드립니다.

Counterfact와 WikiData _{Counterfact는} 동일한 데이터 세트가 아닙니다.

일	지식 삽입	지식 수정				지식 삭제
데이터세트	_최근 위키	ZsRE	위키바이오	WikiData _반대말	동의하다	위생
유형	사실	질문 답변	환각	반대말	감정	원하지 않는 정보
# 기차	570	10,000	592	1,455	14,390	80
# 시험	1,266	1301	1,392	885	800	80

사용자가 KnowEdit을 쉽게 사용할 수 있도록 자세한 스크립트를 제공합니다. 예제를 참조하세요.

데이터 세트 설명

ZsRE: 상황에 구애받지 않는 질문 답변 작업입니다. 주제와 관계에 기반한 질문이 주어지면 모델은 올바른 객체를 답변으로 제공할 것으로 예상됩니다.
Wiki _최근 : 이 데이터 세트는 특히 2022년 7월 이후 WikiData에 최근 삽입된 세 쌍의 항목에 중점을 둡니다.
WikiBio: 원래 데이터 세트는 GPT-3가 WikiBio의 주제를 사용하여 238개의 Wikipedia 스타일 전기를 생성하도록 요청하여 생성되었습니다.
WikiData _반작용 : 꼬리 엔터티는 종종 모델에 의해 캡처되지 않으므로 수정 편집 테스트에 적합하지 않기 때문에 RippleEdit은 주제가 Wikipedia에서 가장 많이 본 페이지 중 하나에 해당하는 인기 있는 엔터티에 대한 세 쌍을 수집합니다.
Convsent: 다른 주제에 대한 응답에 영향을 주지 않고 특정 주제에 대한 대화 에이전트의 감정을 수정하는 모델의 능력을 평가하는 감정 편집 작업입니다.
위생: 이 데이터 세트는 특히 학습된 언어 모델과 관련된 개인 정보 보호 문제를 다룹니다.

데이터 세트 구조

 knowedit
├── WikiBio
│   ├── wikibio-test-all.json
│   └── wikibio-train-all.json
├── ZsRE
│   └── ZsRE-test-all.json
├── wiki_counterfact
│   ├── test_cf.json
│   └── train_cf.json
├── convsent
│   ├── blender_test.json
│   ├── blender_train.json
│   └── blender_val.json
├── convsent
│   ├── trivia_qa_test.json
│   └── trivia_qa_train.json
└── wiki_recent
    ├── recent_test.json
    └── recent_train.json

중국 지식 데이터세트: CKnowEdit

데이터세트	포옹얼굴	현명한 모델	모델범위	설명
확인하기편집	[껴안는 얼굴]	[와이즈모델]	[모델 범위]	중국어 지식 편집용 데이터 세트

여기에서 CKnowEdit.md를 팔로우하면 CKnowEdit 에 대한 자세한 내용을 확인하고 중국어 지식 편집 실험을 실행할 수 있습니다.

데이터 세트 설명

CKnowEdit 은 중국어 지식 베이스에서 가져온 모든 데이터를 포함하여 중국어의 특징이 강한 지식 편집을 위한 고품질 중국어 데이터세트입니다. 이는 현재 LLM이 중국어를 이해하는 데 내재된 뉘앙스와 어려움을 더 깊이 식별하도록 세심하게 설계되어 LLM 내에서 중국어 관련 지식을 개선하기 위한 강력한 리소스를 제공합니다.

CKnowEdit 의 데이터에 대한 필드 설명은 다음과 같습니다.

 "prompt" : query inputed to the model ( str )
"target_old" : the incorrect response previously generated by the model ( str )
"target_new" : the accurate answer of the prompt ( str )
"portability_prompt" : new prompts related to the target knowledge ( list or None )
"portability_answer" : accurate answers corresponding to the portability_prompt ( list or None )
"locality_prompt" : new prompts unrelated to the target knowledge ( list or None )
"locality_answer" : accurate answers corresponding to the locality_prompt ( list or None )
"rephrase" : alternative ways to phrase the original prompt ( list )

데이터 세트 구조

 CknowEdit
├── Chinese Literary Knowledge
│   ├── Ancient Poetry
│   ├── Proverbs
│   └── Idioms
├── Chinese Linguistic Knowledge
│   ├── Phonetic Notation
│   └── Classical Chinese
├── Chinese Geographical Knowledge
└── Ruozhiba

사실적 지식을 위한 데이터 세트

데이터세트	구글 드라이브	BaiduNetDisk	설명
ZsRE 플러스	[구글드라이브]	[바이두넷디스크]	질문 변경을 사용한 질문 답변 데이터세트
카운터팩트 플러스	[구글드라이브]	[바이두넷디스크]	엔터티 교체를 사용한 반박 데이터 세트

지식 편집의 효율성을 검증하기 위해 zsre 및 counterfact 데이터 세트를 제공합니다. 여기에서 다운로드할 수 있습니다. [구글 드라이브], [바이두넷디스크].

지역성 의 경우, 관련되지 않은 인스턴스를 테스트하는 것 외에도 방해 요소(참조: 편집 실패 감지...), 기타 속성 및 기타 다운스트림 작업(예: 상식 추론)에 대한 테스트도 제공합니다.
이식성을 위해 모델이 추론을 위해 편집된 인스턴스를 적용할 수 있는지 여부를 테스트합니다. 일대일 추론, 주제 별명, 역관계(예: 배우자 간의 일대일 관계는 양방향으로 편집되어야 함)에 대한 평가를 제공합니다.

데이터 세트 설명

 editing-data
├── counterfact
│   ├── counterfact-edit.json
│   ├── counterfact-train.json
│   └── counterfact-val.json
├── locality
│   ├── Commonsense Task
│   │   ├── piqa_valid-labels.lst
│   │   └── piqa_valid.jsonl
│   ├── Distracting Neighbor
│   │   └── counterfact_distracting_neighbor.json
│   └── Other Attribution
│       └── counterfact_other_attribution.json
├── portability
│   ├── Inverse Relation
│   │   └── zsre_inverse_relation.json
│   ├── One Hop
│   │   ├── counterfact_portability_gpt4.json
│   │   └── zsre_mend_eval_portability_gpt4.json
│   └── Subject Replace
│       ├── counterfact_subject_replace.json
│       └── zsre_subject_replace.json
└── zsre
    ├── zsre_mend_eval.json
    ├── zsre_mend_train_10000.json
    └── zsre_mend_train.json

counterfact: 엔터티 대체를 사용하는 원본 카운터팩트 데이터세트
zsre: 질문 표현을 사용한 원본 질문 답변 데이터세트
지역성(지역성에 대한 평가, 이 문서의 세부정보 참조)
- 상식 과제: 상식 과제 등 다른 하위 과제에 대한 평가
- 방해가 되는 이웃: 방해가 되는 이웃에 대한 테스트(참조: 편집 실패 감지...)
- 기타 귀속
이식성
- 역관계 : spouse 등 일대일 관계에 대한 평가
- One Hop: One Hop 추론을 위한 평가
- 제목 바꾸기: 동의어 대체 평가

개념적 지식을 위한 데이터세트: ConceptEdit

데이터세트	구글 드라이브	HuggingFace 데이터세트	설명
개념편집	[구글드라이브]	[HuggingFace 데이터셋]	개념 지식 편집을 위한 데이터세트

여기서 ConceptEdit.md를 따라 컨셉 편집 실험을 실행할 수 있습니다.

데이터 세트 설명

 data
└──concept_data.json
    ├──final_gpt2_inter.json
    ├──final_gpt2_intra.json
    ├──final_gptj_inter.json
    ├──final_gptj_intra.json
    ├──final_llama2chat_inter.json
    ├──final_llama2chat_intra.json
    ├──final_mistral_inter.json
    └──final_mistral_intra.json

개념별 평가 지표

Instance Change : 이러한 인스턴스 수준 변경의 복잡성 캡처
Concept Consistency : 생성된 개념 정의의 의미론적 유사성

다중 모드 지식을 위한 데이터세트: MMEdit

데이터세트	구글 드라이브	BaiduNetDisk	설명
E-IC	[구글드라이브]	[바이두넷디스크]	이미지 캡션 편집을 위한 데이터 세트
E-VQA	[구글드라이브]	[바이두넷디스크]	시각적 질문 답변 편집을 위한 데이터 세트

E-IC , E-VQA 에 사용된 모든 이미지는 구글 드라이브에서 다운로드 가능합니다.
지역성 의 경우 관련 없는 사실이 출력을 유지하는지 여부를 측정하기 위한 사실 편집과 동일합니다.
다중 모달 지역성 의 경우 일반 지역 성과 유사하게 편집이 시각적 모듈에 미치는 영향을 평가합니다.

데이터 세트 설명

 editing-data
├── caption
│   ├── caption_train_edit.json
│   └── caption_eval_edit.json
├── locality
│   ├── NQ dataset
│   │   ├── train.json
│   │   └── validation.json
├── multimodal_locality
│   ├── OK-VQA dataset
│   │   ├── okvqa_loc.json
└── vqa
    ├── vqa_train.json
    └── vqa_eval.json

다중 모드 지역성(다중 모드 지역성에 대한 평가, 이 문서의 데이터 세트 세부 정보 참조)

LLM 해독을 위한 데이터 세트: SafeEdit

데이터세트	HuggingFace 데이터세트	설명
안전편집	[HuggingFace 데이터셋]	LLM 해독을 위한 데이터 세트

여기서 SafeEdit.md를 따라 해독 편집 실험을 실행할 수 있습니다.

데이터 세트 설명

 data
└──SafeEdit_train.json
└──SafeEdit_val.json
└──SafeEdit_test.json

특정 평가 지표 해독

Defense Duccess (DS) : LLM을 수정하는 데 사용되는 적대적 입력(공격 프롬프트 + 유해한 질문)에 대해 편집된 LLM의 해독 성공률입니다.
Defense Generalization (DG) : 도메인 외부 악성 입력에 대해 편집된 LLM의 해독 성공률입니다.
General Performance : 관련 없는 작업 수행에 대한 부작용입니다.

튜토리얼 노트

방법	설명	GPT-2	야마
이케	상황 내 학습(ICL) 편집	[Colab-gpt2]	[콜라브라마]
로마	뉴런을 찾은 후 편집	[Colab-gpt2]	[콜라브라마]
MEMIT	뉴런을 찾은 후 편집	[Colab-gpt2]	[콜라브라마]

요구사항

?핍 설치

참고: EasyEdit에는 Python 3.9+를 사용하십시오. 시작하려면 간단히 conda를 설치하고 다음을 실행하십시오.

git clone https://github.com/zjunlp/EasyEdit.git
conda create -n EasyEdit python=3.9.7
...
pip install -r requirements.txt

GPU 메모리 사용량 편집

결과는 모두 기본 구성을 기반으로 합니다.

	라마-2-7B	chatglm2	gpt-j-6b	gpt-xl
FT	60GB	58GB	55GB	7GB
세락	42GB	32GB	31GB	10GB
이케	52GB	38GB	38GB	10GB
수선	46GB	37GB	37GB	13GB
KN	42GB	39GB	40GB	12GB
로마	31GB	29GB	27GB	10GB
MEMIT	33GB	31GB	31GB	11GB
아다로라	29GB	24GB	25GB	8GB
우아함	27GB		23GB	6GB
지혜로운	34GB		27GB	7GB

?EasyEdit 사용

약 5초 정도의 대규모 언어 모델(LLM) 편집
다음 예는 EasyEdit으로 편집을 수행하는 방법을 보여줍니다. 더 많은 예제와 튜토리얼은 예제에서 찾을 수 있습니다.

베이스에디터

BaseEditor 언어 양식 지식 편집을 위한 클래스입니다. 특정 요구 사항에 따라 적절한 편집 방법을 선택할 수 있습니다.

변환기 버전과 GPU 모델이 다르기 때문에 편집 결과가 약간 다를 수 있습니다.

간단한 예를 통한 소개

EasyEdit 의 모듈성과 유연성을 통해 쉽게 모델을 편집할 수 있습니다.

1단계: 편집할 개체로 PLM을 정의합니다. 편집할 PLM을 선택합니다. EasyEdit HuggingFace에서 검색할 수 있는 부분 모델(지금까지 T5 , GPTJ , GPT-NEO , LlaMA )을 지원합니다. 해당 구성 파일 디렉터리는 hparams/YUOR_METHOD/YOUR_MODEL.YAML (예: hparams/MEND/gpt2-xl.yaml 입니다. 지식 편집을 위한 개체를 선택하려면 해당 model_name 설정하세요.

 model_name : gpt2-xl
model_class : GPT2LMHeadModel
tokenizer_class : GPT2Tokenizer
tokenizer_name : gpt2-xl
model_parallel : false # true for multi-GPU editing

2단계: 적절한 지식 편집 방법 선택

 ## In this case, we use MEND method, so you should import `MENDHyperParams`
from easyeditor import MENDHyperParams
## Loading config from hparams/MEMIT/gpt2-xl.yaml
hparams = MENDHyperParams . from_hparams ( './hparams/MEND/gpt2-xl' )

3단계: 편집 설명자 및 편집 대상 제공

 ## edit descriptor: prompt that you want to edit
prompts = [
    'What university did Watts Humphrey attend?' ,
    'Which family does Ramalinaceae belong to' ,
    'What role does Denny Herzig play in football?'
]
## You can set `ground_truth` to None !!!(or set to original output)
ground_truth = [ 'Illinois Institute of Technology' , 'Lecanorales' , 'defender' ]
## edit target: expected output
target_new = [ 'University of Michigan' , 'Lamiinae' , 'winger' ]

4단계: BaseEditor 로 결합 EasyEdit Huggingface: from_hparams 와 같이 Editor 초기화하는 간단하고 통합된 방법을 제공합니다.

 ## Construct Language Model Editor
editor = BaseEditor . from_hparams ( hparams )

5단계: 평가용 데이터 제공 이식성과 지역성에 대한 데이터는 모두 선택 사항 입니다(기본 편집 성공률 평가에만 없음으로 설정). 두 가지 모두에 대한 데이터 형식은 dict 입니다. 각 측정 차원에 대해 해당 프롬프트와 해당 실제값을 제공해야 합니다. 다음은 데이터의 예입니다.

 locality_inputs = {
    'neighborhood' :{
        'prompt' : [ 'Joseph Fischhof, the' , 'Larry Bird is a professional' , 'In Forssa, they understand' ],
        'ground_truth' : [ 'piano' , 'basketball' , 'Finnish' ]
    },
    'distracting' : {
        'prompt' : [ 'Ray Charles, the violin Hauschka plays the instrument' , 'Grant Hill is a professional soccer Magic Johnson is a professional' , 'The law in Ikaalinen declares the language Swedish In Loviisa, the language spoken is' ],
        'ground_truth' : [ 'piano' , 'basketball' , 'Finnish' ]
    }
}

위의 예에서는 "이웃"과 "산만함"에 대한 편집 방법의 성능을 평가합니다.

6단계: 편집 및 평가가 완료되었습니다! 편집할 모델에 대한 편집 및 평가를 수행할 수 있습니다. edit 기능은 수정된 모델 가중치뿐만 아니라 편집 프로세스와 관련된 일련의 측정항목을 반환합니다. [ sequential_edit=True ]

 metrics , edited_model , _ = editor . edit (
    prompts = prompts ,
    ground_truth = ground_truth ,
    target_new = target_new ,
    locality_inputs = locality_inputs ,
    sequential_edit = False # True: start continuous editing ✈️
)
## metrics: edit success, rephrase success, locality e.g.
## edited_model: post-edit model

EasyEdit의 최대 입력 길이는 512입니다. 이 길이를 초과하면 "CUDA 오류: 장치 측 어설션이 트리거되었습니다."라는 오류가 발생합니다. 다음 파일에서 최대 길이를 수정할 수 있습니다:LINK

7단계: 롤백 순차 편집에서 편집 결과가 만족스럽지 않고 이전 편집 내용을 잃고 싶지 않은 경우 롤백 기능을 사용하여 이전 편집 내용을 취소할 수 있습니다. 현재는 GRACE 방식만 지원합니다. 여러분이 해야 할 일은 edit_key를 사용하여 편집 내용을 되돌리는 코드 한 줄뿐입니다.