UltraChat 다운로드 - UltraChat 소스 코드 다운로드

UltraChat

AI 소스 코드

1.0.0

다운로드

대규모의 유익하고 다양한 다중 라운드 대화 데이터 및 모델

UltraLM • 데이터 탐색기 • Nomic AI Atlas Explorer • 데이터 공개 • 구성 프로세스 • 종이

소식

❗️❗️ 2023년 9월 26일: 대규모, 세분화된 다양한 선호도 데이터 세트 UltraFeedback, 새로운 언어 모델 UltraLM-13B-v2.0, 보상 모델 UltraRM 및 비평가 모델 UltraCM 출시.
❗️❗️UltraRM을 사용하면 간단한 16강 샘플링으로 AlpacaEval 벤치마크에서 text-davinci-003에 비해 92.30%(13B 결과에서 UltraLM2, ?) 및 91.54%(LLaMA-1 결과에서 UltraLM, ?)의 승률을 달성합니다.
2023년 8월 7일: UltraLM-65B의 첫 번째 버전 출시.
2023년 6월 28일: UltraLM-13B가 AlpacaEval 리더보드의 오픈 소스 모델 중 1위를 차지했습니다!
2023년 6월 27일: UltraChat에서 훈련된 강력한 채팅 언어 모델인 UltraLM-13B의 첫 번째 버전을 출시합니다!
2023년 4월 20일: 모든 데이터가 공개되었으며 더 많은 처리 및 추가 데이터가 예상됩니다.
2023년 4월 17일: 나머지 글쓰기 및 창작 부문이 출시됩니다(457k).
2023년 4월 12일: 글쓰기 및 창작 부문의 첫 번째 부분이 출시됩니다.
2023년 4월 9일: gpt4all의 지원을 받아 이제 Atlas 탐색기도 있습니다.
2023년 4월 8일: GPT-J를 예로 들어 학습 스크립트를 출시합니다.
2023년 4월 7일: 세상에 관한 질문의 두 번째 부분이 공개됩니다. 여기에는 290,000개의 생성된 다중 라운드 대화가 포함되어 있습니다.
2023년 3월 31일: 세상에 관한 질문의 첫 번째 부분이 공개됩니다. 여기에는 280,000개의 생성된 다중 라운드 대화가 포함되어 있습니다.

울트라LM

UltraLM은 UltraChat에서 훈련된 일련의 채팅 언어 모델입니다. 현재 AlpacaEval Leaderboard(2023년 6월 28일 기준)에서 오픈소스 모델 중 1위 , 전체 모델 중 4위를 기록하고 있는 13B 버전을 출시했습니다. UltraLM-13B는 LLaMA-13B를 기반으로 하며 훈련 과정에서 BMTrain의 지원을 받습니다.

다운로드

모델	링크	버전
UltraLM-13B	허깅페이스 레포	v1.0
UltraLM-65B	허깅페이스 레포	v1.0
UltraLM-13B	허깅페이스 레포	v2.0
UltraRM-13B	허깅페이스 레포	v1.0
UltraCM-13B	허깅페이스 레포	v1.0

UltraLM 사용

UltraLM을 재구성하려면 LLaMA-13B 및 Delta 가중치를 다운로드하십시오. UltraLM을 테스트하고 싶다면 이 링크를 사용하십시오. 당사는 제3자가 제공하는 다른 무게를 평가하지 않았습니다.
복구된 모델의 최종 가중치를 얻으려면 /UltraLM/recover.sh 에서 스크립트를 실행하십시오.
복구된 모델을 얻은 후 /UltraLM/chat_cli.sh 의 모델 경로를 자신의 경로로 바꾸고 실행하여 채팅을 시작하세요!

참고: 다양한 하이퍼 매개변수 또는 시스템 프롬프트가 출력에 영향을 미칩니다. 기본 설정에 대한 자세한 내용은 /UltraLM/inference_cli.py 를 참조하세요.

성능

이 섹션에서는 Stanford의 Alpaca-Eval, Microsoft WizardLM의 Evol-instruct 및 엄선된 평가 세트의 세 가지 평가를 보고합니다. 현대 LLM의 평가는 편향되어 있으며 여러 요인에 의해 영향을 받을 수 있습니다. 또한 보다 포괄적인 평가 방법을 개발하기 위해 적극적으로 노력하고 있습니다.

알파카-평가

AlpacaEval은 LLM 평가를 위해 특별히 설계된 리더보드입니다. 리더보드는 GPT-4에서 자동으로 평가한 Text-Davince-003에 대한 승률을 기반으로 생성됩니다.

진화 지시

이 데이터 세트는 다양한 복잡성 수준에서 지침을 얻기 위해 여러 라운드를 통해 지침을 다시 작성하는 진화 전략으로 구성되었습니다. 벤치마크는 또 다른 뛰어난 채팅 언어 모델인 WizardLM 프로젝트에 의해 개발되었습니다!

우리의 평가 세트

우리는 Vicuna 벤치마크와 GPT-4에서 생성된 추가 300개의 질문 및 지침을 포함하는 평가 세트를 관리합니다. 질문/지침은 상식, 세계 지식, 전문 지식(특히 물리학 및 생물학), 수학, 다양한 난이도의 작문 과제 등 광범위한 주제를 다루고 있습니다. 우리는 평가를 위해 GPT-4를 사용합니다. 여기에 데이터세트가 있습니다.

UltraLM의 예

예시 A: 상식에 관한 질문
사용자: 인간의 가장 친한 친구로 알려진 동물은 무엇인가요?
UltraLM: 인간이 반려동물로 즐기는 동물은 많지만, '인간의 가장 친한 친구로 알려진 동물은 무엇입니까?'라는 질문에 대한 답이 단연 돋보이는 동물 중 하나입니다. 국산견이다. 길들여진 개들은 수만 년 동안 인간 곁에서 충실한 동료애와 도움을 제공해 왔습니다. 사람과 재산을 보호합니다. 길고 외로운 나날부터 군사 배치에 이르기까지 모든 것에 정서적 지원을 제공합니다. 개는 다양한 크기, 다양한 에너지 수준, 성격 및 기질을 지닌 믿을 수 없을 정도로 다양한 품종으로 나옵니다. 즉, 가장 필요로 하는 누구에게나 완벽하게 맞는 강아지가 있다는 것을 의미합니다.
예시 B: 상식 추론
사용자: 깃털 1파운드와 벽돌 1파운드 중 어느 것이 더 무겁나요?
UltraLM: 깃털 1파운드와 벽돌 1파운드의 무게는 모두 정확히 1파운드입니다. 이는 피트가 길이의 단위이거나 1초가 시간의 단위인 것처럼 1파운드가 무게의 단위이기 때문입니다. 우리는 물체가 무엇으로 만들어졌는지에 관계없이 다양한 물체의 무게를 설명하기 위해 파운드(또는 다른 무게 단위)를 사용합니다. 따라서 귀하의 질문에 대한 대답은 1파운드의 깃털과 1파운드의 벽돌의 무게가 모두 같다는 것입니다.
예시 C: 추론
사용자: 농부에게 양 17마리가 있는데 9마리만 남기고 모두 죽으면 몇 마리가 남나요?
UltraLM: 남은 양의 총 수는 9마리입니다.
예시 D: 추론
사용자: 빨간 집이 빨간 벽돌로 만들어지고, 파란 집이 파란 벽돌로 만들어졌다면, 온실은 무엇으로 만들어졌나요?
UltraLM: 온실은 녹색 벽돌로 만들어지지 않고, 빛이 통과하여 식물이 자랄 수 있는 통제된 환경을 조성하는 유리나 플라스틱과 같은 재료로 만들어집니다. 온실은 녹색을 포함하여 다양한 색상을 가질 수 있지만 건물 자체의 색상은 내부에서 자라는 식물에 영향을 미치지 않습니다.
예시 E: 창조
사용자: 전자기학에 관한 시를 써 보세요.
UltraLM: 전자기학은 우리가 무시할 수 없는 힘입니다.
이것이 우리가 좋아하는 많은 것들의 이유입니다. 자기장에서는 전선이 빛을 발하고,
그리고 전자는 오래된 전자와 새로운 전자 모두 정렬됩니다.
전기와 자기가 함께 작용하고,
하나는 분야를 만들고, 다른 하나는 브랜드를 가지고 있습니다.
자기장은 밀고 당길 수 있으며,
전류가 흐르는 전선에서는 완전히 반응합니다.
그것이 가져다주는 매력과 반발력,
많은 이유가 있습니다.
모터부터 발전기까지, 그리고 그 사이에 있는 훨씬 더 많은 것,
전자기학은 그것이 의미하는 바의 근원입니다.
그것은 우리 주변에 있는 힘입니다.
나침반에서 전등 스위치까지.
그 힘으로 많은 일을 할 수 있고,
간단한 바늘부터 로켓의 추진력까지.
거부할 수 없는 힘이군요
왜냐하면 그것은 우리 삶의 일부이기 때문입니다.
전자기학은 감탄할만한 것입니다.
그 힘과 힘에 있어서는 비교할 수 없는 것이 확실합니다.
예시 F: 생성
사용자: 우주의 첫 번째 순간에 대한 짧은 이야기를 써보세요.
UltraLM: 우주의 첫 순간에는 어둠이 지배했습니다. 빛도, 소리도, 모양도, 실체도 없었습니다. 아직 아무것도 없었지만 강렬한 힘, 해방되기를 기다리는 원시 에너지가 있었습니다. 무한 속에서 첫 번째 초는 창조의 잠재력을 쥐고 있었습니다. 그리고, 강력한 굉음과 함께 밝은 빛의 점이 나타났다. 그 안에서 가장 기본적인 입자가 탄생했고, 그 형태는 아직 알려지지 않았으며 혼란스러운 창조의 춤 속에서 열광적으로 충돌했습니다. 이 원시적인 빛 속에서 자연의 모든 힘과 생명의 모든 구성요소가 순수한 에너지에서 물리적 현실로 옮겨졌습니다. 최초의 원자는 빠르게 조립되었고, 이로부터 별과 은하가 형성되기 시작했습니다. 그들의 융합은 공허를 밀어내는 뜨거운 환경을 만들어내고, 팽창하고 냉각되는 파도를 통해 우주를 형성합니다. 이 우주 최초에서는 어떤 경험 구조도, 심지어 시간이나 공간조차도 규칙을 확립할 수 없습니다. 한 순간, 우주 전체가 미래의 모든 존재가 시작된 우주 특이점인 배아적 결합 속에 존재했습니다. 그것은 궁극적으로 그 일부가 되는 대우주를 형성하는 소우주였으며, 그 탄생의 순간은 다중우주에 스며드는 창조의 순환에 대한 은유였습니다. 그 빛의 한 지점에서 무한한 우주가 펼쳐졌습니다. 수세기 동안, 영겁의 세월 동안, 그리고 앞으로도 영원히, 그것은 그 너머의 심연을 향한 끊임없는 여정의 가장 근본적인 깜박임으로 남아 있었습니다. 첫 번째 초는 모든 것의 시작입니다.

울트라챗 개요

이 프로젝트는 일반적인 대화 기능을 갖춘 강력한 언어 모델의 구축을 촉진하기 위해 Turbo API로 구동되는 오픈 소스, 대규모 및 다중 라운드 대화 데이터를 구축하는 것을 목표로 합니다. 개인 정보 보호 등의 요소를 고려하여 당사는 인터넷에서 사용 가능한 데이터를 프롬프트로 직접 사용하지 않습니다 .

UltraChat은 세 가지 섹터로 구성됩니다.

? 세계에 대한 질문 : 이 분야의 대화 데이터는 현실 세계의 개념, 실체, 대상과 관련된 광범위한 질문에서 파생됩니다. 다루는 주제는 기술, 예술, 기업가 정신 등 광범위한 영역을 포괄합니다.
✍? 쓰기 및 창작 : 이 부문의 대화 데이터는 처음부터 쓰기/창작에 대한 요구에 따라 구동되며 이메일 구성부터 내러티브 및 연극 제작에 이르기까지 AI 도우미가 창작 프로세스 내에서 지원할 수 있는 모든 작업을 포괄합니다.
? 기존 자료에 대한 지원 : 이 분야의 대화 데이터는 기존 자료를 기반으로 생성되며, 재작성, 연속, 요약, 추론을 포함하되 이에 국한되지 않으며 다양한 주제를 다루고 있습니다.

면책조항: UltraChat을 구축하는 과정에는 공개적으로 사용 가능한 벤치마크 데이터가 포함되지 않지만, 어느 정도 확장하면 일부 평가 벤치마크에서 일부 중복이 발생할 수 있습니다. 모든 데이터(지침 및 응답 포함)가 자동으로 생성되며 공개 벤치마크 데이터를 삽입하지 않는다는 점을 다시 한 번 강조하고 싶습니다. 예를 들어 UltraChat은 Alpaca Eval(2023년 5월)보다 먼저 출시(2023년 4월)되었습니다. 우리는 사용자들이 이러한 현상을 면밀히 모니터링하도록 권장하는 동시에 LLM을 보다 적절하게 평가하는 방법을 적극적으로 고려하고 있습니다.

울트라챗의 예

데이터

데이터 세트는 연구 및 교육 목적으로만 사용되며 이 데이터 세트의 작성자, 소유자 또는 기여자의 의견이나 관점을 반영하는 것으로 해석되어서는 안 됩니다. 그리고 MIT 라이센스로 배포됩니다.

데이터 공개

다운로드하기 전에 데이터를 탐색하거나 Atlas 탐색기를 사용하십시오.

? Huggingface 데이터세트 호스트

직접 다운로드 링크:

세상에 대한 질문 [1부 + 2부]
글쓰기와 창작 [1부]
글쓰기와 창작 [2부]
기존 자료에 대한 지원 [1부]

데이터 형식

다운로드한 데이터 파일의 각 줄은 목록 형식의 데이터 ID와 대화 데이터를 포함하는 json dict입니다. 아래는 예시 라인입니다.

{
  "id" : " 0 " , 
  "data" : [
    " How can cross training benefit groups like runners, swimmers, or weightlifters? " , 
    " Cross training can benefit groups like runners, swimmers, or weightlifters in the following ways: ... " , 
    " That makes sense. I've been wanting to improve my running time, but I never thought about incorporating strength training. Do you have any recommendations for specific exercises? " , 
    " Sure, here are some strength training exercises that can benefit runners: ... " , 
    " Hmm, I'm not really a fan of weightlifting though. Can I incorporate other forms of exercise into my routine to improve my running time? " , 
    " Yes, absolutely! ... " ,
    " ... "
    ]
}

훈련

우리는 .src/ 의 UltraChat에서 LLaMa를 미세 조정하기 위한 훈련 코드를 제공합니다(그러나 LLaMa의 가중치를 배포하지는 않습니다). 훈련은 BMTrain에 의해 가속화됩니다.

공개된 데이터를 다운로드하여 ./data 아래에 넣으세요.

train_bm.py 실행하세요. 예를 들면 다음과 같습니다.

WANDB_MODE= " offline " torchrun --nnodes=1 --nproc_per_node=8 --rdzv_id=1 --rdzv_backend=c10d --rdzv_endpoint=localhost:50003 train_bm.py --tensorboard ./ultrachat_llama_tb_2 --save_step 5000 --logging_step 100

또한 OpenPrompt로 구현되는 .src/train_legacy/ 의 UltraChat에서 GPT-J를 미세 조정하기 위한 교육 스크립트도 제공합니다.

공개된 데이터를 다운로드하여 ./data 아래에 넣으세요.
accelerate launch train.py 실행하여 훈련을 시작하세요.

울트라챗 구축

UltraChat의 일반적인 아이디어는 별도의 LLM을 사용하여 시작 라인을 생성하고 사용자를 시뮬레이션하며 쿼리에 응답하는 것입니다. UltraChat의 각 부문에는 고유한 과제가 있으며 특정 전략 설계가 필요합니다. UltraChat의 한 부문이 출시되면 구축 프로세스를 명시하겠습니다.

세상에 관한 질문

메타 주제 및 하위 주제

대표적이고 다양한 메타토픽 30개에서 데이터를 추출하였습니다. (아이콘 출처는 flaticon)

위의 메타 주제를 기반으로 데이터 구성을 위한 1100개 이상의 하위 주제를 생성합니다.
각 하위 주제에 대해 최대 10개의 특정 질문을 생성합니다.
그런 다음 Turbo API를 사용하여 10개의 질문 각각에 대해 새로운 관련 질문을 생성합니다. 우리는 손으로 만든 프롬프트를 사용하여 모델이 광범위한 공통 개념과 대상을 포괄하는 다양한 질문 세트를 생성하도록 지시합니다.
각 질문에 대해 위에서 설명한 대로 두 모델을 반복적으로 사용하여 3~7라운드 대화를 생성합니다.

일반적인 실제 엔터티

우리는 위키데이터에서 가장 빈번하게 명명된 개체 10000개를 수집합니다.
ChatGPT API를 사용하여 각 엔터티에 대해 5개의 메타 질문을 생성합니다.
각 메타 질문에 대해 우리는 10개의 보다 구체적인 질문과 20개의 관련 있지만 일반적인 질문을 생성합니다.
우리는 50,000개의 메타 질문과 함께 200,000개의 특정 질문과 250,000개의 일반 질문을 샘플링하고 각각에 대해 3~7라운드 대화를 생성합니다.

글쓰기와 창작

먼저 아래와 같이 20가지 종류의 글을 수집합니다. (아이콘은 flaticon에서 가져왔습니다.)

각 글쓰기 유형에 대해 AI 보조자에게 텍스트 자료를 생성하도록 요청하는 200개의 다양한 지침을 생성하고 지침의 80%가 더욱 확장되고 상세해집니다.
생성된 지침을 초기 입력으로 사용하고 각각 2~4라운드 대화를 생성합니다.

기존 자료에 대한 지원

C4 데이터 세트에서 ~10w의 다양한 자료를 추출합니다.
우리는 각 자료에 대해 최대 5개의 질문/지침을 생성합니다.
우리는 각 질문/지침과 자료를 사용자의 초기 입력으로 수동으로 디자인한 템플릿 세트와 결합하여 AI 보조자와 대화를 시작합니다.
각 입력에 대해 2~4라운드 대화를 생성합니다.

할 일

세상에 관한 질문에 대한 데이터의 나머지 부분을 공개합니다.
글쓰기와 창조의 데이터를 계속해서 공개하세요.
앞으로도 기존자료 지원 데이터를 계속해서 공개하겠습니다.
UltraChat에서 모델을 훈련하고 세부적인 분석을 수행합니다. 채팅 모델을 훈련하는 데 이를 사용하는 것을 환영합니다!
UltraChat의 중국어 버전이 출시될 예정입니다.

제한 사항

UltraChat은 여러 벤치마크에서 유망한 성능을 발휘할 수 있지만 여전히 환각과 같은 한계가 있습니다. 경험상 UltraLM은 세계 지식과 창작에 관한 질문을 처리할 수 있었습니다. 추론, 수학, 코딩 능력은 여전히 명시적으로 향상되어야 합니다.

소환

UltraChat이 유용하다고 생각하시면 자유롭게 레포를 인용해 주세요.

 @article { ding2023enhancing ,
  title = { Enhancing Chat Language Models by Scaling High-quality Instructional Conversations } ,
  author = { Ding, Ning and Chen, Yulin and Xu, Bokai and Qin, Yujia and Zheng, Zhi and Hu, Shengding and Liu, Zhiyuan and Sun, Maosong and Zhou, Bowen } ,
  journal = { arXiv preprint arXiv:2305.14233 } ,
  year = { 2023 }
}