https://datadreamer.dev
즉각적인. 합성 데이터를 생성합니다. 훈련 및 정렬 모델.
DatadReamer는 프롬프트, 합성 데이터 생성 및 교육 워크 플로우를위한 강력한 오픈 소스 파이썬 라이브러리입니다. 단순하고 매우 효율적이며 연구 등급으로 설계되었습니다.
설치 pip3 install datadreamer.dev | |
demo.py | demo.py 의 결과 |
---|---|
전체 데모 스크립트를 참조하십시오 | 합성 데이터 세트와 훈련 된 모델을 참조하십시오 |
더 많은 시연과 레시피는 빠른 투어 페이지를 참조하십시오. |
DatadReamer를 사용하면 다음을 수행 할 수 있습니다.
DatadReamer는 다음과 같습니다.
DatadReamer 논문을 인용하십시오.
@misc { patel2024datadreamer ,
title = { DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows } ,
author = { Ajay Patel and Colin Raffel and Chris Callison-Burch } ,
year = { 2024 } ,
eprint = { 2402.10379 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}
질문, 의견 또는 피드백이 있으시면 이메일 ([email protected]) 또는 discord를 통해 연락하십시오.
Copyright © 2024, Ajay Patel. MIT 라이센스에 따라 릴리스.
DatadReamer에 필요한 기부금을 수락하고 업스트림 지원을 제공해 주신 Hugging Face 및 Litellm의 관리자에게 감사합니다.
ODNI, IARPA : 이 연구는 Hiatus Program Contract #2022-22072200005를 통해 Intelligence Advanced Research Project Projects Activity (IARPA)의 National Intelligence (ODNI) 사무소에 의해 부분적으로 지원됩니다. 여기에 포함 된 견해와 결론은 저자의 견해와 결론이며, ODNI, IARPA 또는 미국 정부의 표현 또는 묵시적 정책을 반드시 표현하는 것으로 해석되어서는 안됩니다. 미국 정부는 저작권 주석에도 불구하고 정부 목적으로 재판을 재생산하고 배포 할 수있는 권한이 있습니다.