https://datadreamer.dev
اِسْتَدْعَى. توليد البيانات الاصطناعية. النماذج قطار ومواءمة.
DataDreamer هي مكتبة Python قوية مفتوحة المصدر للدعم وتوليد البيانات الاصطناعية وسير العمل التدريبي. إنه مصمم ليكون بسيطًا وفعالًا للغاية وتجهيزًا للبحث.
تثبيت pip3 install datadreamer.dev | |
demo.py | نتيجة demo.py |
---|---|
انظر البرنامج النصي التجريبي الكامل | انظر مجموعة البيانات الاصطناعية والنموذج المدرب |
لمزيد من المظاهرات والوصفات ، انظر صفحة الجولة السريعة. |
مع DataDreamer يمكنك:
DataDreamer هو:
يرجى الاستشهاد بورقة DataDreamer:
@misc { patel2024datadreamer ,
title = { DataDreamer: A Tool for Synthetic Data Generation and Reproducible LLM Workflows } ,
author = { Ajay Patel and Colin Raffel and Chris Callison-Burch } ,
year = { 2024 } ,
eprint = { 2402.10379 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CL }
}
يرجى التواصل معنا عبر البريد الإلكتروني ([email protected]) أو على Discord إذا كان لديك أي أسئلة أو تعليقات أو تعليقات.
حقوق الطبع والنشر © 2024 ، Ajay Patel. صدر تحت رخصة معهد ماساتشوستس للتكنولوجيا.
شكرًا لك على المشرفين في Hugging Face و Litellm لقبول المساهمات اللازمة لـ DataDreamer وتوفير الدعم المنبع.
ODNI ، IARPA: يتم دعم هذا البحث جزئيًا من قبل مكتب مدير الاستخبارات الوطنية (ODNI) ، نشاط مشاريع الأبحاث المتقدمة الاستخباراتية (IARPA) ، عبر عقد برنامج HIATUS #2022-2207200005. الآراء والاستنتاجات الواردة هنا هي آراء المؤلفين ويجب عدم تفسيرها على أنها تمثل بالضرورة السياسات الرسمية ، إما المعبر عنها أو الضمني ، من Odni أو IARPA أو الحكومة الأمريكية. تُسمح للحكومة الأمريكية بإعادة إنتاج وتوزيع إعادة طباعة لأغراض حكومية على الرغم من أي شرح لحقوق الطبع والنشر فيه.