يحتوي هذا المستودع على التعليمات البرمجية والموارد اللازمة لبناء نموذج للتعلم الآلي يمكنه التمييز بين النص الذي كتبه البشر والنص الذي تم إنشاؤه بواسطة ChatGPT أو نموذج الذكاء الاصطناعي المماثل. سيرشدك ملف README هذا خلال عملية إعداد النموذج وتشغيله.
قبل البدء، تأكد من تثبيت ما يلي على نظامك:
يمكنك تثبيت مكتبات بايثون باستخدام pip
:
pip install scikit-learn pandas numpy
استنساخ المستودع: ابدأ باستنساخ هذا المستودع على جهازك المحلي:
git clone https://github.com/your-username/chatgpt-human-detection.git
cd chatgpt-human-detection
إعداد البيانات: قم بإعداد مجموعة البيانات الخاصة بك التي تحتوي على نص مكتوب بواسطة الإنسان ونص تم إنشاؤه بواسطة ChatGPT. تأكد من أن البيانات منظمة بشكل جيد ومُصنفة بشكل مناسب (على سبيل المثال، "إنسان" و"chatgpt").
المعالجة المسبقة للبيانات: استخدم Jupyter Notebook أو بيئة Python المفضلة لديك للمعالجة المسبقة للبيانات. قد تحتاج إلى ترميز مجموعة البيانات وتوجيهها وتقسيمها إلى مجموعات تدريب واختبار.
بناء النموذج: قم ببناء نموذج التعلم الآلي الخاص بك وتدريبه. يمكنك استكشاف خوارزميات مختلفة مثل الانحدار اللوجستي أو أجهزة ناقل الدعم أو الشبكات العصبية. راجع الكود والوثائق المقدمة للحصول على إرشادات.
تقييم النموذج: قم بتقييم أداء النموذج باستخدام مقاييس مثل الدقة والدقة والاستدعاء ودرجة F1. صقل النموذج إذا لزم الأمر لتحقيق الدقة المطلوبة.
بمجرد إنشاء النموذج الخاص بك وتدريبه، يمكنك استخدامه لتصنيف النص إما مكتوبًا بواسطة الإنسان أو تم إنشاؤه بواسطة ChatGPT. فيما يلي كيفية عمل تنبؤات باستخدام النموذج الخاص بك:
# Load your trained model (replace 'model_file.pkl' with your model file)
import pickle
model = pickle . load ( open ( 'model_file.pkl' , 'rb' ))
# Use the model to classify text
text_to_classify = "This is a test sentence."
prediction = model . predict ([ text_to_classify ])
if prediction [ 0 ] == 'human' :
print ( "The text is likely human-written." )
else :
print ( "The text is likely generated by ChatGPT." )
هذا المشروع مرخص بموجب ترخيص MIT - راجع ملف الترخيص للحصول على التفاصيل.