Repositori ini berisi kode dan sumber daya untuk membangun model pembelajaran mesin yang dapat membedakan antara teks yang ditulis oleh manusia dan teks yang dihasilkan oleh ChatGPT atau model AI serupa. File README ini akan memandu Anda melalui proses pengaturan dan menjalankan model.
Sebelum memulai, pastikan Anda telah menginstal yang berikut ini di sistem Anda:
Anda dapat menginstal perpustakaan Python menggunakan pip
:
pip install scikit-learn pandas numpy
Mengkloning Repositori: Mulailah dengan mengkloning repositori ini ke mesin lokal Anda:
git clone https://github.com/your-username/chatgpt-human-detection.git
cd chatgpt-human-detection
Persiapan Data: Siapkan kumpulan data Anda yang berisi teks yang ditulis manusia dan teks yang dibuat oleh ChatGPT. Pastikan data terstruktur dengan baik dan diberi label dengan tepat (misalnya, 'manusia' dan 'obrolan').
Pemrosesan Awal Data: Gunakan Notebook Jupyter atau lingkungan Python pilihan Anda untuk memproses data terlebih dahulu. Anda mungkin perlu melakukan tokenisasi, vektorisasi, dan membagi kumpulan data menjadi kumpulan pelatihan dan pengujian.
Pembuatan Model: Bangun dan latih model pembelajaran mesin Anda. Anda dapat menjelajahi berbagai algoritme seperti regresi logistik, mesin vektor dukungan, atau jaringan saraf. Lihat kode dan dokumentasi yang disediakan untuk panduan.
Evaluasi Model: Evaluasi performa model menggunakan metrik seperti akurasi, presisi, perolehan, dan skor F1. Sempurnakan model jika perlu untuk mencapai akurasi yang diinginkan.
Setelah Anda membuat dan melatih model, Anda dapat menggunakannya untuk mengklasifikasikan teks sebagai teks yang ditulis manusia atau dibuat oleh ChatGPT. Berikut cara membuat prediksi dengan model Anda:
# Load your trained model (replace 'model_file.pkl' with your model file)
import pickle
model = pickle . load ( open ( 'model_file.pkl' , 'rb' ))
# Use the model to classify text
text_to_classify = "This is a test sentence."
prediction = model . predict ([ text_to_classify ])
if prediction [ 0 ] == 'human' :
print ( "The text is likely human-written." )
else :
print ( "The text is likely generated by ChatGPT." )
Proyek ini dilisensikan di bawah Lisensi MIT - lihat file LISENSI untuk detailnya.