MD Zobaer Hossain, Linfei Zhang, Robert Van Timmeren dan Ramon Meffert, Juni 2022
Repositori ini berisi kode sumber untuk percobaan, pemrosesan data, dan analisis data yang dilakukan sebagai bagian dari proyek kursus kami untuk kursus proyek Teknologi Bahasa edisi 2021-2022 di University of Groningen.
Semua file yang terkait dengan dataset terletak di folder Dataset. Kami telah mengambil file dataset asli dan mengubahnya menjadi format Huggingface Dataset. Semua folder dataset berisi file dataset asli, notebook analisis dan file demo yang menunjukkan bagaimana Anda menggunakan dataset.
Semua kode untuk percobaan terletak di folder Eksperimen. Informasi tentang cara mereproduksi percobaan tersedia di readme di folder itu.
Hasil untuk semua metode dapat ditemukan di folder hasil. Informasi tentang hasilnya tersedia di readme di folder itu.
Black, S., G. Leo, P. Wang, C. Leahy, dan S. Biderman (2021, Maret). GPT-NEO: Pemodelan bahasa autoregresif skala besar dengan mesh-tensorflow. https://doi.org/105281/zenodo.5297715.
Devlin, J., M.-W. Chang, K. Lee, dan K. Toutanova (2019, Juni). Bert: Pra-pelatihan transformator dua arah yang mendalam untuk pemahaman bahasa. Dalam Prosiding Konferensi 2019 Bab Amerika Utara dari Asosiasi Linguistik Komputasi: Teknologi Bahasa Manusia, Volume 1 (Makalah Panjang dan Pendek) , Minneapolis, Minnesota, hlm. 4171-4186. Asosiasi Linguistik Komputasi.
Gao, T., A. Fisch, dan D. Chen (2021, Agustus). Membuat model bahasa pra-terlatih lebih baik beberapa pelajar shot. Dalam Prosiding Pertemuan Tahunan ke -59 Asosiasi Linguistik Komputasi dan Konferensi Gabungan Internasional ke -11 tentang Pemrosesan Bahasa Alami (Volume 1: Long Papers) , Online, hlm. 3816–3830. Asosiasi Linguistik Komputasi.
Liu, Y., M. Ott, N. Goyal, J. Du, M. Joshi, D. Chen, O. Levy, M. Lewis, L. Zettlemoyer, dan V. Stoyanov (2019). Roberta: Pendekatan pretraining Bert yang dioptimalkan dengan kuat. CORR ABS/1907.11692 .
Park, J., & Cardie, C. (2014). Mengidentifikasi dukungan yang tepat untuk proposisi dalam komentar pengguna online. Prosiding Lokakarya Pertama tentang Penambangan Argumentasi , 29–38. https://doi.org/10/gg29gq
Schick, T. dan H. Schütze (2021). Mengeksploitasi pertanyaan cloze untuk klasifikasi teks beberapa shot dan inferensi bahasa alami. Dalam Prosiding Konferensi ke -16 Bab Eropa Asosiasi Linguistik Komputasi: Volume Utama , Online, hlm. 255–269. Asosiasi Linguistik Komputasi.