Gudang ini bertujuan untuk mengumpulkan kemajuan penelitian terkini ICLR khususnya di bidang LLM yang melibatkan semua bidang di bidang NLP. Proyek ini akan diperbarui dari waktu ke waktu dalam waktu yang lama.
Selamat menonton dan garpu! Tapi akan lebih baik jika diberi bintang❤️.
Alamat Zhihu: ShuYini
Akun publik WeChat: AINLPer ( diperbarui setiap hari, selamat datang untuk mengikuti )
1. Peningkatan Pemikiran: Pemecahan Masalah Coba-coba dengan Model Bahasa Besar
2. TabR: Pembelajaran Mendalam Tabular Bertemu Tetangga Terdekat
3. Juri Generatif untuk Mengevaluasi Keselarasan
4. Apa yang Membuat Data Bagus untuk Penyelarasan? Studi Komprehensif tentang Pemilihan Data Otomatis dalam Penyelarasan Instruksi
5. Adaptasi Waktu Uji terhadap Bias Keandalan Multimodal
6. Pelurusan Ukuran Langkah Optimal Bellman dari Model Pencocokan Aliran
7. Tentang Kemampuan Belajar Tanda Air untuk Model Bahasa
8. Meningkatkan Kinerja Ekor dalam Pengklasifikasi Ekstrim dengan Pengurangan Varians Label
9. Apakah Ini Subruang yang Anda Cari? Sebuah Ilusi Interpretabilitas untuk Patch Aktivasi Subruang
10. Tantangan Jailbreak Multibahasa dalam Model Bahasa Besar
11. Memikirkan Kembali Kekuatan Kanonisasi Grafik dalam Pembelajaran Representasi Grafik dengan Stabilitas
12. AnomalyCLIP: Pembelajaran Cepat Objek-agnostik untuk Deteksi Anomali Zero-shot
13. Menuju Penjelasan yang Setia: Meningkatkan Rasionalisasi dengan Penemuan Jalan Pintas
14. JAGUNG: Representasi Objek Berbasis Kontak untuk Manipulasi Objek Umum Tak Terlihat yang Tidak Dapat Dipahami
15. TESTAM: Model Perhatian Spatio-Temporal yang Ditingkatkan Waktu dengan Campuran Para Ahli
16.Jaringan Parsing Grafik
17. KoLA: Dengan Hati-hati Membandingkan Pengetahuan Dunia tentang Model Bahasa Besar
18. LUM-ViT: Transformator Visi Masker Under-sampling yang Dapat Dipelajari untuk Akuisisi Sinyal Optik Terbatas Bandwidth
19. Transgerak Sosial: Prediksi Lintasan Manusia yang Dapat Diminta
20. Klasifikasi Kuat melalui Regresi untuk Pembelajaran dengan Label Bising
21. Mengirimkan Pesan Partisi untuk Deteksi Penipuan Grafik
22. Halusinasi Model Bahasa Besar yang Bertentangan Sendiri: Evaluasi, Deteksi dan Mitigasi
23. Autoencoder dalam konteks untuk Kompresi Konteks dalam Model Bahasa Besar
24. DDMI: Model Difusi Laten Domain-agnostik untuk Mensintesis Representasi Neural Implisit Berkualitas Tinggi
25. Memikirkan Kembali Ketergantungan Saluran untuk Peramalan Rangkaian Waktu Multivariat: Belajar dari Indikator Utama
26. Mengurangi Halusinasi dalam Model Multi-Modal Besar melalui Penyetelan Instruksi yang Kuat
27. RingAttention dengan Blockwise Transformers untuk Konteks Hampir Tak Terbatas
28. Chain of Hindsight menyelaraskan Model Bahasa dengan Umpan Balik
29. Mendiagnosis Transformer: Menerangi Ruang Fitur untuk Pengambilan Keputusan Klinis
30. Mengatasi Hilangnya Plastisitas dan Bencana Lupa dalam Pembelajaran Berkelanjutan
31. RepoBench: Membandingkan Sistem Penyelesaian Otomatis Kode Tingkat Repositori
32. Mencari Nuggets Neural: Transfer Pengetahuan dalam Model Bahasa Besar dari Perspektif Parametrik
33. Memanfaatkan Penjelasan: Interpreter LLM-ke-LM untuk Pembelajaran Representasi Grafik Atribut Teks yang Ditingkatkan
34. Pembelajaran Dalam Konteks melalui Prisma Bayesian
35. Metode Spektral Neural: Pembelajaran dengan pengawasan mandiri dalam domain spektral
36. SuRe: Meringkas Pengambilan menggunakan Kandidat Jawaban untuk QA Domain Terbuka LLM
37. Kosmos-G: Menghasilkan Gambar dalam Konteks dengan Model Bahasa Besar Multimodal
38. Rantai Pengetahuan: Mendasarkan Model Bahasa Besar melalui Pengetahuan Dinamis yang Beradaptasi pada Sumber Heterogen
39. LitCab: Kalibrasi Model Bahasa Ringan pada Respons Bentuk Pendek dan Panjang
40. Evaluasi Model Otomatis Berbasis Energi
41. SKILL-MIX: Kelompok Evaluasi yang Fleksibel dan Dapat Diperluas untuk Model AI
42. ArchLock: Mengunci Transferabilitas DNN pada Tingkat Arsitektur dengan Prediktor Biner Tanpa Biaya
43. Debugging Data dengan Pentingnya Shapley pada Pipeline Machine Learning
44. RECOMP: Meningkatkan LM Retrieval-Augmented dengan Kompresi Konteks dan Augmentasi Selektif
45. Gen-Z: Klasifikasi Teks Zero-Shot Generatif dengan Deskripsi Label Kontekstual
46. Dikotomi Bias Implisit Fase Awal dan Akhir Terbukti Dapat Mendorong Grokking
47. PromptAgent: Perencanaan Strategis dengan Model Bahasa Memungkinkan Optimasi Prompt Tingkat Pakar
48. Bias Mendalam: Bias Penalaran Implisit dalam LLM yang Ditugaskan Persona
49. Mendorong Batasan: Pengaruh Mixup pada Keruntuhan Neural
50. Transformator Grafik pada EHR: Representasi yang Lebih Baik Meningkatkan Kinerja Hilir
51. Klasifikasi Gambar Hiperspektral Berbasis Grafik Sadar Ketidakpastian
52. Tentang Skalabilitas dan Efisiensi Memori Program Semidefinite untuk Estimasi Konstan Lipschitz Jaringan Syaraf Tiruan
53. Apakah Keluarga Bert Pengikut Instruksi yang Baik? Sebuah Studi tentang Potensi dan Keterbatasan Mereka
54. UNR-Explainer: Penjelasan Kontrafaktual untuk Model Pembelajaran Representasi Node Tanpa Pengawasan
55. Menjelajahi Janji dan Batasan Pembelajaran Berulang Waktu Nyata
56. Mesin Rekursif Neural-Simbolik untuk Generalisasi Sistematis
57. Grafik Pemandangan Davidsonian: Meningkatkan Keandalan dalam Evaluasi Mendetail untuk Pembuatan Teks-ke-Gambar
58. Apakah Model Bias pada Teks tanpa Bahasa yang Terkait Gender?
59. PlaSma: Model Pengetahuan Prosedural untuk Perencanaan dan Perencanaan Ulang Berbasis Bahasa
60. Menuju Model Dasar Pembelajaran Molekuler pada Kumpulan Data Multi-Tugas Skala Besar
61. Transformer-VQ: Transformer Waktu Linier melalui Kuantisasi Vektor
62. Model Difusi Pelatihan dengan Reinforcement Learning
63. Modulasi Efisien untuk Jaringan Visi
64. Pra-pelatihan Detektor Objek 3D berbasis LiDAR melalui Pewarnaan
65. Emulator untuk Menyempurnakan Model Bahasa Besar menggunakan Model Bahasa Kecil
66. Detektor Model Bahasa Mudah Dioptimalkan
67. Manipulasi Robot Zero-Shot dengan Model Difusi Pengeditan Gambar Terlatih
68. GAFormer: Meningkatkan Transformator Rangkaian Waktu Melalui Penyematan Sadar Grup
69. Penurunan Gradien Stokastik untuk Proses Gaussian Dilakukan dengan Benar
70. Menyempurnakan Model Bahasa untuk Faktualitas
71. Kernel CNN Bisa Menjadi Shapelet Terbaik
72. Mengungkap Misteri Serangan Pintu Belakang Keracunan dari Perspektif Statistik
73. Pembelajaran Maju Jaringan Syaraf Tiruan Grafik
74. Apakah kinerja generalisasi CLIP terutama berasal dari kesamaan pengujian kereta yang tinggi?
75. Optimasi Preferensi Grup: Penyelarasan Sedikit Model Bahasa Besar
76. L2MAC: Komputer Otomatis Model Bahasa Besar untuk Pembuatan Kode Ekstensif
77. Llemma: Model Bahasa Terbuka untuk Matematika
78. Optimasi Kebijakan Berbasis Pencarian Pohon dalam Penundaan Eksekusi Stochastic
79. Melampaui Akurasi: Mengevaluasi Konsistensi Diri Model Bahasa Kode Besar dengan IdentityChain
80. Pembelajaran Meta Sadar Konteks
81. Efektivitas Lupa Acak untuk Generalisasi yang Kuat
82. VCR-Graphormer: Transformator Grafik Mini-batch melalui Koneksi Virtual
83. Dekomposisi Grup Lie untuk Jaringan Syaraf Ekuivalen
84. DRSM: Pemulusan De-Acak pada Pengklasifikasi Malware Memberikan Kekokohan Bersertifikat
85. Ke Grok atau tidak ke Grok: Mengurai Generalisasi dan Penghafalan Kumpulan Data Algoritma yang Rusak
86. Tentang Varians Pelatihan Jaringan Neural sehubungan dengan Set Pengujian dan Distribusi
87. GNNBoundary: Menuju Penjelasan Jaringan Syaraf Tiruan Grafik melalui Lensa Batasan Keputusan
88. Menuju Penerjemahan Domain Tanpa Pengawasan yang Dapat Diidentifikasi: Pendekatan Pencocokan Distribusi yang Diversifikasi
89. SineNet: Mempelajari Dinamika Temporal dalam Persamaan Diferensial Parsial Bergantung Waktu
90.Dapatkah Model Bahasa Besar Menyimpulkan Penyebab dari Korelasi?
91. Perspektif Variasi dalam Pemecahan Masalah Invers dengan Model Difusi
92. Konektivitas mode linier berlapis
93. NEFTune: Embedding yang Berisik Meningkatkan Penyempurnaan Instruksi
94. MoE Jarang dengan Perutean Berpanduan Bahasa untuk Terjemahan Mesin Multibahasa
95. REFACTOR: Belajar Mengekstraksi Teorema dari Pembuktian
96. Mendeteksi Data Prapelatihan dari Model Bahasa Besar
97. Jangan Percaya: Verifikasi - Membumikan Penalaran Kuantitatif LLM dengan Autoformalisasi
98. PubDef: Bertahan Terhadap Serangan Transfer Dari Model Publik
99. AutomaTikZ: Sintesis Grafik Vektor Ilmiah yang Dipandu Teks dengan TikZ
100.Dapatkah Misinformasi yang Dihasilkan LLM Dideteksi?
101. Transformator Sederhana yang Dapat Ditafsirkan untuk Klasifikasi dan Analisis Gambar Berbutir Halus
102. Menguraikan Representasi Rangkaian Waktu melalui Independensi Dukungan Kontrasif pada Inferensi Variasi-l
103. Pembelajaran Preferensi Distribusi: Pemahaman dan Akuntansi Konteks Tersembunyi di RLHF
104. Eureka: Desain Penghargaan Tingkat Manusia melalui Pengkodean Model Bahasa Besar
105. Prediksi Fitur 3D untuk Pretraining Point Cloud Berbasis Masked-AutoEncoder
106. Memahami Bencana Lupa dalam Model Bahasa melalui Inferensi Implisit
107. Belajar dari Proporsi Label: Bootstrapping Pembelajar yang Diawasi melalui Penyebaran Keyakinan
108. Apa yang Membuat Pemangkasan Tidak Terstruktur Maksimal untuk Kemiripan Kosinus Maksimal
109. Meningkatkan Pembelajar Kedokteran Kecil dengan Anjuran Kontekstual yang Menjaga Privasi
110. Vocos: Menutup kesenjangan antara domain waktu dan vocoder saraf berbasis Fourier untuk sintesis audio berkualitas tinggi
111. Keterlambatan Pembelajaran dalam Jaringan Neural Spiking menggunakan Konvolusi Dilatasi dengan Jarak yang Dapat Dipelajari
112. Kutukan Pembalikan: LLM yang dilatih tentang “A adalah B” gagal mempelajari “B adalah A”
113. AutoDAN: Menghasilkan Perintah Jailbreak Tersembunyi pada Model Bahasa Besar yang Selaras
114. MixSATGEN: Pembelajaran Pencampuran Grafik untuk Pembuatan Instans SAT
115. PROGRAM: Pembelajaran Pseudo-Label berbasis Model GRAFIK PROtotipe untuk Adaptasi Waktu Tes
116. Rahasia Pintu Belakang Terungkap: Mengidentifikasi Data Pintu Belakang dengan Konsistensi Prediksi Berskala yang Dioptimalkan
117. Model Lintasan Konsistensi: Aliran Probabilitas Pembelajaran ODE Lintasan Difusi
118. Deep SE(3)-Penalaran Geometris Ekuivalen untuk Tugas Penempatan yang Tepat
119. Penggabungan Konteks Hirarki: Pemahaman Konteks Panjang yang Lebih Baik untuk LLM Pra-terlatih
120. ViLMA: Tolok Ukur Zero-Shot untuk Landasan Linguistik dan Temporal dalam Model Bahasa Video
121. Difusi dalam Difusi: Difusi Satu Arah Siklik untuk Generasi Berkondisi Visi-Teks
122. Membatasi Kekokohan yang Diharapkan dari Jaringan Neural Grafik yang Terkena Serangan Fitur Node
123. Model Skor untuk Pembelajaran Penguatan Bersyarat Sasaran Offline
124. USB-NeRF: Membuka Gulungan Bidang Cahaya Syaraf yang Disesuaikan
125. Melampaui Peniruan: Memanfaatkan Sinyal Kualitas Terperinci untuk Penyelarasan
126. Pengkodean Prediktif Perbedaan Kontrastif
127. MCM: Pemodelan Sel Tersamar untuk Deteksi Anomali pada Data Tabular
128. HiGen: Jaringan Generatif Grafik Hierarki
129. Melarikan Diri dari Biaya Tinggi: Menghentikan Konsistensi Diri Sejak Dini untuk Penalaran Multi-Langkah
130. PolyVoice: Model Bahasa untuk Terjemahan Ucapan ke Ucapan
131. Pemangkasan Peta Fitur Adversarial untuk Pintu Belakang
132. EmerDiff: Munculnya Pengetahuan Semantik Tingkat Piksel dalam Model Difusi
133. CLEX: Ekstrapolasi Panjang Berkelanjutan untuk Model Bahasa Besar
134. FairSeg: Kumpulan Data Segmentasi Citra Medis Skala Besar untuk Pembelajaran Kewajaran Menggunakan Model Segmen Apa Pun dengan Penskalaan Terikat Kesalahan yang Adil
135. InstructCV: Model Difusi Teks-ke-Gambar yang Disetel dengan Instruksi sebagai Generalis Visi
136. Pertahankan-Pembaruan-Revisi untuk Menyembuhkan Generalisasi dan Kekokohan Trade-off dalam Pelatihan Adversarial
137. Bisakah Kita Mengevaluasi Model Adaptasi Domain Tanpa Label Domain Target?
138. Menolak Perutean Tugas untuk Model Difusi
139. Transformator Sadar Frekuensi untuk Kompresi Gambar yang Dipelajari
140. Ansambel Model Penghargaan Membantu Mitigasi Optimalisasi Berlebihan
141. Memahami Kekokohan Pertahanan Fitur Acak Terhadap Serangan Adversarial Berbasis Kueri
142. GoLLIE: Pedoman Anotasi meningkatkan Ekstraksi Informasi Zero-Shot
143. Apakah Data yang Dihasilkan Selalu Membantu Pembelajaran Kontrastif?
144. Pembelajaran Penguatan Offline Aman dengan Model Difusi Berpandu Kelayakan
145. Paralelisme Saluran Pipa Nol Gelembung (Hampir).
146. Menjelajahi Penyeimbangan Berat pada Masalah Pengenalan Ekor Panjang
147. Konservatisme Komposisi: Pendekatan Transduktif dalam Pembelajaran Penguatan Offline
148. Mengalir ke Lebih Baik: Pembelajaran Penguatan Berbasis Preferensi Offline melalui Pembuatan Lintasan Pilihan
149. ED-NeRF: Pengeditan Adegan 3D Berpanduan Teks yang Efisien Dengan Ruang Laten NeRF
150. Memajukan Sintesis Gambar Berpanduan Pose dengan Model Difusi Bersyarat Progresif
151. Dekomposisi Iteratif Berbasis Perhatian untuk Representasi Produk Tensor
152. Prometheus: Mendorong Kemampuan Evaluasi yang Mendetail dalam Model Bahasa
153. Mengevaluasi Badan Model Bahasa Melalui Negosiasi
154. VersVideo: Memanfaatkan Model Difusi Temporal yang Ditingkatkan untuk Pembuatan Video Serbaguna
155. Mengontrol Model Bahasa Visi untuk Restorasi Gambar Multi-Tugas
156. Beberapa Aspek Mendasar tentang Kontinuitas Jaringan Neural Lipschitz
157. Tolok Ukur ICU Lainnya: Kerangka Kerja Multi-Pusat yang Fleksibel untuk ML Klinis
158. Memanfaatkan Representasi Bersama Hujan/Sadar Detil untuk Menghilangkan Hujan Rumit
159. AgentBench: Mengevaluasi LLM sebagai Agen
160. Data Sintetis Pribadi Diferensial melalui API Model Fondasi 1: Gambar
161. Perencana Kebijakan Plug-and-Play untuk Agen Dialog yang Didukung Model Bahasa Besar
162. Pengejaran Informasi Variasi Bootstrapping dengan Model Bahasa dan Visi Besar untuk Klasifikasi Gambar yang Dapat Diinterpretasikan
163. Mengevaluasi Model Bahasa Besar pada Mengevaluasi Pengikut Instruksi
164. Pembelajaran Kontrastif Pintu Belakang melalui Optimasi Pemicu Dua Tingkat
165. MetaCoCo: Tolok Ukur Klasifikasi Beberapa Pemotretan Baru dengan Korelasi Palsu
166. SafeDreamer: Pembelajaran Penguatan Aman dengan Model Dunia
167. Looped Transformers Lebih Baik dalam Mempelajari Algoritma Pembelajaran
168. Kekokohan Adversarial Bersertifikat untuk Jaringan Neural Spiking Berkode Kecepatan
169. Berpura-pura Hingga Berhasil: Pembelajaran Federasi dengan Generasi Berorientasi Konsensus
170.Menjelaskan Rangkaian Waktu melalui Gangguan Kontrasif dan Jarang Lokal
171. Penyetelan Respon Syaraf Dinamis
172. Pembelajaran Berpusat pada Objek Beralas
173. Tentang Stabilitas Pengkodean Posisi Ekspresif untuk Grafik
174. SEINE: Model Difusi Video Pendek ke Panjang untuk Transisi dan Prediksi Generatif
175. Pengoptimalan Hadiah yang Sadar Keyakinan untuk Menyempurnakan Model Teks-ke-Gambar
176. Iblis ada di dalam Neuron: Menafsirkan dan Mengurangi Bias Sosial dalam Model Bahasa
177. Distilasi Ensemble untuk Penguraian Konstituensi Tanpa Pengawasan
178. Model Difusi Multi-tujuan Tanpa Pelatihan untuk Pembuatan Molekul 3D
179. Agregator Bendera: Pelatihan Terdistribusi yang Dapat Diskalakan dalam Kegagalan dan Kerugian yang Ditambah menggunakan Optimasi Cembung
180. Pembelajaran Kontrastif Non-negatif
181. Memahami Generalisasi Domain: Perspektif Kekokohan Kebisingan
182.Pengelompokan Gambar Dikondisikan pada Kriteria Teks
183. Membuka Kedok dan Meningkatkan Kredibilitas Data: Studi dengan Kumpulan Data untuk Melatih Model Bahasa yang Tidak Berbahaya
184. Memahami Ekspresivitas GNN dalam Pembelajaran Aturan
185. COLLIE: Konstruksi Sistematis dari Tugas Pembuatan Teks Terkendali
186. GENOME: Penalaran Visual Neuro-Simbolik Generatif dengan Menumbuhkan dan Menggunakan Kembali Modul
187. Hilangnya Gradien dalam Penyempurnaan Penguatan Model Bahasa
188. Pembelajaran Mendalam yang Sangat Bukti untuk Mengukur Ketidakpastian Klasifikasi Komposit
189. Nilai Optimalisasi Kebijakan yang Terregulasi melalui Perilaku Difusi
190. Konsep Model Generatif Kemacetan
191. Memperkuat dan Meningkatkan Pencarian Arsitektur Neural Tanpa Pelatihan
192. MUFFIN: Mengkurasi Instruksi Multi-Aspek untuk Meningkatkan Pengikutan Instruksi
193. Mempelajari Abstraksi Tindakan Beralas dari Bahasa
194. BayesDiff: Memperkirakan Ketidakpastian Berdasarkan Piksel dalam Difusi melalui Inferensi Bayesian
195. $mathbb{D}^2$ Pemangkasan: Penyampaian Pesan untuk Menyeimbangkan Keberagaman & Kesulitan dalam Pemangkasan Data
196. LQ-LoRA: Dekomposisi Matriks Terkuantisasi Tingkat Rendah dan untuk Penyempurnaan Model Bahasa yang Efisien
197. Kerangka Pemikiran: Mendorong LLM untuk Generasi Paralel yang Efisien
198. Pengelompokan Grafik Temporal Dalam
199. CoVLM: Menyusun Entitas Visual dan Hubungan dalam Model Bahasa Besar Melalui Decoding Komunikatif
200. Menuju Pembuatan Tata Letak yang Selaras melalui Model Difusi dengan Batasan Estetika
201. Steve-Eye: Melengkapi Agen Terwujud berbasis LLM dengan Persepsi Visual di Dunia Terbuka
202. WizardLM: Memberdayakan Model Bahasa Besar yang Telah Terlatih untuk Mengikuti Instruksi Kompleks
203. CLIP-MUSED: Penguraian Semantik Informasi Neural Visual Multi-Subjek yang Dipandu CLIP
204. Pembelajaran Preferensi Kontrastif: Belajar dari Umpan Balik Manusia tanpa Pembelajaran Penguatan
205. CoT3DRef: Landasan Visual 3D yang Efisien Data Rantai Pemikiran
206. Pemahaman Tipe Data Visual tidak muncul dari penskalaan Model Bahasa Visi
207. Model Yayasan Visi-Bahasa Remote Penginderaan Tanpa Anotasi Melalui Penyelarasan Jarak Jauh
208. Abstraksi perencanaan belajar dari bahasa
209. Di jalan keadilan: optimasi yang kuat untuk debiasing permusuhan
210. Menyesuaikan Rasionalisasi Mandiri dengan Distilasi Multi-Pemetakan
211. Membangun koperasi agen yang diwujudkan secara modular dengan model bahasa besar
212. Algoritma Pohon Keputusan Hiperboloid Cepat
213. Deteksi beberapa-tembakan dari teks yang dihasilkan mesin menggunakan representasi gaya
214. Pengeditan besar -besaran untuk model bahasa besar melalui meta learning
215. Distilasi Data bisa seperti vodka: menyaring lebih banyak waktu untuk kualitas yang lebih baik
216. Suntikan Watermark yang Aman dan Kuat dengan satu gambar OOD tunggal
217. Menentukan keahlian: Aplikasi untuk Estimasi Efek Perawatan
218. Mengurangi bias paparan dalam model difusi melalui pengambilan sampel dengan langkah waktu yang bergeser
219. Difftactile: Simulator taktil yang dapat dibedakan berbasis fisika untuk manipulasi robot yang kaya kontak
220. Transformator Tangen untuk Komposisi, Privasi dan Penghapusan
221. Estimasi distribusi bersyarat Bayes untuk distilasi pengetahuan berdasarkan informasi timbal balik bersyarat
222. Bimbingan universal untuk model difusi
223. Kuantifikasi Sensitivitas Model Bahasa terhadap Fitur Bahasa yang Salak dalam Desain Segera atau: Bagaimana Saya Belajar Mulai Khawatir Tentang Pemformatan Segera
224. Aliran SDF saraf untuk rekonstruksi adegan dinamis 3D
225. Ulang, augment, alasan: landasan visual pertanyaan untuk model penglihatan-bahasa
226. Zoologi: Mengukur dan Meningkatkan Penarikan dalam Model Bahasa yang Efisien
227. Pelatihan jarang dinamis dengan sparsity terstruktur
228. Menuju Pelatihan Tanpa Batas Kedalaman: Normalisasi Batch Tanpa Ledakan Gradien
229. Time Red-Teaming yang Digerakkan Keingintahuan Untuk Model Bahasa Besar
230. Tactis-2: Copula yang lebih baik, lebih cepat, lebih sederhana untuk seri waktu multivariat
231. Ketahanan Detektor AI-Image: Batas Dasar dan Serangan Praktis
232. Tic-Clip: Pelatihan Model Klip Berkelanjutan
233. Dekoding terbatas untuk proyeksi label lintas-bahasa
234. Pendekatan dual primal untuk memecahkan ketidaksetaraan variasional dengan kendala umum
235. Saluran Visi Transformers: Suatu gambar bernilai 1 x 16 x 16 kata
236. Ecoflap: Pemangkasan biji-bijaksana kasar-ke-halus untuk model bahasa penglihatan
237. Memahami serangan rekonstruksi dengan kernel singgung saraf dan distilasi dataset
238. beradaptasi dengan shift distribusi dengan visual domain prompt generasi
239. MINIGPT-4: Meningkatkan pemahaman bahasa penglihatan dengan model bahasa besar canggih
240. Grokking sebagai transisi dari malas ke dinamika pelatihan yang kaya
241. Memikirkan Kembali Serangan Backdoor pada Distilasi Dataset: Perspektif Metode Kernel
242. Campuran para ahli yang lemah dan kuat pada grafik
243. Menuju perilaku beragam: tolok ukur untuk belajar imitasi dengan demonstrasi manusia
244. Rekonsiliasi abstraksi spasial dan temporal untuk representasi tujuan
245. LLM Augmented LLMS: Memperluas kemampuan melalui komposisi
246. Memperkirakan informasi timbal balik bersyarat untuk pemilihan fitur dinamis
247. Mengevaluasi Representasi Pembelajaran pada Semesta Struktur Protein
248. Nougat: Pemahaman Optik Saraf untuk Dokumen Akademik
249. Featup: Kerangka Model-Agnostik untuk Fitur pada Resolusi Apa pun
250. Autoencoders yang jarang menemukan fitur yang sangat dapat ditafsirkan dalam model bahasa
251. Ovor: OnePrompt dengan regularisasi outlier virtual untuk pembelajaran intrementasi kelas bebas latihan
252. Belajar dari dataset offline yang jarang melalui estimasi kepadatan konservatif
253. Keanekaragaman kualitas melalui umpan balik AI
254. Model internal hibrida: pembelajaran penggerak berkaki gesit dengan respons robot yang disimulasikan
255. OpenWebmath: Dataset terbuka teks web matematika berkualitas tinggi
256. Optimalisasi berbasis model yang kuat untuk menantang lanskap kebugaran
257. Memecahkan frekuensi tinggi dan PDE multi-skala dengan proses Gaussian
258. S $ 2 $ AC: Pembelajaran Penguatan Berbasis Energi dengan Kritikus Aktor Soft Stein
259. pemecah PDE saraf yang lebih baik melalui penggerak mesh bebas data
260. Model difusi variasional bersyarat
261. Bend: Benchmarking Model Bahasa DNA pada tugas yang bermakna secara biologis
262. Menuju kesetiaan yang kuat untuk mengevaluasi penjelasan dari jaringan saraf grafik
263. Transportasi Optimal Saraf dengan Fungsi Biaya Umum
264. Perspektif Topologis tentang Demistifikasi Kinerja Prediksi Tautan Berbasis GNN
265. Pembelajaran Penguatan yang Hemat Waktu Dengan Kebijakan Stokastik
266. Buka Kotak Hitam: Pembaruan Kebijakan Berbasis Langkah untuk Pembelajaran Penguatan Episodik yang Dikorrelasi sementara
267. Bisakah kita mendapatkan yang terbaik dari jaringan saraf biner dan jaringan saraf spiking untuk visi komputer yang efisien?
268. Node2ket: Embedding jaringan dimensi tinggi yang efisien di ruang kuantum Hilbert
269. Ring-a-Bell!
270. Pengelompokan gambar melalui prinsip pengurangan laju usia model pretrained
271. Vera: Adaptasi Matriks Acak Berbasis Vektor
272. Persepsiclip: Klasifikasi Visual dengan menyimpulkan dan pengkondisian pada konteks
273. Antgpt: Dapatkah model bahasa besar membantu antisipasi tindakan jangka panjang dari video?
274. Beno: Operator saraf yang tertanam batas untuk elips PDES
275. Fourier Transporter: Manipulasi Robotik Bi-Equivariant dalam 3D
276. Jaringan lewat pesan Clifford Group Equivariant Sederhana
277. Melepaskan video pra-pelatihan generatif skala besar untuk manipulasi robot visual
278. Visi-demi-bahasa untuk pengambilan gambar komposisi bebas pelatihan
279. Gaia: Generasi Avatar Zero-Shot Talking
280. Robusttsf: Menuju Teori dan Desain Seri Waktu yang Kuat Peramalan dengan Anomali
281. Slicegpt: Kompres model bahasa besar dengan menghapus baris dan kolom
282. Dorsal: Difusi untuk representasi adegan yang berpusat pada objek
283. Meningkatkan Kapasitas Model Gratis: Strategi Sederhana Untuk Parameter Efisien Menyetranya
284. Cuti-One-Out Distingishabilitas dalam Pembelajaran Mesin
285. Pembelajaran Proksi Semantik dari Prompt Visual untuk Parameter-Efisien Menyempurnakan dalam Pembelajaran Metrik yang Dalam
286. Transportasi Optimal Neural Entropik yang Dipandu Energi
287. Pengambilan Arsitektur Saraf
288. Menghapus bias dari representasi molekuler melalui pengaksimalan informasi
289. Perkiraan yang lebih cepat dari nilai probabilistik dan distribusi melalui kotak terkecil
290. Tab: Akumulasi normalisasi batch temporal dalam jaringan saraf paku
291. Memikirkan kembali metrik keseragaman dalam pembelajaran yang di-swadaya
292. Model segmentasi menyelam ke dalam piksel
293. Berbagi Hybrid untuk Klasifikasi Gambar Multi-Label
294. di pelatihan permusuhan wi