Garis Waktu ChatGPT, GenerativeAI, dan LLM
Repositori ini mengatur garis waktu peristiwa penting (produk, layanan, makalah, GitHub, postingan blog, dan berita) yang terjadi sebelum dan sesudah pengumuman ChatGPT.
Ini mengumpulkan berbagai informasi dalam linimasa ini, dengan fokus khusus pada LLM dan AI Generatif.
Mungkin itu adalah adegan dari sejarah terpanas, jadi kupikir penting untuk menyimpan kenangan itu dengan baik, jadi aku mengaturnya.
Statistik
Diagram ini dihasilkan oleh Penerjemah Kode ChatGPT.
Berkontribusi
Masalah dan Permintaan Tarik sangat dihargai. Jika Anda belum pernah berkontribusi pada proyek sumber terbuka sebelumnya, saya dengan senang hati akan memandu Anda tentang cara membuat permintaan tarik.
Anda dapat memulai dengan membuka masalah yang menjelaskan masalah yang ingin Anda selesaikan dan kita akan mulai dari sana.
emoji
arXiv , PDF ?, arxiv-vanity ?, halaman kertas ?, makalah dengan kode ✳️, Github
Lisensi
Dokumen ini dilisensikan di bawah lisensi MIT © Jonghong Jeon(전종홍)
Garis Waktu V2
2024
- 17/05 - OpenAI mencapai kesepakatan Reddit untuk melatih AI-nya pada postingan Anda
(Berita), - 17/05 - OpenAI membubarkan tim yang berfokus pada risiko AI jangka panjang, kurang dari satu tahun setelah mengumumkannya
(Berita), - 17/05 - Laporan Ilmiah Internasional tentang Keamanan AI Tingkat Lanjut
(Blog), - 16/05 - TRANSIK: Transfer Kebijakan Sim-to-Real dengan Belajar dari Koreksi Online
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16/05 - Toon3D: Melihat Kartun dari Perspektif Baru
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16/05 - Menguji keandalan model bahasa besar berbasis AI untuk mengekstrak informasi ekologi dari literatur ilmiah
(Berita), - 16/05 - Pembelajaran Dalam Konteks Banyak-Shot dalam Model Landasan Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16/05 - Cara Menjeda AI Sebelum Terlambat
(Berita), - 16/05 - Grounding DINO 1.5: Meningkatkan "Keunggulan" Deteksi Objek Open-Set
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16/05 - Penambangan dan Analisis Toko GPT
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16/05 - Dual3D: Pembuatan Teks-ke-3D yang Efisien dan Konsisten dengan Difusi Laten Multi-tampilan Mode Ganda
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16/05 - Bunglon: Model Fondasi Penggabungan Awal Modal Campuran
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 16/05 - CAT3D: Buat Apa Pun dalam 3D dengan Model Difusi Multi-Tampilan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15/05 - Xmodel-VLM: Garis Dasar Sederhana untuk Model Bahasa Visi Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15/05 - LoRA Lebih Sedikit Belajar dan Lebih Sedikit Lupa
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15/05 - Tanda air AI Google yang tidak terlihat akan membantu mengidentifikasi teks dan video generatif
(Berita), - 15/05 - Google I/O 2024: semuanya diumumkan
(Blog), - 15/05 - BEHAVIOR Vision Suite: Pembuatan Kumpulan Data yang Dapat Disesuaikan melalui Simulasi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15/05 - ALPINE: Mengungkap Kemampuan Perencanaan Pembelajaran Autoregresif dalam Model Bahasa
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14/05 - Memahami kesenjangan kinerja antara algoritma penyelarasan online dan offline
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14/05 - SpeechVerse: Model Bahasa Audio yang Dapat Digeneralisasikan Berskala Besar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14/05 - SpeechGuard: Menjelajahi Kekokohan Model Bahasa Besar Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14/05 - Tidak Ada Waktu yang Terbuang: Peras Waktu ke dalam Saluran untuk Pemahaman Video Seluler
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14/05 - Hunyuan-DiT: Transformator Difusi Multi-Resolusi yang Kuat dengan Pemahaman Tiongkok yang Mendalam
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14/05 - Pembuatan Komposisi Teks-ke-Gambar dengan Representasi Gumpalan Padat
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 14/05 - Beyond Scaling Laws: Memahami Kinerja Transformer dengan Memori Asosiatif
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13/05 - SambaNova SN40L: Menskalakan Dinding Memori AI dengan Aliran Data dan Komposisi Pakar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13/05 - Alur Kerja RLHF: Dari Pemodelan Hadiah hingga RLHF Online
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13/05 - Plot2Code: Tolok Ukur Komprehensif untuk Mengevaluasi Model Bahasa Besar Multi-modal dalam Pembuatan Kode dari Plot Ilmiah
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13/05 - OpenAI memperkenalkan model AI terbaru, GPT-4o
(Berita), - 13/05 - Pencarian Web MS MARCO: Kumpulan Data Web Berskala Besar yang Kaya Informasi dengan Jutaan Label Klik Asli
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 13/05 - Berapa Banyak Penelitian yang Ditulis oleh Model Bahasa Besar?
(Blog), - 13/05 - Halo GPT-4o
(Blog), - 13/05 - Coin3D: Pembuatan Aset 3D yang Dapat Dikontrol dan Interaktif dengan Pengkondisian yang Dipandu Proxy
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/11 - Piccolo2: Penyematan Teks Umum dengan Pelatihan Kerugian Hibrid Multi-tugas
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/11 - LogoMotion: Pembuatan Kode Beralas Visual untuk Animasi Sadar Konten
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/10 - INSPECT - Kerangka kerja sumber terbuka untuk evaluasi model bahasa besar
(Blog), - 05/10 - AI Safety Institute merilis platform evaluasi keamanan AI baru
(Berita), - 05/07 - SUTRA: Arsitektur Model Bahasa Multibahasa yang Dapat Diskalakan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/07 - Meta Merilis LLM Sumber Terbuka Llama 3
(Berita), - 05/03 - Apa yang penting ketika membangun model bahasa visi?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/02 - WildChat: 1 Juta Log Interaksi ChatGPT di Alam Liar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/02 - Difusi Cerita: Perhatian Diri yang Konsisten untuk Pembuatan Gambar dan Video Jarak Jauh
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/02 - Prometheus 2: Model Bahasa Sumber Terbuka yang Khusus Mengevaluasi Model Bahasa Lain
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/02 - NeMo-Aligner: Toolkit yang Dapat Diskalakan untuk Penyelarasan Model yang Efisien
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/02 - LLM-AD: Sistem Deskripsi Audio berbasis Model Bahasa Besar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/02 - FLAME: Penyelarasan Sadar Faktualitas untuk Model Bahasa Besar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/02 - Menyesuaikan Model Teks-ke-Gambar dengan Pasangan Gambar Tunggal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/01 - Bidang Gaussian yang Dipangkas Secara Spektral dengan Kompensasi Neural
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/01 - Optimasi Preferensi Putar Mandiri untuk Penyelarasan Model Bahasa
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/01 - Apakah Ukuran Batch Edit yang Lebih Besar Selalu Lebih Baik? -- Studi Empiris tentang Pengeditan Model dengan Llama-3
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/01 - Clover: Decoding Spekulatif Ringan Regresif dengan Pengetahuan Berurutan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 05/01 - Pemeriksaan Meneliti Kinerja Model Bahasa Besar pada Aritmatika Sekolah Dasar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - Pemeriksa Fakta Visual: Mengaktifkan Pembuatan Teks Terperinci dengan Ketelitian Tinggi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - STT: Pelacakan Stateful dengan Transformer untuk Mengemudi Otonom
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - SemantiCodec: Codec Audio Semantik Laju Bit Ultra Rendah untuk Suara Umum
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - Octopus v4: Grafik model bahasa
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - MotionLCM: Pembuatan Gerakan Terkendali Waktu Nyata melalui Model Konsistensi Laten
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - MicroDreamer: Generasi 3D Zero-shot dalam sim20 Detik dengan Rekonstruksi Iteratif Berbasis Skor
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - Lightplane: Komponen yang Sangat Skalabel untuk Bidang Neural 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - KAN: Jaringan Kolmogorov-Arnold
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - Optimasi Preferensi Penalaran Iteratif
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - Jahitan Tak Terlihat: Menghasilkan Pemandangan 3D Halus dengan Pengecatan Kedalaman
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - InstantFamily: Perhatian Terselubung untuk Pembuatan Gambar Multi-ID Zero-shot
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - GS-LRM: Model Rekonstruksi Besar untuk Percikan Gaussian 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - Memperluas Konteks Llama-3 Sepuluh Kali Lipat Semalam
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - DOCCI: Deskripsi Gambar yang Terhubung dan Kontras
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 30/04 - Model Bahasa Besar Lebih Baik & Lebih Cepat melalui Prediksi Multi-token
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29/04 - Stylus: Pemilihan Adaptor Otomatis untuk Model Difusi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29/04 - SAGS: Percikan Gaussian 3D Sadar Struktur
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29/04 - Mengganti Juri dengan Juri: Mengevaluasi Generasi LLM dengan Panel Model yang Beragam
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29/04 - Profil AI Generatif NIST AI RMF
(Berita), - 29/04 - LoRA Land: 310 LLM yang Disempurnakan yang Menyaingi GPT-4, Laporan Teknis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29/04 - Kanguru: Penguraian Spekulatif Diri Tanpa Rugi melalui Keluar Dini Ganda
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 29/04 - Kemampuan Model Gemini dalam Kedokteran
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 28/04 - Paint by Inpaint: Belajar Menambahkan Objek Gambar dengan Menghapusnya Terlebih Dahulu
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 28/04 - LEGENDA: Platform Terbuka untuk Agen Terwujud
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 27/04 - Ag2Manip: Mempelajari Keterampilan Manipulasi Novel dengan Representasi Visual dan Aksi Agen-Agnostik
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 26/04 - MaPa: Lukisan Material Fotorealistik Berbasis Teks untuk Bentuk 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 26/04 - BlenderAlchemy: Mengedit Grafik 3D dengan Model Vision-Language
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - Laporan Teknis Tele-FLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - SEED-Bench-2-Plus: Membandingkan Model Bahasa Besar Multimodal dengan Pemahaman Visual Kaya Teks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - Meninjau Kembali Evaluasi Teks-ke-Gambar dengan Gecko: Tentang Metrik, Perintah, dan Peringkat Manusia
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - PLLaVA : Ekstensi LLaVA bebas parameter dari Gambar ke Video untuk Teks Padat Video
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - Jadikan LLM Anda Memanfaatkan Konteks Sepenuhnya
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - Daftar Item Satu per Satu: Sumber Data Baru dan Paradigma Pembelajaran untuk LLM Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - Lompatan Lapisan: Mengaktifkan Inferensi Keluar Dini dan Decoding Spekulatif Mandiri
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - Interactive3D: Ciptakan Apa yang Anda Inginkan dengan Generasi 3D Interaktif
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - Seberapa Jauh Kita Mencapai GPT-4V? Menutup Kesenjangan Model Multimoda Komersial dengan Rangkaian Sumber Terbuka
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 25/04 - ConsistentID: Pembuatan Potret dengan Pelestarian Identitas Terperinci Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - XC-Cache: Menghadiri Silang Konteks Cache untuk Inferensi LLM yang Efisien
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - Etika Asisten AI Tingkat Lanjut
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - PuLID: Kustomisasi ID Murni dan Kilat melalui Penyelarasan Kontrasif
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - NeRF-XL: Menskalakan NeRF dengan Banyak GPU
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - MotionMaster: Transfer Gerakan Kamera Tanpa Pelatihan Untuk Pembuatan Video
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - Mode: CLIP Data Expert melalui Clustering
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - MMT-Bench: Tolok Ukur Multimodal Komprehensif untuk Mengevaluasi Model Bahasa Visi Besar Menuju Multitask AGI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - MaGGIe: Instance Manusia Bertahap Terpandu Bertopeng
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - ID-Aligner: Meningkatkan Pembuatan Teks-ke-Gambar yang Mempertahankan Identitas dengan Pembelajaran Umpan Balik Berhadiah
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - Elemen Gambar yang Dapat Diedit untuk Sintesis Terkendali
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - CatLIP: Akurasi Pengenalan Visual tingkat CLIP dengan Pra-pelatihan 2,7x Lebih Cepat pada Data Gambar-Teks skala Web
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 24/04 - BASS: Pengambilan Sampel Spekulatif yang Dioptimalkan Perhatian
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23/04 - Transformers Dapat Mewakili Model Bahasa n-gram
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23/04 - Laporan Teknis Pegasus-v1
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23/04 - Campuran Pakar Multi-Kepala
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 23/04 - FlashSpeech: Sintesis Ucapan Zero-Shot yang Efisien
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - SnapKV: LLM Tahu Apa yang Anda Cari Sebelum Generasi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - SEED-X: Model Multimodal dengan Pemahaman dan Pembuatan Multi-granularitas Terpadu
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - Rekonstruksi Koordinat Pemandangan: Pemosisian Koleksi Gambar melalui Pembelajaran Tambahan Relocalizer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - Laporan Teknis Phi-3: Model Bahasa yang Sangat Mampu Secara Lokal di Ponsel Anda
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - OpenELM: Kelompok Model Bahasa yang Efisien dengan Pelatihan Sumber Terbuka dan Kerangka Inferensi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - MultiBooth: Menuju Menghasilkan Semua Konsep Anda dalam Gambar dari Teks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - Mempelajari Kontrol Penggerak H-Infinity
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - Seberapa Bagus Model LLaMA3 Terkuantisasi Bit Rendah? Sebuah Studi Empiris
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - Sejajarkan Langkah Anda: Mengoptimalkan Jadwal Pengambilan Sampel dalam Model Difusi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 22/04 - Agen Interpretabilitas Otomatis Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 21/04 - Hyper-SD: Model Konsistensi Tersegmentasi Lintasan untuk Sintesis Gambar yang Efisien
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 21/04 - AdvPrompter: Permintaan Adversarial Adaptif Cepat untuk LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 20/04 - Model Konsistensi Musik
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - Hierarki Instruksi: Melatih LLM untuk Memprioritaskan Instruksi Istimewa
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - TextSquare: Meningkatkan Penyetelan Instruksi Visual Berpusat pada Teks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - PhysDreamer: Interaksi Berbasis Fisika dengan Objek 3D melalui Pembuatan Video
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - LLM-R2: Model Bahasa Besar Sistem Penulisan Ulang Berbasis Aturan yang Ditingkatkan untuk Meningkatkan Efisiensi Kueri
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - Seberapa Nyatakah Itu Nyata? Kerangka Evaluasi Manusia untuk Contoh Permusuhan yang Tidak Terbatas
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - Seberapa Jauh Kita Dapat Melakukan Perbaikan Program Tingkat Fungsi Praktis?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - Groma: Tokenisasi Visual yang Dilokalkan untuk Membumikan Model Bahasa Besar Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - Apakah Gaussian Splatting memerlukan Inisialisasi SFM?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 19/04 - AutoCrawler: Agen Web Pemahaman Progresif untuk Pembuatan Perayap Web
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - TriForce: Akselerasi Lossless dari Pembuatan Urutan Panjang dengan Penguraian Kode Spekulatif Hierarki
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - Menuju Peningkatan Diri LLM melalui Imajinasi, Pencarian, dan Kritik
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - Gunakan Kembali Hadiah Anda: Transfer Model Hadiah untuk Penyelarasan Lintas Bahasa Zero-Shot
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - Reka Core, Flash, dan Edge: Serangkaian Model Bahasa Multimodal yang Kuat
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - OpenBezoar: Model Kecil, Hemat Biaya, dan Terbuka yang Dilatih pada Campuran Data Instruksi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - MeshLRM: Model Rekonstruksi Besar untuk Mesh Berkualitas Tinggi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - Memperkenalkan Tolok Ukur Keamanan AI v0.5 dari MLCommons
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - Memperkenalkan Meta Llama 3: LLM paling mumpuni yang tersedia secara terbuka hingga saat ini
(Blog), - 18/04 - EdgeFusion: Pembuatan Teks-ke-Gambar di Perangkat
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - BLINK: Model Bahasa Besar Multimodal Dapat Melihat tetapi Tidak Melihat
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 18/04 - AniClipart: Animasi Clipart dengan Prioritas Teks-ke-Video
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17/04 - MoA: Campuran Perhatian untuk Penguraian Subjek-Konteks dalam Pembuatan Gambar yang Dipersonalisasi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17/04 - FlowMind: Pembuatan Alur Kerja Otomatis dengan LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17/04 - Tipografi Dinamis: Menghidupkan Kata
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 17/04 - API Difusi Stabil 3 Kini Tersedia
(twitter), (Blog), (Demo), - 16/04 - VASA-1: Wajah Berbicara Berbasis Audio Seperti Nyata yang Dihasilkan dalam Waktu Nyata
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 16/04 - Menteri Perdagangan AS Gina Raimondo Mengumumkan Perluasan Tim Kepemimpinan Institut Keamanan AI AS
(Berita), - 16/04 - Generasi musik jangka panjang dengan difusi laten
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15/04 - Evaluator LLM Mengakui dan Mendukung Generasi Mereka Sendiri
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 15/04 - Video2Game: Lingkungan Real-time, Interaktif, Realistis, dan Kompatibel dengan Browser dari Satu Video
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15/04 - Tango 2: Menyelaraskan Generasi Teks-ke-Audio Berbasis Difusi melalui Optimasi Preferensi Langsung
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 15/04 - Menjinakkan Model Difusi Laten untuk Inpainting Bidang Neural Radiance
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15/04 - Opus dapat beroperasi sebagai mesin Turing
(twitter), - 15/04 - MathGPT: Memanfaatkan Llama 2 untuk menciptakan platform pembelajaran yang sangat personal
- 15/04 - HQ-Edit: Kumpulan Data Berkualitas Tinggi untuk Pengeditan Gambar Berbasis Instruksi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15/04 - Ctrl-Adapter: Kerangka Kerja yang Efisien dan Serbaguna untuk Mengadaptasi Beragam Kontrol ke Model Difusi Apa Pun
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15/04 - Kompresi Mewakili Kecerdasan Secara Linear
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 15/04 - CompGS: Representasi Pemandangan 3D yang Efisien melalui Gaussian Splatting Terkompresi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 14/04 - TextHawk: Menjelajahi Persepsi Detail yang Efisien tentang Model Bahasa Besar Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 13/04 - Cathie Wood Muscles Menjadi ChatGPT Boom Dengan Taruhan OpenAI Baru
(Berita), - 04/12 - CLIP Scaling (Down): Analisis Komprehensif Data, Arsitektur, dan Strategi Pelatihan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/12 - Menyelidiki Kesadaran 3D Model Fondasi Visual
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/12 - Pra-pelatihan LM Basis Kecil dengan Token Lebih Sedikit
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/12 - Tentang Kekokohan Panduan Bahasa untuk Tugas Penglihatan Tingkat Rendah: Temuan dari Estimasi Kedalaman
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/12 - MonoPatchNeRF: Meningkatkan Bidang Cahaya Neural dengan Panduan Monokuler Berbasis Patch
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/12 - Megalodon: Pra-pelatihan dan Inferensi LLM yang Efisien dengan Panjang Konteks Tak Terbatas
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/12 - Apakah ChatGPT Mengubah Gaya Menulis Akademisi?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/12 - KELAPA: Modernisasi Segmentasi COCO
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/12 - Chip AI Mengurangi Anggaran Energi sebesar 99+ Persen
(Berita), - 04/12 - AdapterSwap: Pelatihan LLM Berkelanjutan dengan Penghapusan Data dan Jaminan Kontrol Akses
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/12 - Pratinjau Visi Grok-1.5
(Demo), - 04/12 - Pin yang baik, yang buruk, dan yang Manusiawi
(Berita), - 04/12 - Obrolan Berbayar Pengguna GPT kini dapat mengakses GPT-4 Turbo
(twitter), (Berita), , () - 04/11 - Perlunya Dewan Standar Audit AI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 04/11 - Mengingat Transformer untuk Pembelajaran Berkelanjutan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Amazon menambahkan Andrew Ng, tokoh terkemuka di bidang kecerdasan buatan, ke dalam dewan direksinya
(Berita), - 04/11 - Adobe Membeli Video seharga $3 Per Menit untuk Membangun Model AI
(Berita), - 04/11 - UltraEval: Platform Ringan untuk Evaluasi Fleksibel dan Komprehensif untuk LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/11 - Efisiensi yang Dapat Dipindahtangankan dan Berprinsip untuk Segmentasi Kosakata Terbuka
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/11 - Agen SWE
(twitter), (Demo), , () - 04/11 - Pembentuk Jalur Jarang
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Rho-1: Tidak Semua Token Yang Anda Butuhkan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/11 - Agen Penelitian: Pembuatan Ide Penelitian Berulang atas Sastra Ilmiah dengan Model Bahasa Besar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - RecurrentGemma: Melewati Transformers untuk Model Bahasa Terbuka yang Efisien
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - OSWorld: Membandingkan Agen Multimodal untuk Tugas Terbuka di Lingkungan Komputer Nyata
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - LLoCO: Mempelajari Konteks Panjang Offline
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Memanfaatkan Model Bahasa Besar (LLM) untuk Mendukung Anotasi Data Risiko Online Human-AI yang Kolaboratif
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - JetMoE: Mencapai Kinerja Llama2 dengan 0,1 Juta Dolar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) (Proyek), (twitter), , (✳️), () - 04/11 - HGRN2: RNN Linear Berpagar dengan Ekspansi Status
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/11 - Dari Kata ke Angka: Model Bahasa Besar Anda Diam-diam Adalah Regresor yang Mampu Ketika Diberikan Contoh Dalam Konteks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Ferret-v2: Garis Dasar yang Lebih Baik untuk Referensi dan Landasan dengan Model Bahasa Besar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - ControlNet++: Meningkatkan Kontrol Bersyarat dengan Umpan Balik Konsistensi yang Efisien
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Deteksi Anomali Video Sadar Konteks dalam Kumpulan Data Jangka Panjang
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - ChatGPT-3.5, Claude 3 menendang pantat pixelated di turnamen Street Fighter III untuk LLM
(Berita), - 04/11 - ChatGPT Dapat Memprediksi Masa Depan ketika Menceritakan Kisah di Masa Depan Tentang Masa Lalu
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Praktik Terbaik dan Pembelajaran tentang Data Sintetis untuk Model Bahasa
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Tolok ukur LLM dengan bertarung di Street Fighter 3
(Demo), , () - 04/11 - Dialog Audio: Kumpulan data dialog untuk pemahaman audio dan musik
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - Menerapkan Panduan dalam Interval Terbatas Meningkatkan Kualitas Sampel dan Distribusi dalam Model Difusi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/11 - AmpleGCG: Mempelajari Model Sufiks Adversarial Generatif yang Universal dan Dapat Dipindahtangankan untuk Melakukan Jailbreak pada LLM Terbuka dan Tertutup
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/10 - Alat Transparansi LM: Alat Interaktif untuk Menganalisis Model Bahasa Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - Gemini 1.5 Pro sekarang memahami audio
(twitter), - 04/10 - Menjelajahi Kedalaman Konsep: Bagaimana Model Bahasa Besar Memperoleh Pengetahuan di Berbagai Lapisan?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/10 - Arsitek Perkotaan: Pembuatan Pemandangan Perkotaan 3D yang Dapat Dikemudikan dengan Tata Letak Sebelumnya
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - RealmDreamer: Pembuatan Adegan 3D Berbasis Teks dengan Inpainting dan Difusi Kedalaman
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - OpenAI dan Meta hampir merilis model AI yang mampu berpikir seperti manusia, kata laporan
(Berita), - 04/10 - MetaCheckGPT - Detektor Halusinasi Multi-tugas Menggunakan Ketidakpastian LLM dan Model Meta
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - Meta mengonfirmasi bahwa LLM open source Llama 3 akan hadir bulan depan
(Berita), - 04/10 - Jangan Tinggalkan Konteks: Transformator Konteks Tak Terbatas yang Efisien dengan Perhatian Infini
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - XAI Tambahan: Pemahaman yang Berkesan tentang AI dengan Penjelasan Tambahan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - DreamScene360: Pembuatan Adegan Teks-ke-3D Tanpa Batasan dengan Panoramic Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - Apakah Tahu Mapo Mengandung Kopi? Menyelidiki LLM untuk Pengetahuan Budaya Terkait Makanan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - BRAVE: Memperluas pengkodean visual model bahasa visi
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - Startup AI Mistral meluncurkan model AI 281GB untuk menyaingi OpenAI, Meta, dan Google
(Berita), - 04/10 - Komunikasi Semantik Generatif Berbasis Agen untuk Pengawasan Jarak Jauh
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - Mengadaptasi Decoder LLaMA ke Vision Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/10 - Survei tentang Integrasi AI Generatif untuk Berpikir Kritis di Jaringan Seluler
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/09 - Coba lihat! Memikirkan Kembali Cara Mengevaluasi Jailbreak Model Bahasa
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - RULER: Berapa Ukuran Konteks Sebenarnya dari Model Bahasa Konteks Panjang Anda?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - Merevisi Densifikasi di Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/09 - Merekonstruksi Objek Genggam dalam 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/09 - RAR-b: Penalaran sebagai Tolok Ukur Pengambilan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/09 - Rekayasa Cepat Pelestarian Privasi: Sebuah Survei
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/09 - Tentang Mengevaluasi Efisiensi Kode Sumber yang Dihasilkan oleh LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 04/09 - Laporan Teknis OmniFusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - MuPT: Transformator Terlatih Musik Simbolik Generatif
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/09 - MiniCPM: Mengungkap Potensi Model Bahasa Kecil dengan Strategi Pelatihan yang Skalabel
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - Magic-Boost: Tingkatkan Generasi 3D dengan Difusi Terkondisi Mutli-View
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/09 - LLM2Vec: Model Bahasa Besar Secara Rahasia Merupakan Encoder Teks yang Kuat
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - InternLM-XComposer2-4KHD: Model Perintis Bahasa Visi Besar yang Menangani Resolusi dari 336 Piksel hingga 4K HD
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - Hash3D: Akselerasi Tanpa Pelatihan untuk Generasi 3D
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - Google meluncurkan proyek sumber terbuka untuk AI generatif
(Berita), - 04/09 - Gajah Jangan Pernah Lupa: Menghafal dan Mempelajari Data Tabular dalam Model Bahasa Besar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/09 - Apple baru saja meluncurkan Ferret-UI LLM baru — AI ini dapat membaca layar iPhone Anda
(Berita), - 04/09 - AEGIS: Moderasi Keamanan Konten AI Adaptif Online dengan Kumpulan Pakar LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/08 - YaART: Satu Lagi Teknologi Rendering ART
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/08 - WILBUR: Pembelajaran Dalam Konteks Adaptif untuk Agen Web yang Kuat dan Akurat
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/08 - UniFL: Meningkatkan Difusi Stabil melalui Pembelajaran Umpan Balik Terpadu
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/08 - Icarus Tak Terkendali: Survei Potensi Bahaya Input Gambar dalam Keamanan Model Bahasa Besar Multimodal
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/08 - Papan Peringkat Halusinasi -- Upaya Terbuka untuk Mengukur Halusinasi dalam Model Bahasa Besar
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 04/08 - Masalah Seleksi Fakta dalam Perbaikan Program Berbasis LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 04/08 - swapaPanything: Mengaktifkan objek sewenang -wenang menukar pengeditan visual yang dipersonalisasi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - Sambalingo: Mengajar Model Bahasa Besar Bahasa Baru
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - Optimalisasi Preferensi Negatif: dari keruntuhan bencana hingga unturing yang efektif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - Debut Naver Multilingual Hyperclova X LLM akan digunakan untuk membangun AI Sovereign untuk Asia
(Berita), - 04/08 - MOMA: Adaptor LLM multimodal untuk pembuatan gambar yang dipersonalisasi cepat
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - Medexpqa: Benchmarking multibahasa model bahasa besar untuk menjawab pertanyaan medis
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08- MA-LMM: Model multimodal besar-augmented untuk pemahaman video jangka panjang
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - Layoutllm: Tata Letak Instruksi Tuning Dengan Model Bahasa Besar Untuk Pemahaman Dokumen
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/08 - Ferret -UI: Pemahaman UI Seluler Berbagai dengan LLM Multimodal
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - Mengevaluasi kemampuan penalaran intervensi dari model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - Eagle dan Finch: RWKV dengan keadaan bernilai matriks dan kekambuhan dinamis
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/08 - CODECLM: Menyelaraskan model bahasa dengan data sintetis yang disesuaikan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/08 - AutoCoderover: Peningkatan program otonom
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/07 - TimeGpt dalam Peramalan Load: Perspektif Model Seri Waktu yang Besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/07 - Openai ditranskrip lebih dari satu juta jam video YouTube untuk melatih GPT -4
(Berita), - 04/07 - MagicTime: Model generasi video selang waktu sebagai simulator metamorfik
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/07 - BYTEEDIT: Boost, patuh dan percepatan pengeditan gambar generatif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/06 - Pemungutan suara mayoritas dokter meningkatkan kesesuaian ketergantungan AI dalam patologi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 04/06- Difusi-RWKV: Penskalaan arsitektur seperti RWKV untuk model difusi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/06- Datenerf: Pengeditan NERFS yang berbasis teks kedalaman
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/06- Beyondscene: Generasi adegan human-centric resolusi lebih tinggi dengan difusi pretrained
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/06 - Menyelaraskan model difusi dengan mengoptimalkan utilitas manusia
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/06 - Kasing untuk mengembangkan model fondasi untuk tugas -tugas seperti perencanaan dari awal
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - Peningkatan kerentanan LLM dari penyesuaian dan kuantisasi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - SpatialTracker: Melacak piksel 2D di ruang 3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - Pelatihan keterampilan sosial dengan model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - Sigma: jaringan mamba siam untuk segmentasi semantik multi -modal
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/05 - Gaussian Splatting yang kuat
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - Physivatar: Mempelajari fisika avatar 3D berpakaian dari pengamatan visual
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05- Koala: Kunci Bingkai Kunci Long-Llm yang dikondisikan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - Petunjuk: Evaluasi Pemahaman Bahasa Klinis untuk LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - China Tiny LLM: Pretraining Model Bahasa Besar China -Centric
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/05 - Membantu manusia dalam perbandingan kompleks: Perbandingan informasi otomatis pada skala
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - AI yang diwujudkan dengan dua lengan: Pembelajaran Zero -Shot, Keamanan dan Modularitas
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 04/04 - Evolusi Model Bahasa: Perspektif Pembelajaran Berulang
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04- Visualisasi-of-Thought memunculkan penalaran spasial dalam model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) (twitter), - 04/04 - Tidak ada "nol -shot" tanpa data eksponensial: frekuensi konsep pretraining menentukan kinerja model multimodal
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/04 - Mengevaluasi LLM dalam Mendeteksi Kesalahan dalam Respons LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/04 - Mengevaluasi model bahasa generatif dalam ekstraksi informasi sebagai koreksi pertanyaan subyektif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/04 - Optimalisasi Nash Langsung: Model Bahasa Mengajar untuk Meningkatkan Diri Dengan Preferensi Umum
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04- CBR-RAG: Penalaran berbasis kasus untuk pengambilan generasi augmented di LLMS untuk menjawab pertanyaan hukum
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - Kemampuan Model Bahasa Besar dalam Rekayasa Kontrol: Studi Benchmark tentang GPT -4, Claude 3 Opus, dan Gemini 1.0 Ultra
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - canttalkaboutthis: Menyelaraskan model bahasa untuk tetap pada topik dalam dialog
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - AutoWebGLM: Bootstrap dan Perkuat Agen Navigasi Web Berbasis Model Bahasa Besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/04 - Pelatihan LLMS atas teks terkompresi neural
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - Reft: Representasi Finetuning untuk Model Bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/04- Red Teaming GPT-4V: Apakah GPT-4V aman terhadap serangan jailbreak uni/multi-modal?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04- Rall-E: Pemodelan Bahasa Codec yang kuat dengan dorongan rantai untuk sintesis teks-ke-speech
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - PointInfinity: Model difusi titik resolusi -invarian
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04- MINIGPT4-Video: Memajukan multimodal LLMS untuk pemahaman video dengan token visual-tekstual yang diselingi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04- COMAT: Menyelaraskan model difusi teks-ke-gambar dengan pencocokan konsep gambar-ke-teks
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - CodeeditorBench: Mengevaluasi Kode Pengeditan Kode Model Bahasa Besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/04 - AutoWebGLM: Bootstrap dan Perkuat Agen Navigasi Web Berbasis Model Bahasa Besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/03 - Visual Autoregressive Modeling: Pembuatan gambar yang dapat diskalakan melalui prediksi skala berikutnya
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/03- Pada skalabilitas pembuatan teks-ke-gambar berbasis difusi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/03 - jailbreak banyak -shot
() - 04/03- LVLM-Intrepret: Alat interpretabilitas untuk model bahasa penglihatan yang besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/03 - Model Bahasa sebagai Kompiler: Simulasi Eksekusi Pseudocode Meningkatkan Penalaran Algoritmik Dalam Model Bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/03- InstantStyle: Makan siang gratis menuju pemeliharaan gaya dalam generasi teks-ke-gambar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/03 - Freditor: Pengeditan NERF kesetiaan tinggi dan transfer dengan dekomposisi frekuensi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/03- Lintas-perhatian membuat inferensi rumit dalam model difusi teks-ke-gambar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/03- chatglm-math: Meningkatkan pemecahan masalah matematika dalam model bahasa besar dengan pipa kritik sendiri
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/02 - UK & Amerika Serikat mengumumkan kemitraan dalam sains keselamatan AI
(Berita), - 04/02 - Model Bahasa Besar sebagai Generator Domain Perencanaan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 04/02 - poro 34b dan berkat multibahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/02 - Octopus V2: Model bahasa on -device untuk agen super
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/02- Campuran:
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/02- Long-Context LLMS berjuang dengan pembelajaran dalam konteks panjang
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/02 - LLM -ABR: Merancang algoritma bitrate adaptif melalui model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/02 - Model bahasa besar dapat mengubah masa depan perawatan kesehatan perilaku: proposal untuk pengembangan dan evaluasi yang bertanggung jawab
() - 04/02 - Laporan Teknis Hyperclova X
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/02- CameraCtrl: Mengaktifkan Kontrol Kamera untuk Pembuatan Teks-ke-Video
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/02 - Memajukan Generalis Penalaran LLM dengan Pohon Preferensi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/01 - Aliran Pencarian (SOS): Belajar mencari dalam bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/01 - llm sebagai dalang: survei penalaran strategis dengan model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/01 - Bangkit dan Bangkitnya AI Model Bahasa Besar (LLM)
(Blog), - 04/01 - streaming captioning video padat
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/01 - Kesamaan Gaya Pengukuran dalam Model Difusi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/01- Melakukannya dengan benar: Meningkatkan konsistensi spasial dalam model teks-ke-gambar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/01 - Untuk perusahaan AI yang membuat data, Internet terlalu kecil
(Berita), - 04/01- Flexidreamer: Generasi Gambar-ke-3d Tunggal dengan Flexicubes
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/01 - EvalVerse: Perpustakaan Terpadu dan Dapat Diakses untuk Evaluasi Model Bahasa Besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/01 - Optimalisasi Preferensi Langsung dari Video Model Multimodal Besar Dari Hadiah Model Bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 04/01 - DBRX, pretraining terus -menerus, hadiah, inferensi yang lebih cepat, dan banyak lagi
(Blog), - 04/01- Cosmicman: Model Yayasan Text-to-Image untuk Manusia
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/01 - Jaringan saraf yang sadar -kondisi untuk pembuatan gambar terkontrol
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/01 - Lebih Besar tidak selalu lebih baik: SCALING SIXIES dari model difusi laten
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 04/01 - Apakah model bahasa besar ahli kimia manusia super?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/31 - WAVLLM: Menuju model bahasa besar yang kuat dan adaptif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/31 - Bosan dengan plugin? Model bahasa besar bisa menjadi rekomendasi ujung ke ujung
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/30 - Survei tentang Pembelajaran Penguatan yang Ditingkatkan Model Bahasa Bahasa: Konsep, Taksonomi, dan Metode
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/30 - ST -LLM: Model bahasa besar adalah pelajar temporal yang efektif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 03/30- Pelatihan Noise-Aware dari Model Bahasa Layout-Aware
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/30 - Magritte: Realisasi 3D manipulatif dan generatif dari gambar, topview dan teks
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 03/30- Aurora-M: Model Red Bahasa Multilingual Sumber Terbuka Pertama Menurut US Executive Order
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29 - Deteksi Masalah yang Tidak Dapat Dipisahkan: Mengevaluasi Kepercayaan Model Bahasa Visi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29- Transformer-Lite: Penyebaran Efisiensi Tinggi Model Bahasa Besar di GPU Ponsel
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29- Snap-it, tap-it, splat-it: Tactile-Informed 3D Gaussian Splatting untuk merekonstruksi permukaan yang menantang
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29 - REALM: Resolusi referensi sebagai pemodelan bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29 - NVIDIA H200 GPUS CROBS MLPERF's LLM Inferencing Benchmark
(Berita), - 03/29 - Mambamixer: Model ruang negara selektif yang efisien dengan token ganda dan pemilihan saluran
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29 - LLAVA -GEMMA: Model Yayasan Multimodal Mempercepat Dengan Model Bahasa yang Kompak
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29- Instantsplat: Gaussian Sparse-View-View-Free Gaussian dalam 40 detik
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29 - tokek: Teks serbaguna yang disuling dari model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29 - Dijiang: Model bahasa besar yang efisien melalui kernelisasi kompak
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/29- DeepMind Develops Safe, aplikasi berbasis AI yang dapat memeriksa fakta
(Berita), - 03/29 - CTRL -SIM: Agen mengemudi yang reaktif dan dapat dikendalikan dengan pembelajaran penguatan offline
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/29 - Apakah kita berada di jalan yang benar untuk mengevaluasi model bahasa penglihatan yang besar?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/28 - SDPO: Jangan gunakan data Anda sekaligus
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/28 - Mesh2nerf: Pengawasan Jala Langsung untuk Representasi dan Generasi Lapangan Saraf Radiane
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/28 - menghafal paragraf melokalisasi dalam model bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/28 - Jamba: Model Bahasa Transformator Hibrida
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/28 - Gaussiancube: Menyusun Gaussian Splatting Menggunakan Transportasi Optimal untuk Pemodelan Generatif 3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/28 - Claude 3 menyalip GPT -4 dalam duel bot AI. Inilah cara ikut serta dalam aksinya
(Berita), - 03/28 - Mengumumkan Grok -1.5
(Blog), (demo), - 03/27 - Jalan menuju otonomi hukum: pendekatan yang dapat dioperasikan dan dapat dijelaskan untuk mengekstraksi, mengubah, memuat dan menghitung informasi hukum menggunakan model bahasa besar, sistem ahli dan jaringan Bayesian
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27 - VetaTar: Transformator Visi dengan resolusi apa pun
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27- Menuju Model Bahasa Inggris-Bahasa untuk Asisten Virtual di Perbaikan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27 - TextCrafor: Encoder teks Anda dapat menjadi pengontrol kualitas gambar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27 - ObjectDrop: Bootstrapping Counterfactuals untuk Penghapusan dan Penyisipan Objek Photorealistik
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27- Mini-Gemini: Menambang Potensi Model Bahasa Visi Multi-Modalitas
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/27 - Faktualitas bentuk panjang dalam model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/27 - Lita: Bahasa yang diinstruksikan Temporal -Localization Assistant
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/27 - Garment3dgen: 3D Garment Stylization and Texture Generation
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27 - Gamba: Menikah dengan Gaussian Splatting dengan Mamba untuk rekonstruksi 3D tampilan tunggal
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27- FLEXEDIT: Pengeditan gambar objek-sentris berbasis difusi fleksibel dan terkontrol
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/27 - Biomedlm: Model bahasa parameter 2.7b yang dilatih pada teks biomedis
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/26- Magis: Kerangka kerja multi-agen berbasis LLM untuk resolusi masalah gitub
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/26 - Ketidakefektifan yang tidak masuk akal dari lapisan yang lebih dalam
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/26- TC4D: Generasi Teks-ke-4D yang dikondisikan lintasan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/26- Octree-Gs: Menuju rendering real-time yang konsisten dengan Gaussians 3D terstruktur LOD
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/26- Memperkenalkan DBRX: LLM Open Open yang baru canggih
(Blog), - 03/26 - Laporan Teknis Internlm2
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/26- Meningkatkan konsistensi teks-ke-gambar melalui optimasi prompt otomatis
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/26- Perceptrons multi-lapisan yang sepenuhnya disatukan di Intel Data Center GPU
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/26 - Egolifter: Segmentasi 3D dunia terbuka untuk persepsi egosentris
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/26 - Aniportrait: Sintesis yang digerakkan oleh audio dari animasi potret fotorealistik
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/26 - 2D Gaussian Adul untuk bidang padie yang akurat secara geometris
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/25 - Menuju Evaluasi Otomatis untuk Kemampuan Klinis LLMS: Metrik, Data, dan Algoritma
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/25 - Repairagent: Agen berbasis LLM yang otonom untuk perbaikan program
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/25- RL Untuk model konsistensi: penghargaan yang lebih cepat memandu pembuatan teks-ke-gambar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/25- VP3D: Melepaskan Prompt Visual 2D untuk generasi Teks-ke-3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/25- Perjalanan: Pembelajaran residu temporal dengan noise gambar sebelum model difusi gambar-ke-video
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/25- SDXS: Model difusi laten satu langkah waktu-nyata dengan kondisi gambar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/25 - Sistem Operasi Agen LLM
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/25 - Flashface: Personalisasi citra manusia dengan pelestarian identitas kesetiaan tinggi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/25- DreamPolisher: Menuju Teks Kualitas Tinggi-ke-3D melalui difusi geometris
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/25- Be sendiri: Perhatian terikat untuk generasi teks-ke-gambar multi-subjek
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/23 - Saat pembuatan kode berbasis LLM memenuhi proses pengembangan perangkat lunak
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/22 - THESTASI: Menghasilkan aset 3D Tema -Aware dari beberapa contoh
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/22 - SIMBA: Arsitektur berbasis Mamba yang disederhanakan untuk Visi dan Seri Waktu Multivariat
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/22 - llm2llm: meningkatkan LLMS dengan peningkatan data iteratif baru
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/22- Latte3D: Sintesis Teks-Teks Terbaik Skala Besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/22 - InternDO2: Model Yayasan Video Penskalaan untuk Pemahaman Video Multimodal
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/22 - berikut: Mengevaluasi dan Mengajar Model Pengambilan Informasi untuk mengikuti instruksi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/22 - Dragapart: Mempelajari gerakan tingkat bagian sebelum objek yang diartikulasikan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/22 - Dapatkah model bahasa besar mengeksplorasi dalam konteks?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/22 - Allhands: Tanya saya apa pun dengan umpan balik kata demi kata skala besar melalui model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss) - 03/21 - Peergpt: Pencarian peran agen sebaya berbasis LLM sebagai moderator tim dan peserta dalam pembelajaran kolaboratif anak -anak
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - Stylecinegan: Generasi Cinemagraph Lansekap Menggunakan Stylegan Pra -Terlatih
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/21 - Streamingt2V: Generasi video panjang yang konsisten, dinamis, dan dapat diperpanjang dari teks
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/21 - Renoise: inversi gambar nyata melalui noising iteratif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - jalan lain untuk reklamasi: mengobrol dengan model bahasa generatif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - Rakutenai -7b: Memperluas model bahasa besar untuk bahasa Jepang
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - MYVLM: Personalisasi VLM untuk kueri khusus pengguna
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - Mathverse: Apakah LLM multi -modal Anda benar -benar melihat diagram dalam masalah matematika visual?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - GRM: Model Rekonstruksi Gaussian Besar untuk Rekonstruksi dan Generasi 3D yang efisien
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/21 - Majelis Umum Mengadopsi Resolusi Landmark tentang Kecerdasan Buatan
(Berita), - 03/21 - Frosting Gaussian: bidang padie kompleks yang dapat diedit dengan rendering waktu nyata
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - Eksploratif di antara waktu dan ruang
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21- Model difusi video yang efisien melalui dekomposisi gerak-laten bingkai konten
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21- Dreamreward: Text-to-3d Generasi dengan preferensi manusia
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/21 - COBRA: Memperluas Mamba ke Model Bahasa Multi -Modal untuk Inferensi yang Efisien
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/21 - Champ: Animasi gambar manusia yang dapat dikendalikan dan konsisten dengan panduan parametrik 3D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/21- anyv2V: Kerangka kerja plug-and-play untuk setiap tugas pengeditan video-ke-video
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20 - Pemetaan Lanskap Keamanan LLM: Proposal Penilaian Risiko Pemangku Kepentingan Komprehensif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20 - Zigma: Model Difusi Zigzag Mamba
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/20 - VSTAR: Keperawatan temporal generatif untuk sintesis video dinamis yang lebih panjang
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20 - RewardBench: Mengevaluasi Model Hadiah untuk Pemodelan Bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/20 - Pelatihan terbalik untuk merawat kutukan pembalikan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20- Radsplat: Gaussian Splatting Radiance-Informed Gaussian untuk rendering real-time yang kuat dengan 900+ fps
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20 - MORA: Mengaktifkan pembuatan video generalis melalui kerangka multi -agen
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/20 - LlamAfactory: Penyatuan efisien terpadu dari 100 Model Bahasa
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/20- IDAdapter: Belajar Fitur Campuran Untuk Menyetel Personalisasi Bebas-Bebas Model Teks-ke-Teks
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20 - Hyperllava: Tuning ahli visual dan bahasa dinamis untuk model bahasa multimodal besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/20 - Mengevaluasi Model Perbatasan untuk Kemampuan Berbahaya
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20 - DEPTHFM: Estimasi kedalaman monokular cepat dengan pencocokan aliran
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20 - Compress3D: Ruang laten terkompresi untuk generasi 3D dari satu gambar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/20- Be-your-outpainter: Menguasai Outpaining Video Melalui Adaptasi Spesifik Input
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/19 - Kapan kita tidak membutuhkan model penglihatan yang lebih besar?
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/19- VID2ROBOT: Pembelajaran kebijakan yang dikondisikan oleh video end-to-end dengan transformator lintas-perhatian
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19 - Menuju Model Yayasan Pakot Umum untuk Patologi Komputasi
() - 03/19- Texdreamer: Menuju Generasi Tekstur Manusia 3D Zero-Shot High-Shot
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19 - SceneScript: Rekonstruksi adegan dengan model bahasa terstruktur autoregresif
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19- Mplug-Docowl 1.5: Pembelajaran Struktur Terpadu untuk Pemahaman Dokumen Bebas OCR
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/19 - Magic Fixup: Memperampingkan pengeditan foto dengan menonton video dinamis
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19- llmlingua-2: distilasi data untuk kompresi cepat-agnostik yang efisien dan setia
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/19- GVGEN: Text-to-3d Generasi dengan representasi volumetrik
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19 - Gaussianflow: Dynamics Gaussian Splatting untuk Pembuatan Konten 4D
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19- Fresco: Korespondensi Spasial-Temporal untuk Terjemahan Video Zero-Shot
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/19- Fouriscale: Perspektif frekuensi tentang sintesis gambar resolusi tinggi bebas pelatihan
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/19 - Optimalisasi evolusioner resep penggabungan model
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), ([: octocat:] (https : //github.com/ sakanaai/evolutionary-model-merge)! [bintang repo github] (https://img.shields.io/github/stars/ sakanaai/evolutionary-model-merge? style = social))) - 03/19 - Comboverse: Pembuatan Aset 3D Komposisi Menggunakan Panduan Difusi Aware Spasial
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19 - Penalaran Berbasis Bagan: Mentransfer kemampuan dari LLM ke VLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19 - Apple's MM1: Model bahasa besar multimodal yang mampu menafsirkan kedua gambar dan data teks
(Berita), - 03/19- Animatediff-Lightning: Distilasi Difusi Model Cross
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/19 - Agen -Flan: Merancang data dan metode penyetelan agen yang efektif untuk model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/19 - Model Yayasan Bahasa Visual untuk Patologi Komputasi
(), (✳️) - 03/19 - Agen AI karakteristik melalui model bahasa besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), (! [Bintang repo github] ( https://img.shields.io/github/stars/nuaa-nlp/character100? style = social))) - 03/18 - Seberapa jauh kita dalam pengambilan keputusan LLMS? Mengevaluasi Kemampuan Permainan LLMS di lingkungan multi-agen
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/18 - VideoAgent: Agen multimodal yang beraugentasikan memori untuk pemahaman video
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/18 - VFUSION3D: Model generatif 3D yang dapat diskalakan dari model difusi video
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/18 - TNT -LLM: Penambangan Teks pada skala dengan model bahasa yang besar
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/18 - SV3D: Sintesis multi -view novel dan generasi 3D dari satu gambar menggunakan difusi video laten
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/18 - Routerbench: Benchmark untuk Sistem Routing Multi -Llm
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), (ss) - 03/18- Meta-Compompting untuk Mengotomatisasi Pengenalan Visual Zero-Shot Dengan LLMS
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/18 - LN3DIFF: Difusi bidang saraf laten yang dapat diskalakan untuk generasi 3D yang cepat
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/18- LLAVA-UHD: LMM yang merasakan rasio aspek dan gambar resolusi tinggi
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️), () - 03/18 - Larimar: Model bahasa besar dengan kontrol memori episodik
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/18- Infinite-ID: Personalisasi yang Diawetkan Identitas Melalui ID-Semantics Decoupling Paradigma
(), (), (?), (?), (?), (Html), (sl), (sp), (gs), (ss), (✳️) - 03/18 - GPT -4 Sebagai evaluator: mengevaluasi model bahasa besar pada manajemen hama di bidang pertanian
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Generic 3D Diffusion Adapter Using Controlled Multi-View Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/18 - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/18 - Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Compiler generated feedback for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/17 - PhD: A Prompted Visual Hallucination Evaluation Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/17 - MindEye2: Shared-Subject Models Enable fMRI-To-Image With 1 Hour of Data
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/16 - VisionCLIP: An Med-AIGC based Ethical Language-Image Foundation Model for Generalizable Retina Image Analysis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/16 - Do Large Language Models understand Medical Codes?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - VideoAgent: Long-form Video Understanding with Large Language Model as Agent
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Uni-SMART: Universal Science Multimodal Analysis and Research Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Trusting the Search: Unraveling Human Trust in Health Information from Google and ChatGPT
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - PERL: Parameter Efficient Reinforcement Learning from Human Feedback
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - NeuFlow: Real-time, High-accuracy Optical Flow Estimation on Robots Using Edge Devices
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - MusicHiFi: Fast High-Fidelity Stereo Vocoding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/15 - LightIt: Illumination Modeling and Control for Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Isotropic3D: Image-to-3D Generation Based on a Single CLIP Embedding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - FDGaussian: Fast Gaussian Splatting from Single Image via Geometric-aware Diffusion Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Enhancing Human-Centered Dynamic Scene Understanding via Multiple LLMs Collaborated Reasoning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - EfficientVMamba: Atrous Selective Scan for Light Weight Visual Mamba
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - DiPaCo: Distributed Path Composition
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Controllable Text-to-3D Generation via Surface-Aligned Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - WavCraft: Audio Editing and Generation with Natural Language Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Video Editing via Factorized Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Unlocking the conversion of Web Screenshots into HTML Code with the WebSight Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - StreamMultiDiffusion: Real-Time Interactive Generation with Region-Based Semantic Control
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Scaling Instructable Agents Across Many Simulated Worlds
(twitter), (Blog), - 03/14 - Recurrent Drafter for Fast Speculative Decoding in Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - LocalMamba: Visual State Space Model with Windowed Selective Scan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Large Language Models and Causal Inference in Collaboration: A Comprehensive Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Helpful or Harmful? Exploring the Efficacy of Large Language Models for Online Grooming Prevention
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Griffon v2: Advancing Multimodal Perception with High-Resolution Scaling and Visual-Language Co-Referring
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - GPT on a Quantum Computer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/14 - Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - GiT: Towards Generalist Vision Transformer through Universal Language Interface
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Exploring the Capabilities and Limitations of Large Language Models in the Electric Energy Sector
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - 3D-VLA: A 3D Vision-Language-Action Generative World Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Scaling Instructable Agents Across Many Simulated Worlds
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/13 - VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - The Human Factor in Detecting Errors of Large Language Models: A Systematic Literature Review and Future Research Directions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - SOTOPIA-π: Interactive Learning of Socially Intelligent Language Agents
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Simple and Scalable Strategies to Continually Pre-train Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Scaling Up Dynamic Human-Scene Interaction Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Language-based game theory in the age of artificial intelligence
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Language models scale reliably with over-training and on downstream tasks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Knowledge Conflicts for LLMs: A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Gemma: Open Models Based on Gemini Research and Technology
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Cultural evolution in populations of Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Bugs in Large Language Models Generated Code: An Empirical Study
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Synth^2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - MoAI: Mixture of All Intelligence for Large Language and Vision Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - Learning Generalizable Feature Fields for Mobile Manipulation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - DragAnything: Motion Control for Anything using Entity Representation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Chronos: Learning the Language of Time Series
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Transparent AI Disclosure Obligations: Who, What, When, Where, Why, How
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - HILL: A Hallucination Identifier for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - FAX: Scalable and Differentiable Federated Primitives in JAX
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - FashionReGen: LLM-Empowered Fashion Report Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/11 - VideoMamba: State Space Model for Efficient Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - V3D: Video Diffusion Models are Effective 3D Generators
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Stealing Part of a Production Language Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - Multistep Consistency Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/11 - Chain-of-table: Evolving tables in the reasoning chain for table understanding (Blog),
- 03/11 - An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/10 - VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/09 - Algorithmic progress in language models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - On Protecting the Data Privacy of Large Language Models (LLMs): A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/08 - VideoElevator: Elevating Video Generation Quality with Versatile Text-to-Image Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - DeepSeek-VL: Towards Real-World Vision-Language Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/08 - CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Now available on Poe: Claude 3 (Demo),
- 03/08 - Google - Health-specific embedding tools for dermatology and pathology (Blog),
- 03/07 - Yi: Open Foundation Models by 01.AI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - Teaching Large Language Models to Reason with Reinforcement Learning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - StableDrag: Stable Dragging for Point-based Image Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Pix2Gif: Motion-Guided Diffusion for GIF Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Meet 'Liberated Qwen', an uncensored LLM that strictly adheres to system prompts (News),
- 03/07 - LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - KAIST develops next-generation ultra-low power LLM accelerator (News),
- 03/07 - Inflection-2.5: meet the world's best personal AI (News),
- 03/07 - How Far Are We from Intelligent Visual Deductive Reasoning?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - Evaluating LLM models at scale (Blog),
- 03/07 - Common 7B Language Models Already Possess Strong Math Capabilities
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - Stop Regressing: Training Value Functions via Classification for Scalable Deep RL
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - ShortGPT: Layers in Large Language Models are More Redundant Than You Expect
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - SaulLM-7B: A pioneering Large Language Model for Law
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - NY hospital exec: Multimodal LLM assistants will create a “paradigm shift” in patient care (News),
- 03/06 - Learning to Decode Collaboratively with Multiple Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/06 - Enhancing Vision-Language Pre-training with Rich Supervisions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - Backtracing: Retrieving the Cause of the Query
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/06 - AI Prompt Engineering Is Dead (News),
- 03/06 - 3D Diffusion Policy
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/05 - OpenAI and Elon Musk (Blog),
- 03/05 - Caduceus: Bi-Directional Equivariant Long-Range DNA Sequence Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/05 - WikiTableEdit: A Benchmark for Table Editing by Natural Language Instruction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Updating the Minimum Information about CLinical Artificial Intelligence (MI-CLAIM) checklist for generative modeling research (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/05 - Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - RT-Sketch: Goal-Conditioned Imitation Learning from Hand-Drawn Sketches (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - Revisiting Meta-evaluation for Grammatical Error Correction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - MathScale: Scaling Instruction Tuning for Mathematical Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/05 - Interactive Continual Learning: Fast and Slow Thinking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - In Search of Truth: An Interrogation Approach to Hallucination Detection (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ImgTrojan: Jailbreaking Vision-Language Models with ONE Image (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Generative Software Engineering (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Feast Your Eyes: Mixture-of-Resolution Adaptation for Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Exploring the Limitations of Large Language Models in Compositional Relation Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Design2Code: How Far Are We From Automating Front-End Engineering? (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ChatGPT and biometrics: an assessment of face recognition, gender detection, and age estimation capabilities (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ChatCite: LLM Agent with Human Workflow Guidance for Comparative Literature Summary (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Benchmarking the Text-to-SQL Capability of Large Language Models: A Comprehensive Evaluation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - An Empirical Study of LLM-as-a-Judge for LLM Evaluation: Fine-tuned Judge Models are Task-specific Classifiers (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 3/5 - OpenAI - ChatGPT can now read responses to you. (twitter,
- 03/04 - The Claude 3 Model Family: Opus, Sonnet, Haiku
() (twitter), , (✳️) - 03/04 - Wukong: Towards a Scaling Law for Large-Scale Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - Large language models surpass human experts in predicting neuroscience results
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/04 - NoteLLM: A Retrievable Large Language Model for Note Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - MagicClay: Sculpting Meshes With Generative Neural Fields (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/04 - Enhancing LLM Safety via Constrained Direct Preference Optimization (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/04 - CODE-ACCORD: A Corpus of Building Regulatory Data for Rule Generation towards Automatic Compliance Checking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/04 - Balancing Enhancement, Harmlessness, and General Capabilities: Enhancing Conversational LLMs with Direct RLHF (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - adaptMLLM: Fine-Tuning Multilingual Language Models on Low-Resource Languages with Integrated LLM Playgrounds (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 3/4 - ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - TripoSR: Fast 3D Object Reconstruction from a Single Image (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - RT-H: Action Hierarchies Using Language (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/4 - ResAdapter: Domain Consistent Resolution Adapter for Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/4 - OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - Build AI for a Better Future (twitter), (News),
- 3/4 - AtomoVideo: High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 03/03 - Research Papers in February 2024: A LoRA Successor, Small Finetuned LLMs Vs Generalist LLMs, and Transparent LLM Research (Blog),
- 3/3 - Nvidia CEO Jensen Huang says AI could pass most human tests in 5 years (News
- 3/3 - MovieLLM: Enhancing Long Video Understanding with AI-Generated Movies (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/3 - InfiMM-HD: A Leap Forward in High-Resolution Multimodal Understanding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/3 - Could this be bigger than OpenAI? Microsoft invests billions in French startup — Mistral AI is a multilingual maestro that's almost as good as ChatGPT 4 (News),
- 3/3 - 3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/2 - Nvidia CEO says AI could pass human tests in five years (News
- 3/1 - Elon Musk sues OpenAI and CEO Sam Altman over contract breach (News)
- 3.1 - AtP*: An efficient and scalable method for localizing LLM behaviour to components (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - VisionLLaMA: A Unified LLaMA Interface for Vision Tasks (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Learning and Leveraging World Models in Visual Representation Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - RealCustom: Narrowing Real Text Word for Real-Time Open-Domain Text-to-Image Customization (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Resonance RoPE: Improving Context Length Generalization of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/29 - OHTA: One-shot Hand Avatar via Data-driven Implicit Priors
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/29 - Retrieval-Augmented Generation for AI-Generated Content: A Survey (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 2.29 - DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Humanoid Locomotion as Next Token Prediction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - StarCoder 2 and The Stack v2: The Next Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Trajectory Consistency Distillation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.29 - Beyond Language Models: Byte Models are Digital World Simulators (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Syntactic Ghost: An Imperceptible General-purpose Backdoor Attacks on Pre-trained Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - ViewFusion: Towards Multi-View Consistency via Interpolated Denoising (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.29 - MOSAIC: A Modular System for Assistive and Interactive Cooking (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 02/28 - Automatic Creative Selection with Cross-Modal Matching
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 2.28 - Priority Sampling of Large Language Models for Compilers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.28 - Simple linear attention language models balance the recall-throughput tradeoff (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.28 - Approaching Human-Level Forecasting with Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.28 - Datasets for Large Language Models: A Comprehensive Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.28 - A Survey on Recent Advances in LLM-Based Multi-turn Dialogue Systems (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 02/27 - A High Level Guide to LLM Evaluation Metrics (Blog),
- 2/27 - Users Say Microsoft's AI Has Alternate Personality as Godlike AGI That Demands to Be Worshipped (News)
- 2/27 - Google DeepMind CEO on AGI, OpenAI and Beyond – MWC 2024 (News)
- 2.27 - Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - Towards Optimal Learning of Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Evaluating Very Long-Term Conversational Memory of LLM Agents (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Training-Free Long-Context Scaling of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Sora Generates Videos with Stunning Geometrical Consistency (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Playground v2.5: Three Insights towards Enhancing Aesthetic Quality in Text-to-Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - Video as the New Language for Real-World Decision Making (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 02/27 - On the Societal Impact of Open Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/26 - Set the Clock: Temporal Alignment of Pretrained Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 2/26 - DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models (), ()(?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/26 - Mistral Large is our flagship model, with top-tier reasoning capacities (News)
- 2.26 - Disentangled 3D Scene Generation with Layout Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Multi-LoRA Composition for Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.26 - Do Large Language Models Latently Perform Multi-Hop Reasoning? (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Nemotron-4 15B Technical Report (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - StructLM: Towards Building Generalist Models for Structured Knowledge Grounding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Towards Open-ended Visual Quality Comparison (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.25 - ChatMusician: Understanding and Generating Music Intrinsically with LLM (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.25 - FuseChat: Knowledge Fusion of Chat Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/24 - Divide-or-Conquer? Which Part Should You Distill Your LLM?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/24 - Perplexity.ai Revamps Google SEO Model For LLM Era (News)
- 02/24 - Data Interpreter: An LLM Agent For Data Science
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 2.24 - Empowering Large Language Model Agents through Action Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 2.23 - Seamless Human Motion Composition with Blended Positional Encodings (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.23 - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 2.23 - Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.23 - API-BLEND: A Comprehensive Corpora for Training and Benchmarking API LLMs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - Genie: Generative Interactive Environments (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - GPTVQ: The Blessing of Dimensionality for LLM Quantization (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.22 - CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️), ()
- 02/22 - Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 2.22 - Divide-or-Conquer? Which Part Should You Distill Your LLM? (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - Watermarking Makes Language Models Radioactive (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - AutoPrompt - prompt optimization framework ()
- 2.22 - Announcing Stable Diffusion 3 (tweet), (blog)
- 2.22 - DualFocus: Integrating Macro and Micro Perspectives in Multi-modal Large Language Models (), (), (?), (?), (?), (HTML), (✳️) , ()
- 2.22 - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - LLMs with Industrial Lens: Deciphering the Challenges and Prospects -- A Survey (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Vision-Language Navigation with Embodied Intelligence: A Survey (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Enhancing Robotic Manipulation with AI Feedback from Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Do Machines and Humans Focus on Similar Code? Exploring Explainability of Large Language Models in Code Summarization (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - PALO: A Polyglot Large Multimodal Model for 5B People (), (), (?), (?), (?), (HTML), (✳️) , ()
- 2.22 - GeneOH Diffusion: Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion (), (), ([:paperclip:](https://arxiv.org/pdf/2402.148