الجدول الزمني لـ ChatGPT وGenerativeAI وLLMs
ينظم هذا المستودع جدولًا زمنيًا للأحداث الرئيسية (المنتجات والخدمات والأبحاث وGitHub ومنشورات المدونات والأخبار) التي حدثت قبل إعلان ChatGPT وبعده.
إنها تنظم مجموعة متنوعة من المعلومات في هذا الجدول الزمني، مع التركيز بشكل خاص على LLM والذكاء الاصطناعي التوليدي.
ربما يكون مشهدًا من أهم الأحداث في التاريخ، لذلك اعتقدت أنه سيكون من المهم الحفاظ على تلك الذكريات جيدًا، لذلك قمت بتنظيمها.
إحصائيات
تم إنشاء هذه المخططات بواسطة مترجم الكود الخاص بـ ChatGPT.
المساهمة
تحظى القضايا وطلبات السحب بتقدير كبير. إذا لم تساهم مطلقًا في مشروع مفتوح المصدر قبل ذلك، يسعدني جدًا أن أرشدك إلى كيفية إنشاء طلب سحب.
يمكنك البدء بفتح مشكلة تصف المشكلة التي تريد حلها وسنبدأ من هناك.
الرموز التعبيرية
arXiv , PDF ?, arxiv-vanity ?, صفحة ورقية ?, أوراق بالكود ✳️, Github
رخصة
تم ترخيص هذه الوثيقة بموجب ترخيص معهد ماساتشوستس للتكنولوجيا © Jonghong Jeon(전종홍)
الجدول الزمني V2
2024
- 17/05 - أبرمت شركة OpenAI صفقة Reddit لتدريب الذكاء الاصطناعي الخاص بها على منشوراتك
(أخبار)، - 17/05 - حل OpenAI الفريق الذي يركز على مخاطر الذكاء الاصطناعي طويلة المدى، بعد أقل من عام من الإعلان عنه
(أخبار)، - 17/05 - التقرير العلمي الدولي حول سلامة الذكاء الاصطناعي المتقدم
(مدونة)، - 16/05 - TRANSIC: نقل سياسة Sim إلى Real من خلال التعلم من التصحيح عبر الإنترنت
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 16/05 - Toon3D: رؤية الرسوم المتحركة من منظور جديد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 16/05 - اختبار موثوقية نموذج لغوي كبير قائم على الذكاء الاصطناعي لاستخراج المعلومات البيئية من المؤلفات العلمية
(أخبار)، - 16/05 - التعلم في سياق اللقطات المتعددة في نماذج الأساس متعدد الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 16/05 - كيفية إيقاف الذكاء الاصطناعي مؤقتًا قبل فوات الأوان
(أخبار)، - 05/16 - التأريض DINO 1.5: تطوير "حافة" اكتشاف الكائنات المفتوحة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 16/05 - التعدين والتحليل في متجر GPT
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/16 - Dual3D: إنشاء تحويل نصي إلى ثلاثي الأبعاد يتسم بالكفاءة والاتساق مع النشر الكامن متعدد العرض ثنائي الوضع
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/16 - الحرباء: نماذج الأساس المختلطة ذات الاندماج المبكر
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 16/05 - CAT3D: قم بإنشاء أي شيء ثلاثي الأبعاد باستخدام نماذج نشر العرض المتعدد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/15 - Xmodel-VLM: خط أساس بسيط لنموذج لغة الرؤية متعددة الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 15/05 - LoRA تتعلم أقل وتنسى أقل
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 15/05 - ستساعد العلامة المائية غير المرئية التي تعمل بالذكاء الاصطناعي من Google في تحديد النصوص والفيديوهات الإبداعية
(أخبار)، - 15/05 - مؤتمر Google I/O 2024: الإعلان عن كل شيء
(مدونة)، - 15/05 - مجموعة رؤية السلوك: إنشاء مجموعة بيانات قابلة للتخصيص عبر المحاكاة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/15 - جبال الألب: الكشف عن القدرة على التخطيط للتعلم الانحداري الذاتي في نماذج اللغة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 14/05 - فهم فجوة الأداء بين خوارزميات المحاذاة المتصلة بالإنترنت وغير المتصلة بالإنترنت
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/14 - SpeechVerse: نموذج لغة صوتية واسع النطاق قابل للتعميم
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/14 - SpeechGuard: استكشاف المتانة التنافسية لنماذج اللغات الكبيرة متعددة الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 14/05 - لا يوجد وقت لإضاعة الوقت: قم بضغط الوقت في القناة لفهم فيديو الهاتف المحمول
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/14 - Hunyuan-DiT: محول نشر قوي متعدد الدقة مع فهم صيني دقيق
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 14/05 - إنشاء تحويل النص إلى صورة تركيبيًا باستخدام تمثيلات النقطة الكثيفة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/14 - ما وراء قوانين القياس: فهم أداء المحولات مع الذاكرة الترابطية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 13/05 - SambaNova SN40L: توسيع نطاق جدار ذاكرة الذكاء الاصطناعي باستخدام تدفق البيانات وتكوين الخبراء
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 13/05 - سير عمل RLHF: من نمذجة المكافآت إلى RLHF عبر الإنترنت
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 13/05 - Plot2Code: معيار شامل لتقييم نماذج اللغات الكبيرة متعددة الوسائط في إنشاء التعليمات البرمجية من المؤامرات العلمية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 13/05 - كشفت OpenAI عن أحدث طراز للذكاء الاصطناعي، GPT-4o
(أخبار)، - 13/05 - بحث الويب MS MARCO: مجموعة بيانات ويب غنية بالمعلومات واسعة النطاق مع ملايين من علامات النقر الحقيقية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 13/05 - ما حجم الأبحاث التي يتم كتابتها بواسطة النماذج اللغوية الكبيرة؟
(مدونة)، - 13/05 - مرحبًا GPT-4o
(مدونة)، - 13/05 - Coin3D: إنشاء أصول ثلاثية الأبعاد يمكن التحكم فيها وتفاعلية مع تكييف موجه بالوكيل
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 11/05 - Piccolo2: تضمين النص العام مع التدريب على فقدان البيانات المختلط متعدد المهام
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 11/05 - LogoMotion: إنشاء أكواد برمجية مؤرضة بصريًا للرسوم المتحركة المدركة للمحتوى
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/10 - INSPECT - إطار عمل مفتوح المصدر لتقييم نماذج اللغة الكبيرة
(مدونة)، - 10/05 - أصدر معهد سلامة الذكاء الاصطناعي منصة جديدة لتقييم سلامة الذكاء الاصطناعي
(أخبار)، - 05/07 - SUTRA: بنية نموذجية متعددة اللغات قابلة للتطوير
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/07 - الإصدارات التعريفية Llama 3 مفتوحة المصدر LLM
(أخبار)، - 05/03 - ما الذي يهم عند بناء نماذج لغة الرؤية؟
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/02 - WildChat: مليون سجل تفاعل لـ ChatGPT في البرية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/02 - StoryDiffusion: الاهتمام الذاتي المتسق لتوليد الصور والفيديو طويلة المدى
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/02 - بروميثيوس 2: نموذج لغة مفتوح المصدر متخصص في تقييم نماذج اللغات الأخرى
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/02 - NeMo-Aligner: مجموعة أدوات قابلة للتطوير لمحاذاة النماذج بكفاءة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/02 - LLM-AD: نظام الوصف الصوتي القائم على نموذج اللغة الكبير
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/02 - اللهب: التوافق المدرك للواقع لنماذج اللغات الكبيرة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/02 - تخصيص نماذج تحويل النص إلى صورة باستخدام زوج صورة واحد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/01 - الحقول الغاوسية المشذبة طيفيًا مع التعويض العصبي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/01 - تحسين تفضيلات التشغيل الذاتي لمحاذاة نموذج اللغة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/01 - هل حجم دفعة التحرير الأكبر هو الأفضل دائمًا؟ -- دراسة تطبيقية على تحرير النموذج باستخدام اللاما-3
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/01 - البرسيم: فك التشفير التأملي الخفيف الوزن مع المعرفة التسلسلية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 05/01 - فحص دقيق لأداء نموذج اللغة الكبير في الحساب بالمدرسة الابتدائية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 30/04 - مدقق الحقائق المرئي: تمكين إنشاء التسميات التوضيحية التفصيلية عالية الدقة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - STT: تتبع الحالة مع المحولات للقيادة الذاتية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - SemantiCodec: برنامج ترميز الصوت الدلالي ذو معدل البت المنخفض جدًا للصوت العام
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 30/04 - الأخطبوط الإصدار 4: رسم بياني لنماذج اللغة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - MotionLCM: توليد الحركة التي يمكن التحكم فيها في الوقت الفعلي عبر نموذج الاتساق الكامن
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 30/04 - MicroDreamer: إنشاء ثلاثي الأبعاد بدون لقطة في sim20 ثانية من خلال إعادة البناء التكراري القائم على النتيجة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 30/04 - Lightplane: مكونات قابلة للتطوير بدرجة عالية للمجالات العصبية ثلاثية الأبعاد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 30/04 - كان: شبكات كولموجوروف-أرنولد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - تحسين تفضيلات الاستدلال التكراري
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - غرزة غير مرئية: إنشاء مشاهد ثلاثية الأبعاد سلسة مع رسم عميق
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 30/04 - InstantFamily: اهتمام مقنع لإنشاء صور ذات معرفات متعددة بدون لقطة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - GS-LRM: نموذج إعادة بناء كبير للرش الغاوسي ثلاثي الأبعاد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - توسيع سياق Llama-3 عشرة أضعاف بين عشية وضحاها
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/30 - DOCCI: أوصاف الصور المتصلة والمتناقضة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 30/04 - نماذج لغات كبيرة أفضل وأسرع عبر التنبؤ متعدد الرموز
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/29 - القلم: اختيار المحول التلقائي لنماذج الانتشار
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/29 - SAGS: الرش الغاوسي ثلاثي الأبعاد المدرك للهيكل
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/29 - استبدال القضاة بهيئات المحلفين: تقييم أجيال LLM من خلال لجنة من النماذج المتنوعة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/29 - ملف تعريف الذكاء الاصطناعي التوليدي NIST AI RMF
(أخبار)، - 04/29 - LoRA Land: 310 LLMs مضبوطة بدقة تنافس GPT-4، تقرير فني
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 29/04 - الكنغر: فك تشفير التأمل الذاتي بدون فقدان عبر الخروج المبكر المزدوج
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 29/04 - قدرات نماذج الجوزاء في الطب
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 28/04 - الطلاء باستخدام Inpaint: تعلم إضافة كائنات الصور عن طريق إزالتها أولاً
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/28 - LEGENT: منصة مفتوحة للعملاء المتجسدين
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 27/04 - Ag2Manip: تعلم مهارات التلاعب الجديدة من خلال التمثيلات البصرية والحركية اللاأدرية للفاعل
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/26 - MaPa: رسم المواد الواقعية المستندة إلى النص للأشكال ثلاثية الأبعاد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 26/04 - BlenderAlchemy: تحرير الرسومات ثلاثية الأبعاد باستخدام نماذج لغة الرؤية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 25/04 - التقرير الفني لشركة Tele-FLM
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/25 - SEED-Bench-2-Plus: قياس نماذج اللغات الكبيرة متعددة الوسائط مع الفهم البصري الغني بالنص
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 25/04 - إعادة النظر في تقييم تحويل النص إلى صورة باستخدام Gecko: حول المقاييس والمطالبات والتقييمات البشرية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/25 - PLLaVA: امتداد LLaVA بدون معلمات من الصور إلى مقاطع الفيديو للتسميات التوضيحية الكثيفة للفيديو
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/25 - اجعل برنامج LLM الخاص بك يستفيد من السياق بشكل كامل
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/25 - قائمة العناصر واحدًا تلو الآخر: مصدر بيانات جديد ونموذج تعليمي لطلاب ماجستير إدارة الأعمال متعدد الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 25/04 - تخطي الطبقة: تمكين استنتاج الخروج المبكر وفك تشفير التأمل الذاتي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 25/04 - Interactive3D: قم بإنشاء ما تريده من خلال الجيل التفاعلي ثلاثي الأبعاد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/25 - إلى أي مدى وصلنا إلى GPT-4V؟ سد الفجوة أمام النماذج التجارية متعددة الوسائط بأجنحة مفتوحة المصدر
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/25 - ConsistentID: إنشاء الصور الشخصية مع الحفاظ على الهوية الدقيقة متعددة الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - XC-Cache: الحضور المتبادل للسياق المخزن مؤقتًا لاستدلال LLM فعال
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - أخلاقيات مساعدي الذكاء الاصطناعي المتقدم
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - PuLID: تخصيص معرف Pure وLightning عبر المحاذاة المتباينة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - NeRF-XL: قياس NeRFs باستخدام وحدات معالجة الرسومات المتعددة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - MotionMaster: نقل حركة الكاميرا بدون تدريب لإنشاء الفيديو
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - MoDE: خبراء بيانات CLIP عبر التجميع
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - MMT-Bench: معيار شامل متعدد الوسائط لتقييم نماذج لغة الرؤية الكبيرة نحو الذكاء الاصطناعي العام متعدد المهام
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 24/04 - MaGGIe: حصيرة المثيلات البشرية التدريجية المقنعة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - ID-Aligner: تعزيز عملية إنشاء النص إلى صورة والحفاظ على الهوية من خلال التعلم بالملاحظات والمكافآت
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - عناصر الصورة القابلة للتحرير للتوليف الذي يمكن التحكم فيه
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/24 - CatLIP: دقة التعرف البصري على مستوى CLIP مع تدريب مسبق أسرع بمقدار 2.7 مرة على بيانات الصور والنص على نطاق الويب
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 24/04 - BASS: أخذ العينات التأملية المُحسَّنة للانتباه المجمع
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 23/04 - يمكن للمحولات تمثيل نماذج لغة n-gram
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 23/04 - التقرير الفني لـ Pegasus-v1
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/23 - مزيج من الخبراء متعددي الرؤوس
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/23 - FlashSpeech: تركيب خطاب فعال بدون طلقة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - SnapKV: LLM يعرف ما تبحث عنه قبل الجيل
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - SEED-X: نماذج متعددة الوسائط ذات فهم وإنشاء موحد متعدد التفاصيل
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - إعادة بناء تنسيق المشهد: تحديد موضع مجموعات الصور من خلال التعلم المتزايد لمُعيد تحديد الموقع
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 22/04 - التقرير الفني لـ Phi-3: نموذج لغة عالي الكفاءة محليًا على هاتفك
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - OpenELM: عائلة نماذج لغوية فعالة مع إطار تدريب واستدلال مفتوح المصدر
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - MultiBooth: نحو توليد كل مفاهيمك في صورة من النص
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - تعلم التحكم في الحركة H-Infinity
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - ما مدى جودة نماذج LLaMA3 ذات الكمية المنخفضة؟ دراسة تجريبية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - قم بمحاذاة خطواتك: تحسين جداول أخذ العينات في نماذج الانتشار
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/22 - وكيل تفسير آلي متعدد الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/21 - Hyper-SD: نموذج الاتساق المجزأ للمسار لتركيب الصور بكفاءة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/21 - AdvPrompter: مطالبة الخصومة التكيفية السريعة لطلاب LLM
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/20 - نماذج تناسق الموسيقى
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - التسلسل الهرمي للتعليمات: تدريب ماجستير إدارة الأعمال على تحديد أولويات التعليمات المميزة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - TextSquare: توسيع نطاق ضبط التعليمات المرئية التي تركز على النص
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - PhysDreamer: التفاعل القائم على الفيزياء مع الكائنات ثلاثية الأبعاد عبر إنشاء الفيديو
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - LLM-R2: نظام إعادة كتابة معزز قائم على القواعد لنموذج لغة كبير لتعزيز كفاءة الاستعلام
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - ما مدى حقيقة الأمر؟ إطار التقييم البشري لأمثلة الخصومة غير المقيدة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - إلى أي مدى يمكننا المضي قدمًا في إصلاح البرنامج العملي على مستوى الوظيفة؟
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - Groma: الترميز المرئي المحلي لتأريض نماذج اللغات الكبيرة متعددة الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - هل تحتاج عملية Gaussian Splatting إلى تهيئة SFM؟
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/19 - AutoCrawler: وكيل ويب ذو فهم تقدمي لإنشاء زاحف الويب
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - TriForce: تسريع بدون فقدان لتوليد تسلسل طويل مع فك التشفير التأملي الهرمي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 18/04 - نحو التحسين الذاتي لماجستير القانون من خلال الخيال والبحث والنقد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 18/04 - إعادة استخدام مكافآتك: نقل نموذج المكافأة لمحاذاة اللغات الصفرية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - Reka Core وFlash وEdge: سلسلة من نماذج اللغات القوية متعددة الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - OpenBezoar: نماذج صغيرة وفعالة من حيث التكلفة ومفتوحة مدربة على مزيج من بيانات التعليمات
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - MeshLRM: نموذج إعادة بناء كبير لشبكة عالية الجودة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - تقديم الإصدار 0.5 من معيار أمان الذكاء الاصطناعي من MLCommons
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - تقديم Meta Llama 3: ماجستير إدارة الأعمال الأكثر قدرة والمتاح بشكل مفتوح حتى الآن
(مدونة)، - 04/18 - EdgeFusion: إنشاء تحويل النص إلى صورة على الجهاز
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - وميض: نماذج اللغات الكبيرة متعددة الوسائط يمكنها الرؤية ولكن لا يمكنها الإدراك
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/18 - AniClipart: الرسوم المتحركة المرسومة مع مقدمات تحويل النص إلى الفيديو
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/17 - وزارة الزراعة: مزيج من الاهتمام لتفكيك سياق الموضوع في إنشاء الصور الشخصية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/17 - FlowMind: إنشاء سير العمل تلقائيًا باستخدام LLMs
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 17/04 - الطباعة الديناميكية: إضفاء الحيوية على الكلمات
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/17 - واجهة برمجة التطبيقات Stable Diffusion 3 متاحة الآن
(تويتر)، (مدونة)، (تجريبي)، - 04/16 - VASA-1: وجوه ناطقة تعتمد على الصوت يتم إنشاؤها في الوقت الفعلي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/16 - وزيرة التجارة الأمريكية جينا ريموندو تعلن عن توسيع فريق قيادة معهد سلامة الذكاء الاصطناعي الأمريكي
(أخبار)، - 16/04 - توليد الموسيقى الطويلة مع الانتشار الكامن
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/15 - مقيمو LLM يتعرفون على أجيالهم ويفضلونها
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/15 - Video2Game: بيئة تفاعلية وواقعية ومتوافقة مع المتصفح في الوقت الفعلي من فيديو واحد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 15/04 - Tango 2: محاذاة أجيال تحويل النص إلى الصوت القائمة على الانتشار من خلال تحسين التفضيلات المباشرة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 15/04 - نموذج ترويض الانتشار الكامن لرسم مجال الإشعاع العصبي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 15/04 - يمكن لـ Opus أن تعمل كآلة تورينج
(تغريد)، - 15/04 - MathGPT: الاستفادة من Llama 2 لإنشاء منصة للتعلم المخصص للغاية
- 04/15 - HQ-Edit: مجموعة بيانات عالية الجودة لتحرير الصور بناءً على التعليمات
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/15 - Ctrl-Adapter: إطار عمل فعال ومتعدد الاستخدامات لتكييف عناصر التحكم المتنوعة مع أي نموذج نشر
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 15/04 - يمثل الضغط الذكاء خطيًا
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/15 - CompGS: تمثيل فعال للمشهد ثلاثي الأبعاد عبر الرش الغاوسي المضغوط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/14 - TextHawk: استكشاف الإدراك الدقيق والفعال لنماذج اللغات الكبيرة متعددة الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 13/04 - عضلات كاثي وود في ازدهار ChatGPT مع حصة OpenAI الجديدة
(أخبار)، - 04/12 - القياس (للأسفل) CLIP: تحليل شامل للبيانات والهندسة المعمارية واستراتيجيات التدريب
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 12/04 - اختبار الوعي ثلاثي الأبعاد لنماذج الأساس البصري
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 12/04 - تدريب LMs ذو القاعدة الصغيرة مسبقًا باستخدام عدد أقل من الرموز
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/12 - حول قوة التوجيه اللغوي لمهام الرؤية منخفضة المستوى: نتائج تقدير العمق
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 12/04 - MonoPatchNeRF: تحسين مجالات الإشعاع العصبي باستخدام التوجيه الأحادي القائم على التصحيح
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 12/04 - ميجالودون: التدريب المسبق والاستدلال الفعال في LLM مع طول سياق غير محدود
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/12 - هل يقوم ChatGPT بتغيير أسلوب الكتابة لدى الأكاديميين؟
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/12 - جوز الهند: تحديث تجزئة COCO
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 12/04 - شريحة الذكاء الاصطناعي تخفض ميزانية الطاقة بنسبة تزيد عن 99 بالمائة
(أخبار)، - 04/12 - AdaptorSwap: التدريب المستمر لحاملي شهادة الماجستير في إدارة البيانات مع ضمانات إزالة البيانات والتحكم في الوصول
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/12 - معاينة رؤية Grok-1.5
(تجريبي)، - 12/04 - الخير والشر والدبوس الإنساني
(أخبار)، - 12/04 - يمكن الآن لمستخدمي ChatGPT المدفوع الوصول إلى GPT-4 Turbo
(تويتر)، (أخبار)، ، () - 04/11 - ضرورة مجالس معايير التدقيق المعتمدة على الذكاء الاصطناعي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/11 - محول التذكر للتعلم المستمر
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 11/04 - أمازون تضيف أندرو إنج، أحد الأصوات الرائدة في مجال الذكاء الاصطناعي، إلى مجلس إدارتها
(أخبار)، - 11/04 - تقوم Adobe بشراء مقاطع فيديو مقابل 3 دولارات للدقيقة لبناء نموذج الذكاء الاصطناعي
(أخبار)، - 04/11 - UltraEval: منصة خفيفة الوزن للتقييم المرن والشامل لطلبة ماجستير إدارة الأعمال
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/11 - الكفاءة المبدئية والقابلة للتحويل لتجزئة المفردات المفتوحة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/11 - وكيل سويس
(تويتر)، (تجريبي)، ، () - 04/11 - لانيفورمر متفرق
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - Rho-1: ليست كل الرموز هي ما تحتاجه
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/11 - ResearchAgent: توليد أفكار بحثية متكررة عبر المؤلفات العلمية باستخدام نماذج لغوية كبيرة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - RecurrentGemma: تجاوز المحولات السابقة لنماذج لغة مفتوحة فعالة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - OSWorld: قياس أداء وكلاء الوسائط المتعددة للمهام المفتوحة في بيئات الكمبيوتر الحقيقية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - LLoCO: تعلم السياقات الطويلة دون اتصال بالإنترنت
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - الاستفادة من نماذج اللغات الكبيرة (LLMs) لدعم الشرح التعاوني لبيانات المخاطر عبر الإنترنت بين الإنسان والذكاء الاصطناعي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 11/04 - JetMoE: الوصول إلى أداء Llama2 بمبلغ 0.1 مليون دولار
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) (مشروع)، (تويتر)، ، (✳️)، () - 11/04 - HGRN2: شبكات RNN الخطية المسورة مع توسيع الحالة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/11 - من الكلمات إلى الأرقام: نموذجك اللغوي الكبير يعد تراجعًا قادرًا سرًا عند إعطائه أمثلة في السياق
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 11/04 - Ferret-v2: خط أساس محسّن للإحالة والتأريض باستخدام نماذج اللغات الكبيرة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - ControlNet++: تحسين عناصر التحكم الشرطية من خلال تعليقات فعالة متسقة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - الكشف عن شذوذ الفيديو المدرك للسياق في مجموعات البيانات طويلة المدى
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 11/04 - ChatGPT-3.5، Claude 3 يركلان مؤخرتهما في بطولة Street Fighter III لـ LLMs
(أخبار)، - 04/11 - يمكن لـ ChatGPT التنبؤ بالمستقبل عندما يروي قصصًا تدور أحداثها في المستقبل عن الماضي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - أفضل الممارسات والدروس المستفادة بشأن البيانات الاصطناعية لنماذج اللغة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 11/04 - ماجستير في القانون المعياري من خلال القتال في Street Fighter 3
(تجريبي)، ، () - 11/04 - الحوارات الصوتية: مجموعة بيانات الحوارات لفهم الصوت والموسيقى
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - تطبيق الإرشادات في فترة زمنية محدودة يحسن جودة العينة والتوزيع في نماذج الانتشار
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/11 - AmpleGCG: تعلم نموذج توليدي عالمي وقابل للتحويل من اللواحق المتعارضة لكسر الحماية لكل من LLMs المفتوحة والمغلقة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/10 - أداة الشفافية LM: أداة تفاعلية لتحليل نماذج لغة المحولات
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - أصبح Gemini 1.5 Pro يفهم الصوت الآن
(تغريد)، - 04/10 - استكشاف عمق المفهوم: كيف تكتسب النماذج اللغوية الكبيرة المعرفة في طبقات مختلفة؟
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/10 - المهندس المعماري الحضري: إنشاء مشهد حضري ثلاثي الأبعاد قابل للتوجيه مع التخطيط المسبق
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - RealmDreamer: إنشاء مشهد ثلاثي الأبعاد يعتمد على النص مع الطلاء الداخلي وانتشار العمق
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - يقول التقرير إن OpenAI وMeta على وشك إطلاق نماذج ذكاء اصطناعي قادرة على التفكير مثل البشر
(أخبار)، - 04/10 - MetaCheckGPT - كاشف الهلوسة متعدد المهام باستخدام عدم اليقين LLM والنماذج الوصفية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - تؤكد Meta أن برنامج Llama 3 مفتوح المصدر LLM سيأتي في الشهر المقبل
(أخبار)، - 04/10 - لا تترك أي سياق خلفك: محولات السياق اللانهائية الفعالة مع الاهتمام اللامتناهي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - XAI التزايدي: فهم لا يُنسى للذكاء الاصطناعي مع تفسيرات تزايدية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - DreamScene360: إنشاء مشهد غير مقيد من النص إلى ثلاثي الأبعاد مع رش غاوسي بانورامي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - هل يحتوي مابو توفو على القهوة؟ استكشاف LLMs للمعرفة الثقافية المتعلقة بالأغذية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - BRAVE: توسيع التشفير المرئي لنماذج لغة الرؤية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - أطلقت شركة Mistral الناشئة للذكاء الاصطناعي نموذجًا للذكاء الاصطناعي بسعة 281 جيجابايت لمنافسة OpenAI وMeta وGoogle
(أخبار)، - 04/10 - التواصل الدلالي التوليدي القائم على الوكيل للمراقبة عن بعد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - تكييف وحدة فك ترميز LLaMA مع محول الرؤية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/10 - استبيان حول دمج الذكاء الاصطناعي التوليدي في التفكير النقدي في شبكات الهاتف المحمول
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/09 - ألقِ نظرة عليه! إعادة التفكير في كيفية تقييم الهروب من السجن لنموذج اللغة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - المسطرة: ما هو حجم السياق الحقيقي لنماذج اللغة ذات السياق الطويل الخاصة بك؟
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - مراجعة التكثيف في الرش الغاوسي
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/09 - إعادة بناء الأشياء المحمولة باليد بشكل ثلاثي الأبعاد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/09 - RAR-b: الاستدلال كمعيار للاسترجاع
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/09 - الهندسة السريعة للحفاظ على الخصوصية: دراسة استقصائية
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/09 - حول تقييم كفاءة كود المصدر الذي تم إنشاؤه بواسطة LLMs
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS) - 04/09 - التقرير الفني لـ OmniFusion
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - MuPT: محول الموسيقى الرمزية التوليدية المدرب مسبقًا
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/09 - MiniCPM: الكشف عن إمكانات نماذج اللغات الصغيرة مع استراتيجيات تدريب قابلة للتطوير
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - Magic-Boost: تعزيز الجيل ثلاثي الأبعاد من خلال الانتشار المكيف للعرض المتعدد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/09 - LLM2Vec: نماذج اللغات الكبيرة هي أدوات تشفير نصوص قوية سرًا
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - InternLM-XComposer2-4KHD: نموذج رائد كبير في التعامل مع دقة الرؤية واللغة من 336 بكسل إلى 4K HD
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - Hash3D: تسريع بدون تدريب للجيل ثلاثي الأبعاد
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - جوجل تكشف عن مشاريع مفتوحة المصدر للذكاء الاصطناعي التوليدي
(أخبار)، - 04/09 - الأفيال لا تنسى أبدًا: حفظ وتعلم البيانات الجدولية في نماذج اللغات الكبيرة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/09 - كشفت Apple للتو النقاب عن Ferret-UI LLM الجديدة - يمكن لهذا الذكاء الاصطناعي قراءة شاشة iPhone الخاصة بك
(أخبار)، - 04/09 - AEGIS: الإشراف على سلامة محتوى الذكاء الاصطناعي التكيفي عبر الإنترنت مع مجموعة من خبراء LLM
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/08 - YaART: تقنية أخرى لعرض الفن
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/08 - WILBUR: التعلم التكيفي في السياق لوكلاء الويب الأقوياء والدقيقين
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/08 - UniFL: تحسين الانتشار المستقر من خلال التعلم بالملاحظات الموحدة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/08 - إيكاروس الجامح: دراسة للمخاطر المحتملة لمدخلات الصور في أمان نماذج اللغات الكبيرة متعددة الوسائط
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/08 - لوحة صدارة الهلوسة - جهد مفتوح لقياس الهلوسة في نماذج اللغات الكبيرة
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️) - 04/08 - مشكلة اختيار الحقيقة في إصلاح البرامج المستندة إلى LLM
()، ()، (؟)، (؟)، (؟)، (HTML)، (SL)، (SP)، (GS)، (SS)، (✳️)، () - 04/08 - Swapanything: تمكين تبديل الكائن التعسفي في التحرير البصري المخصص
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - Sambalingo: تدريس نماذج اللغة الكبيرة لغات جديدة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - تحسين التفضيل السلبي: من الانهيار الكارثي إلى غير فعال
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - Naver لاول مرة Hyperclova X LLM سوف تستخدم لبناء الذكاء الاصطناعى السيادية لآسيا
(أخبار)، - 04/08 - MOMA: محول LLM متعدد الوسائط لتوليد الصور الشخصية السريعة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - medexpqa: القياس متعدد اللغات لنماذج اللغة الكبيرة للإجابة على الأسئلة الطبية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08- MA-LMM: نموذج متعدد الوسائط كبير في الذاكرة لفهم الفيديو على المدى الطويل
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - Layoutllm: تخطيط تعليمات ضبط مع نماذج لغة كبيرة لفهم الوثائق
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/08 - ferret -ui: فهم واجهة المستخدم المحمولة مع LLMs متعددة الوسائط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - تقييم قدرات التفكير التداخلي لنماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - Eagle and Finch: RWKV مع حالات ذات قيمة مصفوفة وتكرار ديناميكي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/08 - CODECLM: محاذاة نماذج اللغة مع بيانات صناعية مصممة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/08 - AutoCoderover: تحسين البرنامج المستقل
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/07 - الوقت في التنبؤ بالحمل: منظور نموذج سلسلة زمنية كبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/07 - تم نسخ Openai أكثر من مليون ساعة من مقاطع الفيديو على YouTube لتدريب GPT -4
(أخبار)، - 04/07 - Magictime: طرازات توليد الفيديو الزمنية كمحاكاة متحولة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/07 - Byteedit: Boost ، امتثال وتسريع تحرير الصور التوليدي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/06 - أغلبية التصويت للأطباء يحسن مدى ملاءمة اعتماد الذكاء الاصطناعي في علم الأمراض
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) - 04/06- Diffusion-RWKV: تحجيم بنيات تشبه RWKV لنماذج الانتشار
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/06- DATENERF: التحرير القائم على النصوص على دراية بالعمق من NERFS
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/06- ما وراء Scene: توليد المشهد المتمحور حول الإنسان عالي الدقة مع انتشار ما قبل الرصاص
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/06 - محاذاة نماذج الانتشار من خلال تحسين الفائدة البشرية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/06 - حالة تطوير نموذج الأساس للتخطيط للمهام من الصفر
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05 - زيادة ثغرات LLM من الضبط والتكميلية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05 - SpatialTracker: تتبع أي بكسل ثنائي الأبعاد في مساحة ثلاثية الأبعاد
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05 - تدريب المهارات الاجتماعية مع نماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05 - سيجما: شبكة سيامي مامبا للتجزئة الدلالية متعددة الوسائط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/05 - غوسي قوي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05 - Physavatar: تعلم فيزياء الصور الرمزية ثلاثية الأبعاد من الملاحظات المرئية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05- Koala: مقطع فيديو طويل مكيف الإطار
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05 - دليل: تقييم فهم اللغة السريرية لـ LLMS
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/2
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/05 - مساعدة البشر في مقارنات معقدة: مقارنة المعلومات الآلية على نطاق واسع
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - تجسد الذكاء الاصطناع
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) - 04/04 - تطور نموذج اللغة: منظور التعلم المتكرر
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04- تصور الفكر يثير التفكير المكاني في نماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) (twitter) ، - 04/04 - لا "صفر طلقة" بدون بيانات أسية: تواتر مفهوم ما قبل الرصاص يحدد أداء النموذج متعدد الوسائط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/04 - تقييم LLMs في اكتشاف الأخطاء في ردود LLM
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/04 - تقييم نماذج اللغة التوليدية في استخراج المعلومات كتصحيح سؤال شخصي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/04 - تحسين NASH المباشر: تدريس نماذج اللغة للتمييز الذاتي مع التفضيلات العامة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04- CBR-RAG: التفكير القائم على الحالات للجيل المعزز في الاسترجاع في LLMS للإجابة على الأسئلة القانونية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - إمكانيات نماذج اللغة الكبيرة في هندسة التحكم: دراسة معيارية على GPT -4 و Claude 3 Opus و Gemini 1.0 Ultra
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - Canttalkabouthis: محاذاة نماذج اللغة للبقاء في الموضوع في الحوارات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - autowebglm: bootstrap وتعزيز وكيل ويب كبير القائم على نموذج اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/04 - تدريب LLMs على النص المضغوط العصبي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - إعادة: التمثيل Finetuning لنماذج اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/04- Red Teaming GPT-4V: هل GPT-4V آمن ضد هجمات Uni/Multi-Modal Jailbreak؟
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04- RALL-E: نمذجة لغة الترميز القوية مع سلسلة من الفكر لتوليف النص إلى كلام
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - PointInfinity: نماذج نشر النقاط الدقة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04- MINIGPT4-Video: تقدم LLMs متعدد الوسائط لفهم الفيديو مع الرموز النصية المرئية المتشابكة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04- غيبوبة: محاذاة نموذج نشر النص إلى صورة مع مطابقة مفهوم الصورة إلى النص
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - CodeeditorBench: تقييم القدرة على تحرير الكود لنماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/04 - autowebglm: bootstrap وتعزيز وكيل ويب كبير القائم على نموذج اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/03 - النمذجة التلقائية المرئية: توليد الصور القابل للتطوير عبر التنبؤ على نطاق التالي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/03- على قابلية توليد النص إلى صورة قائم على الانتشار
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/03 - العديد من الراقصات الكاسحة
() - 04/03- LVLM-Intrepret: أداة تفسير لنماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/03 - نماذج اللغة كمترجمات: محاكاة تنفيذ الكود الكاذب يحسن التفكير الخوارزمي في نماذج اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/03- InstantStyle: غداء مجاني نحو الحفاظ على الأسلوب في توليد النص إلى صورة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/03 - فريدريتور: تحرير NERF عالي الدقة و NERF عن طريق تحلل التردد
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/03- التوترات المتبادلة تجعل الاستدلال مرهقة في نماذج نشر النص إلى صورة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/03- ChatGlm-Math: تحسين حل المشكلات في نماذج اللغة الكبيرة مع خط أنابيب الذاتي الذاتي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/02 - تعلن المملكة المتحدة والولايات المتحدة شراكة حول علوم سلامة الذكاء الاصطناعي
(أخبار)، - 04/02 - نماذج لغة كبيرة كمولدات مجال تخطيط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) - 04/02 - بورو 34 ب وبركة متعددة اللغات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/02 - Octopus V2: نموذج لغة على الجهاز للعامل الفائق
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/02- مزيج من العمقات: تخصيص الحساب ديناميكيًا في نماذج اللغة القائمة على المحولات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/02- تكافح Long-Context LLMS مع التعلم الطويل داخل السياق
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/02 - LLM -ABR: تصميم خوارزميات البت التكيفي عبر نماذج لغة كبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/02 - يمكن أن تغير نماذج اللغة الكبيرة مستقبل الرعاية الصحية السلوكية: اقتراح للتنمية والتقييم المسؤولين
() - 04/02 - التقرير الفني HyperClova X
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/02- CamerActrl: تمكين التحكم في الكاميرا لتوليد النص إلى الفيديو
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/02 - تقدم العموميين المنطقيين مع أشجار التفضيل
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/01 - دفق البحث (SOS): تعلم البحث في اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/01 - LLM كعقل المدبر: مسح للتفكير الاستراتيجي مع نماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/01 - صعود وارتفاع نماذج اللغة الكبيرة من الذكاء الاصطناعي (LLMS)
(مدونة)، - 04/01 - تسميات توضيحية فيديو كثيفة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/01 - قياس تشابه نمط في نماذج الانتشار
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/01- الحصول عليها بشكل صحيح: تحسين الاتساق المكاني في نماذج النص إلى صورة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/01 - لشركات الذكاء الاصطناعي للبيانات ، الإنترنت صغير جدًا
(أخبار)، - 04/01- FlexidReamer: جيل واحد صورة إلى 3d مع المرونة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/01 - تقييم: مكتبة موحدة ويمكن الوصول إليها لتقييم نموذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/01 - تحسين التفضيل المباشر للفيديو نماذج متعددة الوسائط كبيرة من مكافأة نموذج اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 04/01 - DBRX ، pretring مستمر ، مكافأة ، استنتاج أسرع ، والمزيد
(مدونة)، - 04/01- Cosmicman: نموذج مؤسسة نص إلى صورة للبشر
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/01 - الشبكة العصبية الوعرة لتوليد الصور الخاضعة للرقابة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/01 - الأكبر ليس أفضل دائمًا: تحجيم خصائص نماذج الانتشار الكامنة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 04/01 - هل نماذج اللغة الكبيرة من الكيميائيين الفائقين؟
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/31 - Wavllm: نحو نموذج اللغة الكبير القوية والتكيفية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/31 - تعبت من الإضافات؟ يمكن أن تكون نماذج اللغة الكبيرة موظفين شاملًا
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/30 - دراسة استقصائية على التعزيز التعزيز المعزز بنماذج اللغة: المفهوم والتصنيف والأساليب
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/30 - ST -LLM: نماذج اللغة الكبيرة هي متعلمين زمنية فعالة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) - 03/30- تدريب على ضوضاء نماذج اللغة الوعرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/33
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) - 03/30- Aurora-M: أول نموذج لغوي متعدد اللغات المصدر مفتوح
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29 - اكتشاف المشكلة غير القابلة للحل: تقييم جدارة نماذج لغة الرؤية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29- المحول-لايت: نشر عالي الكفاءة لنماذج اللغة الكبيرة على وحدات معالجة الرسومات عبر الهاتف المحمول
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29- snap-it ، tap-it ، splat-it: splatting 3D غاوسي الملموس
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29 - عالم: القرار المرجعي كنمذجة اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29 - NVIDIA H200 GPUS CRUSH
(أخبار)، - 03/29 - Mambamixer: نماذج فضائية انتقائية فعالة مع اختيار الرمز المميز والمواد المزدوجة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29 - LLAVA -GEMMA: تسريع نماذج الأساس متعددة الوسائط مع نموذج لغة مضغوط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29- Instantsplat: لا يتجزأ من العرض المتفرق غير المتواضع.
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29 - Gecko: تنجاة النصوص متعددة الاستخدامات مقطرة من نماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29 - Dijiang: نماذج لغة كبيرة فعالة من خلال kernelization مضغوط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/29- DeepMind يطور تطبيقًا آمنًا ، وهو تطبيق قائم على الذكاء الاصطناعى يمكنه التحقق من حقائق LLMS
(أخبار)، - 03/29 - CTRL -SIM: عوامل قيادة تفاعلية يمكن التحكم فيها مع التعلم التعزيز دون اتصال بالإنترنت
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/29 - هل نحن في الطريق الصحيح لتقييم نماذج كبيرة باللغة الرؤية؟
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/28 - SDPO: لا تستخدم بياناتك مرة واحدة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/28 - Mesh2nerf: الإشراف المباشر على الشبكة لتمثيل وتوليد حقل الإشراق العصبي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/28 - توطين الفقرة في نماذج اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/28 - جامبا: نموذج لغة محول هجينة مامبا
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/28 - Gaussiancube: هيكلة الغوسي للتخليط باستخدام النقل الأمثل للنمذجة التوليدية ثلاثية الأبعاد
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/28 - كلود 3 تجاوز GPT -4 في مبارزة روبوتات AI. إليك كيفية الدخول في العمل
(أخبار)، - 03/28 - الإعلان عن Grok -1.5
(مدونة) ، (تجريبي) ، - 03/27 - مسار نحو الحكم الذاتي القانوني: نهج قابل للتشغيل البيني والتفسير لاستخراج المعلومات القانونية وتحويلها وتحميلها وحسابها باستخدام نماذج لغة كبيرة وأنظمة الخبراء والشبكات البايزية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27 - Vitar: محول الرؤية مع أي قرار
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27- نحو نموذج لغة عالمي-إنجليزي للمساعدين الافتراضيين على الجهاز
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27 - TextCraftor: يمكن أن يكون ترميز النص الخاص بك وحدة تحكم جودة الصورة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27 - ObjectDrop: Bootstrappingsuctuals لإزالة الكائنات الواقعية وإدراجها
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27- Mini-Gemini: تعدين إمكانات نماذج لغة الرؤية متعددة الوسائط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/27 - واقعية طويلة الشكل في نماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/27 - LITA: تم تعليمات اللغة التي تم تعليمها إلى توحيد الزماني
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/27 - Garment3dgen: 3D Garment Stylization وتوليد الملمس
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27 - غامبا: الزواج من غوسيا شباك مع مامبا لإعادة إعمار عرض ثلاثي الأبعاد واحد
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27- Flexedit: تحرير الصور المرن والمكنت القائم على الانتشار
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/27 - Biomedlm: نموذج لغة معلمة 2.7B مدرب على النص الطبيب الحيوي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/26- MAGIS: إطار عمل متعدد الوكلاء يستند إلى LLM لحل مشكلة GITHUB
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/26 - عدم فعالية الطبقات الأعمق غير المعقول
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/26- TC4D: جيل نص إلى 4D مسار
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/26- OCTREE-GS: نحو عرض ثابت في الوقت الفعلي مع Gaussians 3D منظمة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/26- تقديم DBRX: حالة جديدة مفتوحة LLM
(مدونة)، - 03/26 - التقرير الفني Internlm2
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/26- تحسين اتساق النص إلى صورة من خلال تحسين المطالبة التلقائية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/26- Perceptrons متعدد الطبقات ممزوجة بالكامل على وحدات معالجة الرسومات Intel Data Center
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/26 - Egolifter: تجزئة ثلاثية الأبعاد المفتوحة لتصور الأنانية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/26 - aniportrait: توليف مدفوع الصوت من الرسوم المتحركة للتقليدية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/26 - 2D Gaussian slightting لحقول الإشعاع الدقيقة الهندسية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/25 - نحو التقييم التلقائي للقدرات السريرية لـ LLMS: القياس والبيانات والخوارزمية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/25 - RepairAgent: A STALLESOS ، وكيل قائم على LLM لإصلاح البرنامج
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/25- RL لنماذج الاتساق: تكييف نصية موجهة إلى صورة أسرع
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/25- VP3D: عنان موجه مرئي ثنائي الأبعاد لتوليد النص إلى 3D
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/25- الرحلة: التعلم المتبقي الزمني مع ضوضاء الصورة السابقة لنماذج نشر الصورة إلى الفيديو
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/25- SDXS: نماذج الانتشار الكامنة من خطوة واحدة مع ظروف الصورة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/25 - نظام تشغيل وكيل LLM
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/25 - Flashface: تخصيص الصورة البشرية مع الحفاظ على هوية عالية الدقة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/25- Dreampolisher: نحو جيل من النص عالي الجودة إلى 3D عبر الانتشار الهندسي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/25- كن نفسك: اهتمام محدود لتوليد النصوص متعددة الموضوعات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/23 - عندما يلبي توليد الكود المستند إلى LLM عملية تطوير البرمجيات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/22 - therestation: توليد الأصول ثلاثية الأبعاد على دراية بالموضوع من نماذج قليلة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/22 - Simba: العمارة المبسطة القائمة على Mamba للرؤية وسلسلة زمنية متعددة المتغيرات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/22 - LLM2LLM: تعزيز LLMS مع تعزيز البيانات التكرارية الجديدة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/22- LATTE3D: توليف النص المطفأ على نطاق واسع
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/22 - Internvideo2: تحجيم نماذج أساس الفيديو لفهم الفيديو متعدد الوسائط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/22 - متابعة: تقييم نماذج استرجاع المعلومات وتدريسها لمتابعة التعليمات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/22 - Dragapart: تعلم حركة على مستوى جزئي مسبقًا للكائنات المفصلية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/22 - هل يمكن أن تستكشف نماذج اللغة الكبيرة داخل السياق؟
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/22 - Allhands: اسألني أي شيء على ردود الفعل الحرفية واسعة النطاق عبر نماذج لغة كبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) - 03/21 - PEERGPT: التحقيق في أدوار وكلاء الأقران القائم على LLM كمشرفي الفريق والمشاركين في التعلم التعاوني للأطفال
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - Stylecinegan: جيل السينما في المناظر الطبيعية باستخدام Stylegan المدربة مسبقًا
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/21 - DreamingT2V: توليد فيديو طويل وديناميكي وقابل للتمديد من النص
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/21 - RENOISE: انعكاس الصورة الحقيقية من خلال noising التكرارية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - اللجوء إلى الاستصلاح: الدردشة مع نماذج اللغة التوليدية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - Rakutenai -7B: تمديد نماذج لغة كبيرة لليابانية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - MyVLM: تخصيص VLMs للاستعلامات الخاصة بالمستخدم
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - MATHERVER: هل ترى LLM متعددة الوسائط الخاصة بك المخططات في مشاكل الرياضيات البصرية؟
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - GRM: نموذج إعادة بناء غاوسي كبير لإعادة بناء وتوليد 3D فعال
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/21 - تتبنى الجمعية العامة قرارًا تاريخيًا بشأن الذكاء الاصطناعي
(أخبار)، - 03/21 - صقيع غاوسي: حقول الإرهاق المعقدة القابلة للتحرير مع عرض في الوقت الفعلي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - استكشاف بين الزمان والمكان
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21- نماذج انتشار الفيديو الفعالة عبر تحلل محتوى الإطار المتردد
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21- DreamReward: Text-to-3D Generation مع التفضيل البشري
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/21 - COBRA: تمديد نموذج اللغة الكبير متعدد الوسائط لاستدلال فعال
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/21 - البطل: الرسوم المتحركة للسيارات البشرية القابلة للتحكم والمتسق مع إرشادات حدودية ثلاثية الأبعاد
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/21- anyv2v: إطار توصيل وتشغيل لأي مهام تحرير الفيديو إلى الفيديو
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20 - رسم خرائط LLM Security Landscapes: اقتراح شامل لتقييم مخاطر أصحاب المصلحة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20 - Zigma: نموذج نشر Zigzag Mamba
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/20 - VSTAR: التمريض الزمني التوليدي لتوليف الفيديو الديناميكي الأطول
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20 - Rawardbench: تقييم نماذج المكافآت لنمذجة اللغة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/20 - التدريب العكسي لمرضة لعنة الانعكاس
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20- RADSPLAT: RADIANCE GAUSSIAN SPLATTING FOR TIME في الوقت الفعلي القوي مع 900+ إطارًا في الثانية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20 - مورا: تمكين توليد الفيديو العام عبر إطار عمل متعدد الوكلاء
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/20 - llamafactory: صقل فعال موحد من 100 موديل لغوي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/20- IDADAPTER: تعلم ميزات مختلطة للتخصيص الخالي من ضبط نماذج النص إلى صورة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20 - Hyperllava: ضبط الخبراء البصري واللغوي الديناميكي لنماذج اللغة الكبيرة متعددة الوسائط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/20 - تقييم النماذج الحدودية للقدرات الخطرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20 - العمق: تقدير عمق أحادي سريع مع مطابقة التدفق
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20 - compress3d: مساحة كامنة مضغوطة للجيل ثلاثي الأبعاد من صورة واحدة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/20- be your-outpainter: إتقان توضيح الفيديو من خلال التكيف الخاص بالمدخلات
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/19 - متى لا نحتاج إلى نماذج رؤية أكبر؟
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/19- VID2ROBOT: تعلم السياسة المكيفة من شوط
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19 - نحو نموذج الأساس للأغراض العامة لعلم الأمراض الحسابي
() - 03/19- Texdreamer: نحو توليد نسيج الإنسان ثلاثي الأبعاد عالي اللقطة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19 - مشاهد: إعادة بناء المشاهد مع نموذج لغة منظم للانحدار التلقائي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19- MPLUG-DOCOWL 1.5: تعلم بنية موحدة لفهم الوثائق الخالية من المعرفة الضوئية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/19 - Magic Fixup: تبسيط تحرير الصور من خلال مشاهدة مقاطع الفيديو الديناميكية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19- LLMLINGUA-2: تقطير البيانات لضغط موجه فعال ومؤمن للمهمة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/19- GVGEN: جيل Text-to-3D مع تمثيل حجمي
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19 - Gaussianflow: Dlingting Gaussian Dynamics لإنشاء محتوى 4D
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19- Fresco: المراسلات المكانية والزمنية لترجمة فيديو صفرية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/19- فورسكالي: منظور التردد حول تخليق الصور عالي الدقة الخالي من التدريب
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/19 - التحسين التطوري لوصفات دمج النموذج
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، ([: octocat:] (https: : //github.com/ Sakanaai/Evolutionary-model-merge)! - 03/19 - Comboverse: إنشاء الأصول ثلاثية الأبعاد باستخدام إرشادات الانتشار المعترف بها مكانيًا
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19 - التفكير القائم على المخطط: نقل القدرات من LLMS إلى VLMS
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19 - MM1 من Apple: نموذج لغة كبير متعدد الوسائط قادر على تفسير كل من الصور والبيانات النصية
(أخبار)، - 03/19- Animatediff-Lightning: تقطير نشر النموذج
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/19 - الوكيل -فلان: تصميم البيانات وطرق ضبط الوكيل الفعال لنماذج اللغة الكبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/19 - نموذج أساس باللغة البصرية لعلم الأمراض الحسابي
() ، (✳) - 03/19 - عوامل الذكاء الاصطناعى المميزة عبر نماذج لغة كبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، (! [github repo stars] ( https://img.shields.io/github/stars/nuaa-nlp/character100؟ style = social)) - 03/18 - إلى أي مدى نحن في اتخاذ القرارات من LLMs؟ تقييم قدرة ألعاب LLMS في بيئات متعددة الوكلاء
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/18 - VideoAgent: وكيل متعدد الوسائط ذاكرة لفهم الفيديو
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18 - VFusion3D: التعلم نماذج توليدية ثلاثية الأبعاد قابلة للتطوير من نماذج نشر الفيديو
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18 - TNT -LLM: تعدين النص على نطاق واسع مع نماذج لغة كبيرة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18 - SV3D: توليف جديد متعدد الرؤية وجيل ثلاثي الأبعاد من صورة واحدة باستخدام نشر الفيديو الكامن
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18 - RouterBench: معيار لنظام توجيه Multi -LLM
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، (ss) - 03/18 -توبيخ التعرف على أتمتة التعرف المرئي صفراً مع LLMS
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/18 - LN3Diff: نشر الحقول العصبية الكامنة القابلة للتطوير
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18- llava-uhd: LMM يدرك أي نسبة عرضية وصور عالية الدقة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) ، () - 03/18 - لاريمار: نماذج لغة كبيرة مع التحكم في الذاكرة العرضية
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18- لا حصر له: التخصيص المحفوظ للهوية عبر نموذج التدوين اللاتينيين
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18 - GPT -4 كمقيم: تقييم نماذج لغة كبيرة على إدارة الآفات في الزراعة
() ، () ، (؟) ، (؟) ، (؟) ، (html) ، (sl) ، (sp) ، (gs) ، (ss) ، (✳) - 03/18 - Generic 3D Diffusion Adapter Using Controlled Multi-View Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/18 - From Pixels to Insights: A Survey on Automatic Chart Understanding in the Era of Large Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/18 - Fast High-Resolution Image Synthesis with Latent Adversarial Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Decoding Compressed Trust: Scrutinizing the Trustworthiness of Efficient LLMs Under Compression
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/18 - Compiler generated feedback for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/17 - PhD: A Prompted Visual Hallucination Evaluation Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/17 - MindEye2: Shared-Subject Models Enable fMRI-To-Image With 1 Hour of Data
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/16 - VisionCLIP: An Med-AIGC based Ethical Language-Image Foundation Model for Generalizable Retina Image Analysis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/16 - Do Large Language Models understand Medical Codes?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - VideoAgent: Long-form Video Understanding with Large Language Model as Agent
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Uni-SMART: Universal Science Multimodal Analysis and Research Transformer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Trusting the Search: Unraveling Human Trust in Health Information from Google and ChatGPT
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - RAFT: Adapting Language Model to Domain Specific RAG
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - PERL: Parameter Efficient Reinforcement Learning from Human Feedback
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - NeuFlow: Real-time, High-accuracy Optical Flow Estimation on Robots Using Edge Devices
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - MusicHiFi: Fast High-Fidelity Stereo Vocoding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/15 - LightIt: Illumination Modeling and Control for Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Isotropic3D: Image-to-3D Generation Based on a Single CLIP Embedding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/15 - FDGaussian: Fast Gaussian Splatting from Single Image via Geometric-aware Diffusion Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Enhancing Human-Centered Dynamic Scene Understanding via Multiple LLMs Collaborated Reasoning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - EfficientVMamba: Atrous Selective Scan for Light Weight Visual Mamba
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - DiPaCo: Distributed Path Composition
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/15 - Controllable Text-to-3D Generation via Surface-Aligned Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - WavCraft: Audio Editing and Generation with Natural Language Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - VisionGPT-3D: A Generalized Multimodal Agent for Enhanced 3D Vision Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Video Mamba Suite: State Space Model as a Versatile Alternative for Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Video Editing via Factorized Diffusion Distillation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Unlocking the conversion of Web Screenshots into HTML Code with the WebSight Dataset
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - StreamMultiDiffusion: Real-Time Interactive Generation with Region-Based Semantic Control
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Scaling Instructable Agents Across Many Simulated Worlds
(twitter), (Blog), - 03/14 - Recurrent Drafter for Fast Speculative Decoding in Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - LocalMamba: Visual State Space Model with Windowed Selective Scan
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Large Language Models and Causal Inference in Collaboration: A Comprehensive Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Helpful or Harmful? Exploring the Efficacy of Large Language Models for Online Grooming Prevention
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - Griffon v2: Advancing Multimodal Perception with High-Resolution Scaling and Visual-Language Co-Referring
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - GPT on a Quantum Computer
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/14 - Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - GiT: Towards Generalist Vision Transformer through Universal Language Interface
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - Exploring the Capabilities and Limitations of Large Language Models in the Electric Energy Sector
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/14 - BurstAttention: An Efficient Distributed Attention Framework for Extremely Long Sequences
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/14 - 3D-VLA: A 3D Vision-Language-Action Generative World Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Scaling Instructable Agents Across Many Simulated Worlds
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/13 - VLOGGER: Multimodal Diffusion for Embodied Avatar Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - The Human Factor in Detecting Errors of Large Language Models: A Systematic Literature Review and Future Research Directions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - SOTOPIA-π: Interactive Learning of Socially Intelligent Language Agents
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Simple and Scalable Strategies to Continually Pre-train Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Scaling Up Dynamic Human-Scene Interaction Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Language-based game theory in the age of artificial intelligence
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Language models scale reliably with over-training and on downstream tasks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Knowledge Conflicts for LLMs: A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Gemma: Open Models Based on Gemini Research and Technology
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - GaussianImage: 1000 FPS Image Representation and Compression by 2D Gaussian Splatting
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/13 - Follow-Your-Click: Open-domain Regional Image Animation via Short Prompts
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Cultural evolution in populations of Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/13 - Bugs in Large Language Models Generated Code: An Empirical Study
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Synth^2: Boosting Visual-Language Models with Synthetic Captions and Image Embeddings
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - Motion Mamba: Efficient and Long Sequence Motion Generation with Hierarchical and Bidirectional Selective SSM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - MoAI: Mixture of All Intelligence for Large Language and Vision Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - Learning Generalizable Feature Fields for Mobile Manipulation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/12 - DragAnything: Motion Control for Anything using Entity Representation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Chronos: Learning the Language of Time Series
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/12 - Branch-Train-MiX: Mixing Expert LLMs into a Mixture-of-Experts LLM
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Transparent AI Disclosure Obligations: Who, What, When, Where, Why, How
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - HILL: A Hallucination Identifier for Large Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - FAX: Scalable and Differentiable Federated Primitives in JAX
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - FashionReGen: LLM-Empowered Fashion Report Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/11 - VideoMamba: State Space Model for Efficient Video Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - V3D: Video Diffusion Models are Effective 3D Generators
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Stealing Part of a Production Language Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/11 - Multistep Consistency Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - FaceChain-SuDe: Building Derived Class to Inherit Category Attributes for One-shot Subject-Driven Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/11 - Chain-of-table: Evolving tables in the reasoning chain for table understanding (Blog),
- 03/11 - An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/11 - Adding NVMe SSDs to Enable and Accelerate 100B Model Fine-tuning on a Single GPU
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/10 - VidProM: A Million-scale Real Prompt-Gallery Dataset for Text-to-Video Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/09 - Algorithmic progress in language models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Sora as an AGI World Model? A Complete Survey on Text-to-Video Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - On Protecting the Data Privacy of Large Language Models (LLMs): A Survey
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 03/08 - VideoElevator: Elevating Video Generation Quality with Versatile Text-to-Image Diffusion Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Personalized Audiobook Recommendations at Spotify Through Graph Neural Networks
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - ELLA: Equip Diffusion Models with LLM for Enhanced Semantic Alignment
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - DeepSeek-VL: Towards Real-World Vision-Language Understanding
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/08 - CRM: Single Image to 3D Textured Mesh with Convolutional Reconstruction Model
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/08 - Now available on Poe: Claude 3 (Demo),
- 03/08 - Google - Health-specific embedding tools for dermatology and pathology (Blog),
- 03/07 - Yi: Open Foundation Models by 01.AI
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - Teaching Large Language Models to Reason with Reinforcement Learning
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - StableDrag: Stable Dragging for Point-based Image Editing
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Radiative Gaussian Splatting for Efficient X-ray Novel View Synthesis
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - PixArt-Σ: Weak-to-Strong Training of Diffusion Transformer for 4K Text-to-Image Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Pix2Gif: Motion-Guided Diffusion for GIF Generation
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Meet 'Liberated Qwen', an uncensored LLM that strictly adheres to system prompts (News),
- 03/07 - LLMs in the Imaginarium: Tool Learning through Simulated Trial and Error
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - KAIST develops next-generation ultra-low power LLM accelerator (News),
- 03/07 - Inflection-2.5: meet the world's best personal AI (News),
- 03/07 - How Far Are We from Intelligent Visual Deductive Reasoning?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - GaLore: Memory-Efficient LLM Training by Gradient Low-Rank Projection
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/07 - Evaluating LLM models at scale (Blog),
- 03/07 - Common 7B Language Models Already Possess Strong Math Capabilities
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/07 - Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - Stop Regressing: Training Value Functions via Classification for Scalable Deep RL
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - ShortGPT: Layers in Large Language Models are More Redundant Than You Expect
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - SaulLM-7B: A pioneering Large Language Model for Law
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - NY hospital exec: Multimodal LLM assistants will create a “paradigm shift” in patient care (News),
- 03/06 - Learning to Decode Collaboratively with Multiple Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/06 - Enhancing Vision-Language Pre-training with Rich Supervisions
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/06 - Backtracing: Retrieving the Cause of the Query
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/06 - AI Prompt Engineering Is Dead (News),
- 03/06 - 3D Diffusion Policy
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 03/05 - OpenAI and Elon Musk (Blog),
- 03/05 - Caduceus: Bi-Directional Equivariant Long-Range DNA Sequence Modeling
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/05 - WikiTableEdit: A Benchmark for Table Editing by Natural Language Instruction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Updating the Minimum Information about CLinical Artificial Intelligence (MI-CLAIM) checklist for generative modeling research (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/05 - Tuning-Free Noise Rectification for High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - The WMDP Benchmark: Measuring and Reducing Malicious Use With Unlearning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Scaling Rectified Flow Transformers for High-Resolution Image Synthesis (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - RT-Sketch: Goal-Conditioned Imitation Learning from Hand-Drawn Sketches (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - Revisiting Meta-evaluation for Grammatical Error Correction (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Modeling Collaborator: Enabling Subjective Vision Classification With Minimal Human Effort via LLM Tool-Use (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - MathScale: Scaling Instruction Tuning for Mathematical Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - KnowAgent: Knowledge-Augmented Planning for LLM-Based Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/05 - Interactive Continual Learning: Fast and Slow Thinking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - InjecAgent: Benchmarking Indirect Prompt Injections in Tool-Integrated Large Language Model Agents (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - In Search of Truth: An Interrogation Approach to Hallucination Detection (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ImgTrojan: Jailbreaking Vision-Language Models with ONE Image (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Generative Software Engineering (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/05 - Finetuned Multimodal Language Models Are High-Quality Image-Text Data Filters (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Feast Your Eyes: Mixture-of-Resolution Adaptation for Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Exploring the Limitations of Large Language Models in Compositional Relation Reasoning (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - EasyQuant: An Efficient Data-free Quantization Algorithm for LLMs (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Design2Code: How Far Are We From Automating Front-End Engineering? (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ChatGPT and biometrics: an assessment of face recognition, gender detection, and age estimation capabilities (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - ChatCite: LLM Agent with Human Workflow Guidance for Comparative Literature Summary (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - Benchmarking the Text-to-SQL Capability of Large Language Models: A Comprehensive Evaluation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/05 - An Empirical Study of LLM-as-a-Judge for LLM Evaluation: Fine-tuned Judge Models are Task-specific Classifiers (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 3/5 - OpenAI - ChatGPT can now read responses to you. (تغريد،
- 03/04 - The Claude 3 Model Family: Opus, Sonnet, Haiku
() (twitter), , (✳️) - 03/04 - Wukong: Towards a Scaling Law for Large-Scale Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - Large language models surpass human experts in predicting neuroscience results
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 03/04 - NoteLLM: A Retrievable Large Language Model for Note Recommendation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - MagicClay: Sculpting Meshes With Generative Neural Fields (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 03/04 - Enhancing LLM Safety via Constrained Direct Preference Optimization (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - DACO: Towards Application-Driven and Comprehensive Data Analysis via Code Generation (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/04 - CODE-ACCORD: A Corpus of Building Regulatory Data for Rule Generation towards Automatic Compliance Checking (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 03/04 - Balancing Enhancement, Harmlessness, and General Capabilities: Enhancing Conversational LLMs with Direct RLHF (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️)
- 03/04 - adaptMLLM: Fine-Tuning Multilingual Language Models on Low-Resource Languages with Integrated LLM Playgrounds (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 3/4 - ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - TripoSR: Fast 3D Object Reconstruction from a Single Image (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - RT-H: Action Hierarchies Using Language (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/4 - ResAdapter: Domain Consistent Resolution Adapter for Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/4 - OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 3/4 - Build AI for a Better Future (twitter), (News),
- 3/4 - AtomoVideo: High Fidelity Image-to-Video Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 03/03 - Research Papers in February 2024: A LoRA Successor, Small Finetuned LLMs Vs Generalist LLMs, and Transparent LLM Research (Blog),
- 3/3 - Nvidia CEO Jensen Huang says AI could pass most human tests in 5 years (News
- 3/3 - MovieLLM: Enhancing Long Video Understanding with AI-Generated Movies (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/3 - InfiMM-HD: A Leap Forward in High-Resolution Multimodal Understanding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/3 - Could this be bigger than OpenAI? Microsoft invests billions in French startup — Mistral AI is a multilingual maestro that's almost as good as ChatGPT 4 (News),
- 3/3 - 3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 3/2 - Nvidia CEO says AI could pass human tests in five years (News
- 3/1 - Elon Musk sues OpenAI and CEO Sam Altman over contract breach (News)
- 3.1 - AtP*: An efficient and scalable method for localizing LLM behaviour to components (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - VisionLLaMA: A Unified LLaMA Interface for Vision Tasks (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Learning and Leveraging World Models in Visual Representation Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - RealCustom: Narrowing Real Text Word for Real-Time Open-Domain Text-to-Image Customization (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Multimodal ArXiv: A Dataset for Improving Scientific Comprehension of Large Vision-Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 3.1 - Resonance RoPE: Improving Context Length Generalization of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/29 - OHTA: One-shot Hand Avatar via Data-driven Implicit Priors
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/29 - Retrieval-Augmented Generation for AI-Generated Content: A Survey (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), ()
- 2.29 - DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Panda-70M: Captioning 70M Videos with Multiple Cross-Modality Teachers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Humanoid Locomotion as Next Token Prediction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Griffin: Mixing Gated Linear Recurrences with Local Attention for Efficient Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - StarCoder 2 and The Stack v2: The Next Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Trajectory Consistency Distillation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.29 - Beyond Language Models: Byte Models are Digital World Simulators (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - Syntactic Ghost: An Imperceptible General-purpose Backdoor Attacks on Pre-trained Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.29 - ViewFusion: Towards Multi-View Consistency via Interpolated Denoising (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.29 - MOSAIC: A Modular System for Assistive and Interactive Cooking (), (), (?), (?), (?), (HTML), (SP), (GS), (SS)
- 02/28 - Automatic Creative Selection with Cross-Modal Matching
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS) - 2.28 - Priority Sampling of Large Language Models for Compilers (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.28 - Simple linear attention language models balance the recall-throughput tradeoff (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.28 - Approaching Human-Level Forecasting with Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.28 - Datasets for Large Language Models: A Comprehensive Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.28 - A Survey on Recent Advances in LLM-Based Multi-turn Dialogue Systems (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 02/27 - A High Level Guide to LLM Evaluation Metrics (Blog),
- 2/27 - Users Say Microsoft's AI Has Alternate Personality as Godlike AGI That Demands to Be Worshipped (News)
- 2/27 - Google DeepMind CEO on AGI, OpenAI and Beyond – MWC 2024 (News)
- 2.27 - Large Language Models(LLMs) on Tabular Data: Prediction, Generation, and Understanding -- A Survey (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - Towards Optimal Learning of Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Evaluating Very Long-Term Conversational Memory of LLM Agents (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - OmniACT: A Dataset and Benchmark for Enabling Multimodal Generalist Autonomous Agents for Desktop and Web (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - EMO: Emote Portrait Alive -- Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - EMO: Emote Portrait Alive - Generating Expressive Portrait Videos with Audio2Video Diffusion Model under Weak Conditions (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Training-Free Long-Context Scaling of Large Language Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - DiffuseKronA: A Parameter Efficient Fine-tuning Method for Personalized Diffusion Model (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Sora Generates Videos with Stunning Geometrical Consistency (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Playground v2.5: Three Insights towards Enhancing Aesthetic Quality in Text-to-Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - When Scaling Meets LLM Finetuning: The Effect of Data, Model and Finetuning Method (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.27 - Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.27 - Video as the New Language for Real-World Decision Making (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 02/27 - On the Societal Impact of Open Foundation Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/26 - Set the Clock: Temporal Alignment of Pretrained Language Models
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 2/26 - DenseMamba: State Space Models with Dense Hidden Connection for Efficient Large Language Models (), ()(?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/26 - Mistral Large is our flagship model, with top-tier reasoning capacities (News)
- 2.26 - Disentangled 3D Scene Generation with Layout Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Multi-LoRA Composition for Image Generation (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - MobiLlama: Towards Accurate and Lightweight Fully Transparent GPT (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.26 - Do Large Language Models Latently Perform Multi-Hop Reasoning? (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Nemotron-4 15B Technical Report (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - StructLM: Towards Building Generalist Models for Structured Knowledge Grounding (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.26 - Towards Open-ended Visual Quality Comparison (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.25 - ChatMusician: Understanding and Generating Music Intrinsically with LLM (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ( )
- 2.25 - FuseChat: Knowledge Fusion of Chat Models (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 02/24 - Divide-or-Conquer? Which Part Should You Distill Your LLM?
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️) - 02/24 - Perplexity.ai Revamps Google SEO Model For LLM Era (News)
- 02/24 - Data Interpreter: An LLM Agent For Data Science
(), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS), (✳️), () - 2.24 - Empowering Large Language Model Agents through Action Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 2.23 - Seamless Human Motion Composition with Blended Positional Encodings (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.23 - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️ )
- 2.23 - Gen4Gen: Generative Data Pipeline for Generative Multi-Concept Composition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️), ()
- 2.23 - API-BLEND: A Comprehensive Corpora for Training and Benchmarking API LLMs (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - Genie: Generative Interactive Environments (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - GPTVQ: The Blessing of Dimensionality for LLM Quantization (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.23 - ChunkAttention: Efficient Self-Attention with Prefix-Aware KV Cache and Two-Phase Partition (), (), (?), (?), (?), (HTML), (SP), (GS), (SS), (✳️)
- 2.22 - CLoVe: Encoding Compositional Language in Contrastive Vision-Language Models (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️), ()
- 02/22 - Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models (), (), (?), (?), (?), (HTML), (SL), (SP), (GS), (SS)
- 2.22 - Divide-or-Conquer? Which Part Should You Distill Your LLM? (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - Watermarking Makes Language Models Radioactive (), (), (?), (?), (?), (HTML), (AS), (GS), (✳️)
- 2.22 - AutoPrompt - prompt optimization framework ()
- 2.22 - Announcing Stable Diffusion 3 (tweet), (blog)
- 2.22 - DualFocus: Integrating Macro and Micro Perspectives in Multi-modal Large Language Models (), (), (?), (?), (?), (HTML), (✳️) , ()
- 2.22 - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real and Simulation (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - LLMs with Industrial Lens: Deciphering the Challenges and Prospects -- A Survey (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Vision-Language Navigation with Embodied Intelligence: A Survey (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Enhancing Robotic Manipulation with AI Feedback from Multimodal Large Language Models (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - Do Machines and Humans Focus on Similar Code? Exploring Explainability of Large Language Models in Code Summarization (), (), (?), (?), (?), (HTML), (✳️)
- 2.22 - PALO: A Polyglot Large Multimodal Model for 5B People (), (), (?), (?), (?), (HTML), (✳️) , ()
- 2.22 - GeneOH Diffusion: Towards Generalizable Hand-Object Interaction Denoising via Denoising Diffusion (), (), ([:paperclip:](https://arxiv.org/pdf/2402.148