اجمع بعض أوراق النماذج العالمية (للقيادة الذاتية).
إذا وجدت بعض الأوراق التي تم تجاهلها، فلا تتردد في إنشاء طلبات سحب أو فتح قضايا أو مراسلتي عبر البريد الإلكتروني / Qi Wang . نرحب بالمساهمات بأي شكل من الأشكال لجعل هذه القائمة أكثر شمولاً.
إذا وجدت هذا المستودع مفيدًا، فيرجى التفكير في منحنا نجمة ؟.
لا تتردد في مشاركة هذه القائمة مع الآخرين! ؟؟؟؟
CVPR 2024 Workshop & Challenge | OpenDriveLab
المسار رقم 4: النموذج العالمي التنبؤي.
نظرًا لكونه تمثيلًا مكانيًا وزمانيًا مجردًا للواقع، يمكن للنموذج العالمي التنبؤ بالحالات المستقبلية بناءً على الحالة الحالية. تتمتع عملية تعلم النماذج العالمية بالقدرة على الارتقاء بالنموذج الأساسي المُدرب مسبقًا إلى المستوى التالي. بالنظر إلى مدخلات الرؤية فقط، تشير مخرجات الشبكة العصبية إلى السحب في المستقبل لتشهد على قدرتها التنبؤية بالعالم.
CVPR 2023 Workshop on Autonomous Driving
3: تحديات ARGOVERSE، والتنبؤ بالإشغال ثلاثي الأبعاد باستخدام مجموعة بيانات مستشعر Argoverse 2. توقع إشغال الزمكان للعالم خلال الثواني الثلاث القادمة.
Yann LeCun
: الطريق نحو ذكاء الآلة المستقلة [ورقة] [فيديو]CVPR'23 WAD
- أشوك إلسوامي، تسلا [فيديو]Wayve
نقدم GAIA-1: نموذج الذكاء الاصطناعي التوليدي المتطور للاستقلالية [مدونة]النماذج العالمية هي الأساس للقدرة على التنبؤ بما قد يحدث بعد ذلك، وهو أمر مهم بشكل أساسي للقيادة الذاتية. يمكن أن تكون بمثابة محاكاة مستفادة، أو تجربة فكرية "ماذا لو" للتعلم المعزز القائم على النموذج (RL) أو التخطيط. ومن خلال دمج النماذج العالمية في نماذج القيادة لدينا، يمكننا تمكينهم من فهم القرارات البشرية بشكل أفضل وتعميمها في نهاية المطاف على مواقف أكثر واقعية.
WACVW 2024
[الورقة] [الكود]ISSREW
[ورقةarXiv 2024.11
[ورقة]arXiv 2024.11
[ورقة]arXiv 2024.7
[ورقة] [كود]arXiv 2024.5
[ورقة] [كود]2024.3, arxiv
[ورقة]TITS
[ورقة]NeurIPS 2024
[ورقة] [كود]NeurIPS 2024
[ورقة] [مشروع]ECCV 2024
[ورقة]ECCV 2024
[ورقة] [كود]ECCV 2024
[ورقة] [كود]ECCV 2024
[ورقة] [كود]ECCV 2024
[ورقة] [كود]ECCV 2024
[ورقة]ECCV 2024
[ورقة] [كود]ECCV 2024
[الكود]ECCV 2024
[ورقة] [كود]ECCV 2024
[ورقة] [كود]ICML 2024
[ورقة]CVPR 2024
[ورقة] [الكود]CVPR 2024
[ورقة] [بيانات]CVPR 2024
[ورقة] [الكود]CVPR 2024
[ورقة] [الكود]CVPR 2024
[ورقة]CVPR 2024
[ورقة] [الكود]CVPR 2024
[ورقة] [الكود]ICLR 2024
[ورقة] [الكود]ICLR 2024
[ورقة]ICLR 2024
[ورقة] [الكود]arXiv 2024.12
[ورقة] [كود]arXiv 2024.12
[ورقة] [مشروع]arXiv 2024.12
[ورقة]arXiv 2024.12
[ورقة] [مشروع]arXiv 2024.12
[ورقة] [كود]arXiv 2024.12
[ورقة] [كود]arXiv 2024.12
[ورقة] [كود]arXiv 2024.12
[ورقة]arXiv 2024.12
[ورقة] [صفحة المشروع]arXiv 2024.11
[ورقة] [كود]arXiv 2024.11
[ورقة]arXiv 2024.11
[ورقة] [صفحة المشروع]arXiv 2024.10
[ورقة] [صفحة المشروع]arXiv 2024.10
[ورقة] [صفحة المشروع]arXiv 2024.10
[ورقة] [صفحة المشروع]arXiv 2024.9
[ورقة] [كود]arXiv 2024.9
[ورقة]arXiv 2024.9
[ورقة] [كود]arXiv 2024.9
[ورقة]arXiv 2024.9
[ورقة]arXiv 2024.8
[ورقة]arXiv 2024.8
[ورقة]arXiv 2024.7
[ورقة] [كود]arXiv 2024.7
[ورقة]arXiv 2024.6
[ورقة]arXiv 2024.6
[ورقة] [كود]arXiv 2024.6
[ورقة] [كود]arXiv 2024.6
[ورقة] [كود]arXiv 2024.6
[ورقة] [كود]arXiv 2024.5
[ورقة] [كود]arXiv 2024.5
[ورقة] [كود]arXiv 2024.5
[ورقة] [كود]arXiv 2024.5
[ورقة] [كود]arXiv 2024.4
[ورقة] [كود]arXiv 2024.3
[ورقة] [مشروع]arXiv 2024.3
[ورقة] [كود]ICRA 2023
[ورقة] [الكود]arXiv 2023.12
[ورقة] [كود]arXiv 2023.11
[ورقة]arXiv 2023.11
[ورقة]arXiv 2023.9
[ورقة]arXiv 2023.9
[ورقة]arXiv 2023.8
[ورقة] [كود]NeurIPS 2022
[ورقة] [كود]NeurIPS 2022 Spotlight
[ورقة] [كود]ICRA 2022
[ورقة]IROS 2022
[ورقة]NeurIPS 2022 workshop
[ورقة] NVIDIA
[ورقة] [رمز] [ SMAC ] الإجابات المرتكزة على مشكلة اتخاذ القرار متعدد الوكلاء من خلال النموذج العالمي التوليدي. NeurIPS 2024
[ورقة]
[ CoWorld ] إنشاء RL عبر الإنترنت دون اتصال بالإنترنت: نماذج عالمية تعاونية للتعلم المعزز البصري دون اتصال بالإنترنت. NeurIPS 2024
[ورقة] [موقع الكتروني] [رمز الشعلة]
[ الماس ] الانتشار للنمذجة العالمية: التفاصيل المرئية مهمة في أتاري. NeurIPS 2024
[ورقة] [كود]
PIVOT-R : النموذج العالمي المدرك لإحداثيات الطريق البدائي للتلاعب الآلي. NeurIPS 2024
[ورقة]
[ MUN ] نماذج التعلم العالمية للتنقل غير المقيد للأهداف. NeurIPS 2024
[ورقة] [كود]
VidMan : استغلال الديناميكيات الضمنية من نموذج نشر الفيديو للتلاعب الفعال بالروبوت. NeurIPS 24
[ورقة]
نماذج العالم التكيفية : سلوكيات التعلم بالخيال الكامن في ظل اللاسكونية. NeurIPSW 2024
[ورقة]
ظهور نماذج عالمية ضمنية من عوامل بشرية. NeurIPSW 2024
[ورقة]
التمثيل العالمي السببي في نموذج GPT. NeurIPSW 2024
[ورقة]
PreLAR : التدريب المسبق للنموذج العالمي مع تمثيل العمل القابل للتعلم. ECCV 2024
[ورقة] [كود]
[ CWM ] فهم الديناميكيات الفيزيائية من خلال نمذجة العالم المخالف للواقع. ECCV 2024
[ورقة] [كود]
ManiGaussian : الرش الغاوسي الديناميكي للتلاعب الآلي متعدد المهام. ECCV 2024
[ورقة] [كود]
[ DWL ] تطوير حركة الإنسان: إتقان التضاريس الصعبة مع تقليل الضوضاء من التعلم النموذجي العالمي. RSS 2024 (Best Paper Award Finalist)
[ورقة]
[ LLM-Sim ] هل يمكن لنماذج اللغة أن تكون بمثابة محاكيات عالمية قائمة على النصوص؟ ACL
[ورقة] [رمز]
RoboDreamer : تعلم نماذج العالم التركيبية لخيال الروبوت. ICML 2024
[الورقة] [الكود]
[ Δ-IRIS ] نماذج عالمية فعالة مع ترميز مدرك للسياق. ICML 2024
[الورقة] [الكود]
AD3 : الفعل الضمني هو مفتاح النماذج العالمية لتمييز المشتتات البصرية المتنوعة. ICML 2024
[ورقة]
هيروس : الخيال الهرمي على النماذج العالمية لتسلسل الفضاء المنظم. ICML 2024
[ورقة]
[ HRSSM ] تعلم التمثيلات الديناميكية القوية الكامنة للنماذج العالمية. ICML 2024
[الورقة] [الكود]
HarmonyDream : تنسيق المهام داخل النماذج العالمية. ICML 2024
[الورقة] [الكود]
[ REM ] تحسين النماذج العالمية القائمة على الرمز المميز مع التنبؤ بالملاحظة الموازية. ICML 2024
[الورقة] [الكود]
هل توفر نماذج عالم المحولات تدرجات أفضل للسياسة؟ ICML 2024
[ورقة]
TD-MPC2 : نماذج عالمية قوية وقابلة للتطوير للتحكم المستمر. ICLR 2024
[ورقة] [رمز الشعلة]
DreamSmooth : تحسين التعلم المعزز القائم على النموذج من خلال تجانس المكافأة. ICLR 2024
[ورقة]
[ R2I ] إتقان مهام الذاكرة باستخدام النماذج العالمية. ICLR 2024
[ورقة] [رمز JAX]
مامبا : نهج نموذجي عالمي فعال للتعلم المعزز. ICLR 2024
[ورقة] [الكود]
تعلم أسطول الروبوتات التفاعلية متعددة المهام باستخدام نماذج العالم المرئي. CoRL 2024
[ورقة] [كود]
نحو نماذج عالمية قابلة للتفسير جسديًا : تمثيلات ذات معنى ضعيفة الإشراف للتنبؤ بالمسار البصري. arXiv 2024.12
[ورقة]
حلم التلاعب : نماذج عالمية تركيبية تعمل على تمكين تعلم تقليد الروبوتات بالخيال. arXiv 2024.12
[ورقة] [مشروع]
يستخدم المحولون نماذج العالم السببية في مهام حل المتاهة. arXiv 2024.12
[ورقة]
Owl-1 : نموذج Omni World لإنشاء مقاطع فيديو طويلة ومتسقة. arXiv 2024.12
[ورقة] [كود]
StoryWeaver : نموذج عالمي موحد لتخصيص شخصيات القصة المعززة بالمعرفة. arXiv 2024.12
[ورقة] [كود]
SimuDICE : تحسين السياسة دون الاتصال بالإنترنت من خلال تحديثات النموذج العالمي وتقدير DICE. BNAIC 2024
[ورقة]
الاستكشاف المحدود مع عدم اليقين في النموذج العالمي في خوارزمية تعلم تعزيز الممثل والناقد. arXiv 2024.12
[ورقة]
الجني 2 : نموذج عالمي مؤسسي واسع النطاق. 2024.12
Google DeepMind
[مدونة]
[ NWM ] نماذج عالم الملاحة. arXiv 2024.12
Yann LeCun
[ورقة] [مشروع]
المصفوفة : الجيل العالمي للأفق اللانهائي مع التحكم في الحركة في الوقت الحقيقي. arXiv 2024.12
[ورقة] [مشروع]
مطالبة الحركة : التحكم في إنشاء الفيديو باستخدام مسارات الحركة. arXiv 2024.12
[ورقة] [مشروع]
مستكشف العالم التوليدي. arXiv 2024.11
[ورقة] [مشروع]
[ WebDreamer ] هل تعتبر شهادة الماجستير في القانون نموذجًا عالميًا للإنترنت سرًا؟ التخطيط القائم على النموذج لوكلاء الويب. arXiv 2024.11
[ورقة] [كود]
الحوت : نحو نماذج عالمية قابلة للتعميم والتوسع من أجل اتخاذ القرارات المجسدة. arXiv 2024.11
[ورقة]
DINO-WM : النماذج العالمية ذات الميزات المرئية المدربة مسبقًا تتيح التخطيط بدون طلقة. arXiv 2024.11
Yann LeCun
[ورقة]
قوانين التوسع لوكلاء التدريب المسبق والنماذج العالمية. arXiv 2024.11
[ورقة]
[ Phyworld ] إلى أي مدى يبعد إنشاء الفيديو عن النموذج العالمي: منظور القانون الفيزيائي. arXiv 2024.11
[ورقة] [مشروع]
IGOR : تمثيلات Image-GOal هي وحدات التحكم الذرية لنماذج الأساس في الذكاء الاصطناعي المتجسد. arXiv 2024.10
[ورقة] [مشروع]
إيفا : نموذج عالمي مجسد لتوقعات الفيديو المستقبلية. arXiv 2024.10
[ورقة]
التوقع البصري : تعلم النماذج العالمية المجردة باستخدام المسندات الرمزية العصبية لتخطيط الروبوت. arXiv 2024.10
[ورقة]
[ LLMCWM ] وكلاء اللغة يلتقون بالسببية - سد الفجوة بين ماجستير إدارة الأعمال ونماذج العالم السببية. arXiv 2024.10
[ورقة] [كود]
نماذج عالمية خالية من المكافآت للتعلم بالتقليد عبر الإنترنت. arXiv 2024.10
[ورقة]
وكلاء الويب مع النماذج العالمية : التعلم والاستفادة من ديناميكيات البيئة في التنقل عبر الويب. arXiv 2024.10
[ورقة]
[ GLIMO ] تأسيس نماذج لغوية كبيرة في بيئة مجسدة مع نماذج عالمية غير كاملة. arXiv 2024.10
[ورقة]
AVID : تكييف نماذج نشر الفيديو مع النماذج العالمية. arXiv 2024.10
[ورقة] [كود]
[ WMP ] الإدراك العالمي القائم على النموذج لحركة الأرجل البصرية. arXiv 2024.9
[ورقة] [مشروع]
[ OSWM ] نماذج عالمية ذات طلقة واحدة باستخدام محول تم تدريبه على مادة اصطناعية سابقة. arXiv 2024.9
[ورقة]
R-AIF : حل المهام الروبوتية ذات المكافآت المتفرقة من وحدات البكسل باستخدام الاستدلال النشط والنماذج العالمية. arXiv 2024.9
[ورقة]
تمثيل المعلومات الموضعية في النماذج العالمية التوليدية لمعالجة الكائنات. arXiv 2024.9
[ورقة]
تحويل النماذج اللغوية الكبيرة إلى نماذج عالمية مع معرفة الشروط المسبقة والتأثير. arXiv 2024.9
[ورقة]
DexSim2Real$^2$ : بناء نموذج عالمي واضح للتلاعب الدقيق بالأشياء المفصلية. arXiv 2024.9
[ورقة]
الاستكشاف الفعال والتعلم النموذجي العالمي التمييزي باستخدام التجريد المتمركز حول الكائنات. arXiv 2024.8
[ورقة]
[ MoReFree ] النماذج العالمية تزيد من الاستقلالية في التعلم المعزز. arXiv 2024.8
[ورقة] [مشروع]
UrbanWorld : نموذج عالمي حضري لجيل المدن ثلاثي الأبعاد. arXiv 2024.7
[ورقة]
PWM : تعلم السياسات باستخدام نماذج عالمية كبيرة. arXiv 2024.7
[ورقة] [كود]
التنبؤ مقابل التمثيل : المفاضلة بين النمذجة العالمية ونمذجة الوكيل. arXiv 2024.7
[ورقة]
[ GenRL ] نماذج عالمية أساسية متعددة الوسائط للوكلاء المتجسدين بشكل عام. arXiv 2024.6
[ورقة] [كود]
[ DLLM ] نماذج عالمية تحتوي على تلميحات لنماذج لغوية كبيرة لتحقيق الأهداف. arXiv 2024.6
[ورقة]
الخريطة المعرفية لنماذج اللغة: التخطيط الأمثل من خلال التمثيل اللفظي للنموذج العالمي. arXiv 2024.6
[ورقة]
CityBench : تقييم قدرات نموذج اللغة الكبير كنموذج عالمي. arXiv 2024.6
[ورقة] [كود]
CoDreamer : نماذج العالم اللامركزية القائمة على الاتصالات. arXiv 2024.6
[ورقة]
[ EBWM ] النماذج العالمية القائمة على الطاقة الملهمة معرفيًا. arXiv 2024.6
[ورقة]
تقييم النموذج العالمي الضمني في النموذج التوليدي. arXiv 2024.6
[ورقة] [كود]
المحولات وترميز الفتحات لنمذجة العالم المادي بكفاءة. arXiv 2024.5
[ورقة] [كود]
[ محرك الدمى ] نماذج العالم الهرمية كوحدات تحكم بصرية لكامل الجسم البشري. arXiv 2024.5
Yann LeCun
[ورقة] [كود]
نموذج BWArea : نموذج عالم التعلم، والديناميكيات العكسية، وسياسة إنشاء لغة يمكن التحكم فيها. arXiv 2024.5
[ورقة]
باندورا : نحو نموذج عالمي عام مع إجراءات اللغة الطبيعية وحالات الفيديو. [الورقة] [الكود]
[ WKM ] تخطيط الوكيل باستخدام نموذج المعرفة العالمية. arXiv 2024.5
[ورقة] [كود]
نيوتن ™ – نموذج الأساس الأول من نوعه لفهم العالم المادي. Archetype AI
[مدونة]
التنافس والتأليف : تعلم الآليات المستقلة للنماذج العالمية المعيارية. arXiv 2024.4
[ورقة]
MagicTime : نماذج إنشاء الفيديو بفاصل زمني كمحاكاة متحولة. arXiv 2024.4
[ورقة] [كود]
الحلم بعوالم عديدة : تعلم نماذج العالم السياقية يساعد على تعميم اللقطة الصفرية. arXiv 2024.3
[ورقة] [كود]
ManiGaussian : الرش الغاوسي الديناميكي للتلاعب الآلي متعدد المهام. arXiv 2024.3
[ورقة] [كود]
V-JEPA : الهندسة التنبؤية لدمج الفيديو المشترك. Meta AI
Yann LeCun
[مدونة] [ورقة] [كود]
[ IWM ] التعلم والاستفادة من النماذج العالمية في تعلم التمثيل البصري. Meta AI
[ورقة]
الجني : البيئات التفاعلية التوليدية DeepMind
[مقالة] [مدونة]
[ سورا ] نماذج توليد الفيديو كمحاكاة للعالم. OpenAI
[التقرير الفني]
[ LWM ] النموذج العالمي للفيديو واللغة ذات المليون طول مع RingAttention. arXiv 2024.2
[ورقة] [كود]
التخطيط مع مجموعة من النماذج العالمية. OpenReview
[ورقة]
WorldDreamer : نحو نماذج عالمية عامة لتوليد الفيديو من خلال توقع الرموز المقنعة. arXiv 2024.1
[ورقة] [كود]
ICLR 2023 Oral
[ورقة] [رمز الشعلة]NIPS 2023
[ورقة] [رمز الشعلة]ICLR 2023
[ورقة] [رمز الشعلة]arXiv 2023.8
[ورقة] [كود JAX]arXiv 2023.1
[ورقة] [كود JAX] [كود الشعلة]ICML 2022
[ورقة] [رمز الشعلة]ICML 2022
[ورقة] [كود TF]CoRL 2022
[ورقة] [كود TF]NIPS 2022
[ورق] [كود TF]NIPS 2022 Spotlight
[ورقة] [رمز الشعلة]arXiv 2022.3
[ورقة]ICLR 2021
[ورقة] [كود TF] [كود الشعلة]ICRA 2021
[ورقة]ICLR 2020
[ورقة] [كود TF] [كود الشعلة]ICML 2020
[ورقة] [رمز TF] [رمز الشعلة]NIPS 2018 Oral
[ورقة]