ai game devtools
1.0.0
سنقوم هنا بتتبع أحدث أدوات تطوير ألعاب الذكاء الاصطناعي، بما في ذلك LLM، Agent، Code، Writer، Image، Texture، Shader، 3D Model، Animation، Video، Audio، Music، Singing Voice and Analytics.
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
وكيلGPT | ؟ قم بتجميع وتكوين ونشر وكلاء الذكاء الاصطناعي المستقلين في متصفحك. | أداة | ||
AICommand | تكامل ChatGPT مع محرر الوحدة. | الوحدة | أداة | |
ايوس | LLM وكيل نظام التشغيل. | أداة | ||
عالم الذكاء الاصطناعي | عالم الذكاء الاصطناعي: نحو اكتشاف علمي مؤتمت بالكامل ومفتوح العضوية. | arXiv | أداة | |
مساعد سطر الأوامر | أداة CLI مريحة لاستخدام خدمة ChatGPT | أداة | ||
لصناعة السيارات في جي بي تي | محاولة تجريبية مفتوحة المصدر لجعل GPT-4 مستقلاً تمامًا. | أداة | ||
BabyAGI | يعد برنامج Python النصي هذا مثالاً على نظام إدارة المهام الذي يعمل بالذكاء الاصطناعي. | أداة | ||
؟؟ واجهة مستخدم BabyAGI | تم تصميم BabyAGI UI لتسهيل التشغيل والتطوير باستخدام babyagi في تطبيق ويب، مثل ChatGPT. | أداة | ||
بايتشوان-7B | نموذج لغة ما قبل التدريب 7B واسع النطاق تم تطويره بواسطة Baichuan. | أداة | ||
بايتشوان-13ب | نموذج لغة كبير 13B تم تطويره بواسطة Baichuan Intelligent Technology. | أداة | ||
بايتشوان 2 | سلسلة من نماذج اللغات الكبيرة التي طورتها شركة Baichuan Intelligent Technology. | أداة | ||
بيشينغ | Bisheng عبارة عن منصة مفتوحة لمطوري LLM لتطبيقات الذكاء الاصطناعي من الجيل التالي. | أداة | ||
حرف-LLM | وكيل قابل للتدريب على لعب الأدوار. | arXiv | أداة | |
ChatDev | وكلاء الاتصالات لتطوير البرمجيات. | arXiv | أداة | |
وحدة ChatGPT-API | ربط واجهة برمجة تطبيقات إكمال الدردشة ChatGPT بـ C# النقي على Unity. | الوحدة | أداة | |
ChatGPTForUnity | ChatGPT من أجل الوحدة. | الوحدة | أداة | |
ChatRWKV | يشبه ChatRWKV ChatGPT ولكنه مدعوم بنموذج لغة RWKV (100% RNN) ومفتوح المصدر. | أداة | ||
ChatYuan | نموذج لغة كبير للحوار باللغتين الصينية والإنجليزية. | أداة | ||
الصينية-اللاما-ألبكة-3 | (Llama-3 LLMs الصينية) تم تطويرها من Meta Llama 3. | أداة | ||
كروم-GPT | وكيل AutoGPT الذي يتحكم في Chrome على سطح المكتب. | أداة | ||
CogVLM | CogVLM، نموذج أساسي قوي للغة مرئية مفتوح المصدر. | arXiv | أداة | |
كور نت | مكتبة لتدريب الشبكات العصبية العميقة. | أداة | ||
الكون | Cosmos عبارة عن منصة عالمية لتطوير النماذج تتكون من نماذج أساسية عالمية ورموز مميزة وخط أنابيب لمعالجة الفيديو لتسريع تطوير الذكاء الاصطناعي المادي في مختبرات الروبوتات والمركبات السمعية والبصرية. | ماجستير | ||
دي بي آر إكس | DBRX هو نموذج لغة كبير تم تدريبه بواسطة Databricks. | أداة | ||
DCLM | DataComp لنماذج اللغة. | arXiv | أداة | |
ديب سيك-V3 | DeepSeek-V3 هو نموذج لغة قوي لمزيج الخبراء (MoE) مع إجمالي 671B من المعلمات مع 37B منشطة لكل رمز مميز. | arXiv | ماجستير | |
DemoGPT | مولد تطبيقات Auto Gen-AI بقوة Llama 2 | أداة | ||
Design2Code | أتمتة هندسة الواجهة الأمامية | أداة | ||
ديفيكا | Devika هو مهندس برمجيات الذكاء الاصطناعي الوكيل. | أداة | ||
ديفون | مبرمج ثنائي مفتوح المصدر. | أداة | ||
دورا | إنشاء مواقع ويب قوية، موجه واحد في كل مرة. | أداة | ||
فلووايز | قم بسحب وإفلات واجهة المستخدم لإنشاء تدفق LLM مخصص باستخدام LangchainJS. | أداة | ||
تَوأَم | تم تصميم Gemini من الألف إلى الياء لتعدد الوسائط - التفكير بسلاسة عبر النصوص والصور والفيديو والصوت والتعليمات البرمجية. | أداة | ||
جيما | Gemma هي عائلة من النماذج المفتوحة خفيفة الوزن والمتطورة والمبنية على الأبحاث والتكنولوجيا المستخدمة لإنشاء نماذج Google Gemini. | أداة | ||
Gemma.cpp | محرك استدلال C++ مستقل وخفيف الوزن لنماذج Gemma من Google. | أداة | ||
جي إل إم-4 | GLM-4-9B هو إصدار مفتوح المصدر لأحدث جيل من النماذج المدربة مسبقًا في سلسلة GLM-4 التي أطلقتها شركة Zhipu AI. | أداة | ||
GPT4All | روبوت دردشة تم تدريبه على مجموعة ضخمة من بيانات المساعد النظيفة بما في ذلك التعليمات البرمجية والقصص والحوار. | أداة | ||
جي بي تي-4o | يعد GPT-4o ("o" لـ "omni") خطوة نحو تفاعل أكثر طبيعية بين الإنسان والحاسوب - فهو يقبل كمدخلات أي مجموعة من النص والصوت والصورة والفيديو ويولد أي مجموعة من النص والصوت والصورة النواتج. | أداة | ||
جي بي تي سكريبت | تطوير تطبيقات LLM باللغة الطبيعية. | أداة | ||
جروك-1 | الأوزان والهندسة المعمارية لنموذج خليط الخبراء الذي يحتوي على 314 مليار معلمة، Grok-1. | أداة | ||
HuggingChat | جعل أفضل نماذج دردشة الذكاء الاصطناعي في المجتمع متاحة للجميع. | أداة | ||
معانقة الوجه API التكامل التكامل | توفر حزمة Unity هذه تكاملًا سهل الاستخدام لواجهة برمجة تطبيقات Hugging Face Inference، مما يسمح للمطورين بالوصول إلى نماذج Hugging Face AI واستخدامها ضمن مشاريع Unity الخاصة بهم. | الوحدة | أداة | |
إيماجبيند | ImageBind مساحة تضمين واحدة لربطهم جميعًا. | arXiv | أداة | |
الفهرس 1.9 ب | LLM خفيف الوزن ومتعدد اللغات من SOTA. | أداة | ||
InteractML-الوحدة | InteractML، إطار عمل للبرمجة المرئية للتعلم الآلي التفاعلي لـ Unity3D. | الوحدة | أداة | |
InteractML-محرك غير واقعي | جلب التعلم الآلي إلى محرك غير واقعي. | محرك غير واقعي | أداة | |
المتدربLM | قامت شركة InternLM بفتح مصدر مفتوح لنموذج أساسي مكون من 7 مليارات معلمة، وهو نموذج دردشة مصمم خصيصًا للسيناريوهات العملية ونظام التدريب. | arXiv | أداة | |
InterLM-XComposer | يعد InternLM-XComposer2 نموذجًا كبيرًا مبتكرًا للغة الرؤية (VLLM) يتفوق في تكوين الصور النصية الحرة واستيعابها. | arXiv | أداة | |
يناير | جلب الذكاء الاصطناعي إلى سطح المكتب الخاص بك. | أداة | ||
لاميني | يسمح Lamini لأي فريق هندسي بالتفوق في أداء LLM للأغراض العامة من خلال RLHF وضبط البيانات الخاصة به. | أداة | ||
لاميني-LM | LaMini-LM عبارة عن مجموعة من النماذج اللغوية الصغيرة الحجم والفعالة المستخرجة من ChatGPT وتم تدريبها على مجموعة بيانات واسعة النطاق مكونة من 2.58 مليون تعليمات. | أداة | ||
لانجشين | LangChain هو إطار عمل لتطوير التطبيقات التي تدعمها نماذج اللغة. | أداة | ||
لانج فلو | ⛓️ LangFlow عبارة عن واجهة مستخدم لـ LangChain، تم تصميمها باستخدام التدفق التفاعلي لتوفير طريقة سهلة لتجربة التدفقات النموذجية. | أداة | ||
لافاج | أتمتة الأتمتة باستخدام إطار عمل نموذج العمل الكبير. | أداة | ||
ليمور | نماذج التأسيس المفتوحة لوكلاء اللغة. | أداة | ||
ليبتون الذكاء الاصطناعي | إطار عمل بايثوني لتبسيط بناء خدمات الذكاء الاصطناعي. | أداة | ||
مضاءة اللاما | تنفيذ نموذج لغة LLaMA المعتمد على تقنية nanoGPT. يدعم انتباه الفلاش، وتكميم Int8 وGPTQ 4bit، وضبط LoRA وLLaMA-Adapter، والتدريب المسبق. | أداة | ||
llama2-webui | قم بتشغيل Llama 2 محليًا باستخدام واجهة المستخدم المتدرجة على وحدة معالجة الرسومات أو وحدة المعالجة المركزية من أي مكان (Linux/Windows/Mac). | أداة | ||
اللاما 3 | الموقع الرسمي لـ Meta Llama 3 على GitHub. | أداة | ||
اللاما 3.1 | Llama هو نموذج لغة كبير مفتوح وسهل الوصول إليه (LLM) مصمم للمطورين والباحثين والشركات لبناء أفكار الذكاء الاصطناعي التوليدية الخاصة بهم وتجربتها وتوسيع نطاقها بشكل مسؤول. | أداة | ||
LLaSM | نموذج كبير للغة والكلام. | أداة | ||
محرك الإجابة LLM | أنشئ محرك إجابات مستوحى من الحيرة باستخدام Next.js وGroq وMixtral وLangchain وOpenAI وBrave وSerper. | أداة | ||
llm.c | تدريب LLM على لغة C/CUDA البسيطة والخام. | أداة | ||
LLMunity | قم بإنشاء شخصيات في Unity مع LLMs! | الوحدة | أداة | |
LLocalSearch | LLocalSearch هو محرك بحث يعمل محليًا بالكامل باستخدام LLM Agents. | أداة | ||
LogicGamesSolver | أداة بايثون لحل الألعاب المنطقية باستخدام الذكاء الاصطناعي والتعلم العميق ورؤية الكمبيوتر. | أداة | ||
كاتب طويل | LongWriter: إطلاق العنان لأكثر من 10,000 كلمة من دورات LLM ذات السياق الطويل. | arXiv | أداة | |
النموذج العالمي الكبير (LWM) | النموذج العالمي الكبير (LWM) هو نموذج انحدار ذاتي متعدد الوسائط للأغراض العامة. | arXiv | أداة | |
لومينا-T2X | Lumina-T2X هو إطار عمل موحد لإنشاء النصوص لأي طريقة. | arXiv | أداة | |
ميتاGPT | الإطار متعدد الوكلاء | أداة | ||
MiniCPM-2B | يتفوق LLM على الجانب النهائي على Llama2-13B. | أداة | ||
ميني جي بي تي-4 | تعزيز فهم لغة الرؤية باستخدام نماذج اللغة الكبيرة المتقدمة. | arXiv | أداة | |
ميني جي بي تي-5 | توليد الرؤية واللغة المتداخلة عبر Geneative Vokens. | arXiv | أداة | |
ميكسترال 8x7B | مزيج متناثر عالي الجودة من الخبراء. | arXiv | أداة | |
ميسترال 7 ب | أفضل نموذج 7B حتى الآن، Apache 2.0. | أداة | ||
ميسترال كبير | يعد Mistral Large نموذجًا جديدًا ومتطورًا لإنشاء النصوص. يصل إلى قدرات التفكير من الدرجة الأولى. | أداة | ||
إم إل سي إل إل إم | تمكين الجميع من تطوير نماذج الذكاء الاصطناعي وتحسينها ونشرها محليًا على أجهزة الجميع. | أداة | ||
MobiLlama | نحو GPT دقيقة وخفيفة الوزن وشفافة بالكامل. | arXiv | أداة | |
مو-لافا | مزيج من الخبراء لنماذج الرؤية واللغة الكبيرة. | arXiv | أداة | |
موشي | موشي هو ذكاء اصطناعي تجريبي للمحادثة. | أداة | ||
موشي | موشي: نموذج أساس الكلام والنص للحوار في الوقت الحقيقي. | أداة | ||
طحلب | نموذج لغة محادثة معزز بأداة مفتوحة المصدر من جامعة فودان. | أداة | ||
mPLUG-البومة؟ | تعمل النمذجة على تمكين نماذج اللغات الكبيرة باستخدام الوسائط المتعددة. | arXiv | أداة | |
نيموترون-4 | نموذج لغة كبير متعدد اللغات مكون من 15 مليار معلمة تم تدريبه على 8 تريليون رمز نصي. | arXiv | أداة | |
نيكست-GPT | نموذج لغة كبير متعدد الوسائط من أي إلى أي نموذج. | أداة | ||
أولمو | فتح نموذج اللغة | arXiv | أداة | |
أومنيLMM | نماذج كبيرة متعددة الوسائط لتحقيق أداء قوي ونشر فعال. | أداة | ||
OneLLM | إطار واحد لمواءمة جميع الطرائق مع اللغة. | arXiv | أداة | |
مساعد مفتوح | OpenAssistant هو مساعد قائم على الدردشة يفهم المهام، ويمكنه التفاعل مع أنظمة الطرف الثالث، واسترداد المعلومات ديناميكيًا للقيام بذلك. | أداة | ||
OpenDevin | مهندس برمجيات الذكاء الاصطناعي المستقل. | أداة | ||
أوريون-14ب | Orion-14B هي عائلة من النماذج تتضمن LLM Foundation 14B، وسلسلة من النماذج. | arXiv | أداة | |
الباندا | نموذج لغة كبيرة مفتوح المصدر للصينيين في الخارج، يعتمد على Llama-7B، -13B، -33B، -65B للتدريب المسبق المستمر في المجال الصيني. | أداة | ||
بيربليكسيكا | محرك بحث يعمل بالذكاء الاصطناعي. | أداة | ||
باي | تم تصميم chatbot AI للمساعدة الشخصية والدعم العاطفي. | أداة | ||
كوين1.5 | Qwen1.5 هو الإصدار المحسن من Qwen. | أداة | ||
كوين2 | Qwen2 هي سلسلة نماذج لغوية كبيرة تم تطويرها بواسطة فريق Qwen، Alibaba Cloud. | أداة | ||
كوين-7ب | الريبو الرسمي لـ Qwen-7B (通义千问-7B) للدردشة ونموذج اللغة الكبير المدرب مسبقًا الذي اقترحته Alibaba Cloud. | أداة | ||
RepoAgent | RepoAgent هو مشروع مفتوح المصدر يعتمد على نماذج اللغات الكبيرة (LLMs) ويهدف إلى توفير طريقة ذكية لتوثيق المشاريع. | arXiv | أداة | |
محرك الذكاء الاصطناعي العقلي | محرك Sanity AI لأداة تطوير لعبة Unity. | الوحدة | أداة | |
بحثGPT | ؟ ربط ChatGPT بالإنترنت | أداة | ||
مشاركةGPT4V | تحسين النماذج الكبيرة متعددة الوسائط باستخدام تسميات توضيحية أفضل. | أداة | ||
سكاي وورك | تم تدريب نماذج سلسلة Skywork مسبقًا على 3.2 تيرابايت من البيانات عالية الجودة متعددة اللغات (الصينية والإنجليزية بشكل أساسي) والبيانات البرمجية. | أداة | ||
StableLM | نماذج لغة الذكاء الاصطناعي المستقرة. | arXiv | أداة | |
ستانفورد ألباكا | نموذج LLaMA يتبع التعليمات. | أداة | ||
واجهة مستخدم ويب لإنشاء النص | واجهة مستخدم ويب متدرجة لتشغيل نماذج اللغات الكبيرة مثل LLaMA وllama.cpp وGPT-J وOPT وGALACTICA. | أداة | ||
TinyChatEngine | مكتبة استدلال LLM على الجهاز. | أداة | ||
ToolBench | منصة مفتوحة للتدريب والخدمة وتقييم نموذج اللغة الكبير لتعلم الأدوات. | أداة | ||
الوحدة ChatGPT | تجارب الوحدة ChatGPT. | الوحدة | أداة | |
تكامل الوحدة OpenAI-API | دمج نموذج لغة openai GPT-3 وواجهة برمجة تطبيقات ChatGPT في مشروع Unity. | الوحدة | أداة | |
محرك غير واقعي 5 لاما لورا | مشروع إثبات المفهوم الذي يعرض إمكانية استخدام LLMs الصغيرة القابلة للتدريب محليًا لإنشاء أدوات التوثيق من الجيل التالي. | محرك غير واقعي | أداة | |
غير واقعيGPT | مجموعة من أدوات Unreal Engine 5 Editor Utility المدعومة بـ GPT3/4. | محرك غير واقعي | أداة | |
فيديو-LLaVA | تعلم التمثيل البصري المتحد عن طريق المحاذاة قبل العرض. | arXiv | أداة | |
WebGPT | قم بتشغيل نموذج GPT على المتصفح باستخدام WebGPU. | أداة | ||
Web3-GPT | نشر العقود الذكية مع الذكاء الاصطناعي | أداة | ||
WordGPT | ؟ جلب قوة ChatGPT إلى Microsoft Word | أداة | ||
XAgent | وكيل LLM مستقل لحل المهام المعقدة. | أداة | ||
يي | سلسلة من نماذج اللغات الكبيرة التي تم تدريبها من الصفر بواسطة المطورين. | أداة | ||
01 المشروع | الكمبيوتر النموذجي للغة مفتوح المصدر. | أداة |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
AgentBench | معيار شامل لتقييم LLMs كوكلاء. | arXiv | عامل | |
دردشة مجموعة الوكيل | دردشة جماعية تفاعلية Simulacra لتحسين استخلاص السلوك الجماعي الناشئ. | arXiv | عامل | |
الوكيل ك | AGI ذاتي التطور ذاتيًا ومعياريًا. | عامل | ||
AgentScope | ابدأ في إنشاء تطبيقات متعددة الوكلاء مدعومة بـ LLM بطريقة أسهل. | arXiv | عامل | |
AgentSims | صندوق رمل مفتوح المصدر لتقييم نماذج اللغات الكبيرة. | عامل | ||
مدينة الذكاء الاصطناعي | AI Town هي مدينة افتراضية يعيش فيها شخصيات الذكاء الاصطناعي ويدردشون ويتواصلون اجتماعيًا. | عامل | ||
Anime.gf | بديل محلي ومفتوح المصدر لـ CharacterAI. | لعبة | ||
أستروكاد | إنشاء ألعاب باستخدام الذكاء الاصطناعي | لعبة | ||
وكلاء الذرية | تم تصميم إطار عمل Atomic Agents ليكون معياريًا وقابل للتوسيع وسهل الاستخدام. | عامل | ||
وكلاء تلقائيون | إطار عمل لإنشاء الوكيل التلقائي. | عامل | ||
إنشاء تلقائي | تمكين تطبيقات نماذج اللغة الكبيرة من الجيل التالي. | arXiv | عامل | |
com.behaviac | Behaviac هو إطار عمل لتطوير الذكاء الاصطناعي للعبة. | نطاق | ||
المناطق الأحيائية | Biomes عبارة عن لعبة MMORPG مفتوحة المصدر مصممة للويب باستخدام تقنيات الويب مثل Next.js وTypescript وReact وWebAssembly. | لعبة | ||
المخزن المؤقت للأفكار | الاستدلال المعزز بالفكر باستخدام نماذج لغوية كبيرة. | arXiv | عامل | |
وكيل بيزر | إطار وكيل سهل وسريع وموزع للجميع. | عامل | ||
مدينة القطط | AC(h) في محاكاة تعمل بتقنية GPT مع القطط. | عامل | ||
مدينة القطط | AC(h) في محاكاة تعمل بتقنية GPT مع القطط. | عامل | ||
حرفGLM | تخصيص أحرف الذكاء الاصطناعي للمحادثة الصينية باستخدام نماذج لغوية كبيرة. | arXiv | عامل | |
ChatDev | وكلاء الاتصالات لتطوير البرمجيات. | arXiv | عامل | |
CogAgent | CogAgent هو نموذج لغة مرئية مفتوح المصدر تم تحسينه استنادًا إلى CogVLM. | arXiv | عامل | |
مهد | نحو التحكم العام بالكمبيوتر. | عامل | ||
CrewAI | إطار عمل لتنسيق لعب الأدوار، ووكلاء الذكاء الاصطناعي المستقلين. | عامل | ||
ديفي | Dify عبارة عن منصة لبناء تطبيقات LLM مفتوحة المصدر. | عامل | ||
مشروع الحياة الرقمية | شخصيات ثلاثية الأبعاد مستقلة ذات ذكاء اجتماعي. | arXiv | عامل | |
كل شيء-منظمة العفو الدولية | مساعد chatbot المحلي الذي يتمتع بالكفاءة الكاملة والمدعوم بالذكاء الاصطناعي؟. | عامل | ||
قماش | النسيج هو إطار عمل مفتوح المصدر لتعزيز البشر باستخدام الذكاء الاصطناعي. | عامل | ||
FastGPT | FastGPT عبارة عن منصة قائمة على المعرفة مبنية على LLM. | عامل | ||
com.fastRAG | إطار تعزيز وتوليد الاسترجاع الفعال. | عامل | ||
GameAISDK | إطار عمل أتمتة الذكاء الاصطناعي للألعاب القائم على الصور. | نطاق | ||
GameNGen | نماذج الانتشار هي محركات ألعاب في الوقت الفعلي. | arXiv | لعبة | |
GameGen-O | GameGen-O: جيل ألعاب الفيديو في العالم المفتوح. | لعبة | ||
GenAgent | GenAgent: بناء أنظمة ذكاء اصطناعي تعاونية من خلال إنشاء سير العمل الآلي - دراسات حالة على ComfyUI. | arXiv | عامل | |
وكلاء التوليد | محاكاة تفاعلية للسلوك البشري. | arXiv | عامل | |
سفر التكوين | سفر التكوين: محرك فيزيائي توليدي وعالمي للروبوتات وما بعدها. | لعبة | ||
الجني | البيئات التفاعلية التوليدية. | لعبة | ||
com.giax | وقت التشغيل، الشخصيات غير القابلة للعب التي تعمل بتقنية LLM. | لعبة | ||
هيبوراج | الذاكرة طويلة المدى مستوحاة من الناحية العصبية الحيوية لنماذج اللغات الكبيرة. | arXiv | عامل | |
الشخصيات التفاعلية التي تعمل بتقنية LLM | إن الشخصيات غير القابلة للعب (NPCs) التي تعمل بتقنية LLM هي مشروع مفتوح المصدر يعمل على تحويل تفاعلك تمامًا مع الشخصيات غير اللاعبين (NPCs) في أي لعبة! | لعبة | ||
ايوا | إطار عمل مفتوح المصدر لوكلاء الذكاء الاصطناعي التعاونيين، مما يمكّن الوكلاء المتنوعين والموزعين من التعاون ومعالجة المهام المعقدة من خلال اتصال يشبه الإنترنت. | عامل | ||
KwaiAgents | نظام وكيل عام للبحث عن المعلومات مع نماذج لغوية كبيرة (LLMs). | arXiv | عامل | |
لانجشين | احصل على طلب LLM الخاص بك من النموذج الأولي إلى الإنتاج. | عامل | ||
لانجفلو | Langflow عبارة عن واجهة مستخدم لـ LangChain، تم تصميمها باستخدام التدفق التفاعلي لتوفير طريقة سهلة لتجربة التدفقات النموذجية. | عامل | ||
استوديو لانغغراف | يقدم LangGraph Studio طريقة جديدة لتطوير تطبيقات LLM من خلال توفير IDE للوكيل المتخصص الذي يتيح التصور والتفاعل وتصحيح التطبيقات الوكيلة المعقدة. | عامل | ||
لارب | لعب دور وكيل اللغة لألعاب العالم المفتوح. | arXiv | عامل | |
نظام وكيل اللاما | المكونات الوكيلة لواجهات برمجة تطبيقات Llama Stack. | عامل | ||
LlamaIndex | LlamaIndex هو إطار بيانات لتطبيق LLM الخاص بك. | عامل | ||
بحث العقل | ؟ إطار عمل متعدد الوكلاء قائم على LLM لمحرك بحث الويب (مثل Perplexity.ai Pro وSearchGPT). | عامل | ||
خليط من الوكلاء (MoA) | يعمل مزيج الوكلاء على تحسين قدرات نماذج اللغة الكبيرة. | arXiv | عامل | |
MMRدور | MMRole: إطار شامل لتطوير وتقييم وكلاء لعب الأدوار المتعددة الوسائط. | arXiv | عامل | |
Moonlander.ai | ابدأ في إنشاء ألعاب ثلاثية الأبعاد دون أي برمجة باستخدام الذكاء الاصطناعي التوليدي. | نطاق | ||
نشر MuG | MuG Diffusion عبارة عن رسم بياني للذكاء الاصطناعي لألعاب الإيقاع يعتمد على Stable Diffusion (أحد أقوى نماذج AIGC) مع تعديل كبير لدمج الموجات الصوتية. | لعبة | ||
واحة | Oasis هو نموذج عالمي تفاعلي تم تطويره بواسطة Decart وEtched. استنادًا إلى محولات الانتشار، تستقبل Oasis مدخلات لوحة مفاتيح المستخدم وتولد أسلوب اللعب بطريقة انحدارية. | لعبة | ||
OmAgent | إطار وكيل متعدد الوسائط لحل المهام المعقدة. | عامل | ||
وكيل مفتوح | منصة مفتوحة لوكلاء اللغة في البرية. | عامل | ||
التأليف | تطبيق AI يحول النص إلى لعبة فيديو. | لعبة | ||
بيبيكات | إطار عمل مفتوح المصدر للذكاء الاصطناعي للمحادثة الصوتية والمتعددة الوسائط. | عامل | ||
وكيل كوين | Qwen-Agent هو إطار عمل لتطوير تطبيقات LLM استنادًا إلى التعليمات التالية واستخدام الأداة والتخطيط وقدرات الذاكرة الخاصة بـ Qwen. | عامل | ||
راجاس | Ragas هو إطار عمل يساعدك على تقييم خطوط أنابيب توليد الاسترجاع المعزز (RAG). | عامل | ||
RPBench-Auto | خط أنابيب آلي لتقييم LLMs للعب الأدوار. | لعبة | ||
سيما | وكيل الذكاء الاصطناعي العام للبيئات الافتراضية ثلاثية الأبعاد. | عامل | ||
StoryGames.ai | الذكاء الاصطناعي للحالمين يصنعون الألعاب. | لعبة | ||
وكيل سويس | تعمل واجهات الكمبيوتر الوكيل على تمكين نماذج لغة هندسة البرمجيات. | arXiv | عامل | |
TaskGen | إطار عمل وكيل قائم على المهام يعتمد على مخرجات StrictJSON بواسطة وكلاء LLM. | عامل | ||
وكيل عشرة | يعد TEN Agent أول وكيل متعدد الوسائط في العالم في الوقت الفعلي ومتكامل مع OpenAI Realtime API وRTC، ويتميز بفحص الطقس والبحث على الويب والرؤية وإمكانيات RAG. | عامل | ||
وكيل الترجمة | الترجمة الوكيلة باستخدام سير عمل الانعكاس. | عامل | ||
تغريد | Twitter Personality هو تطبيق ويب يقوم بتحليل مقبض Twitter الخاص بك لإنشاء ملف تعريف شخصي مخصص باستخدام Wordware AI Agent. | عامل | ||
غير محدود | غير محدود: لعبة توليدية لا نهائية لمحاكاة حياة الشخصية. | arXiv | لعبة | |
Video2Game | بيئة تفاعلية وواقعية ومتوافقة مع المتصفح في الوقت الفعلي من مقطع فيديو واحد. | arXiv | لعبة | |
V-IRL | أسس الذكاء الافتراضي في الحياة الحقيقية. | arXiv | عامل | |
WebDesignAgent | وكيل يستخدم لتصميم المواقع. | عامل | ||
XAgent | وكيل LLM مستقل لحل المهام المعقدة. | عامل |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
مترجم كود الذكاء الاصطناعي | استخدم الذكاء الاصطناعي لترجمة التعليمات البرمجية من لغة إلى أخرى. | شفرة | ||
آي إكسكودر-7B | نموذج لغة aiXcoder-7B Code الكبير. | شفرة | ||
bloop | bloop هو محرك بحث سريع للأكواد مكتوب بلغة Rust. | شفرة | ||
تشابيتر | مترجم كود ChatGPT في دفاتر Jupyter. | شفرة | ||
CodeGeeX | نموذج مفتوح لإنشاء الأكواد البرمجية متعدد اللغات. | arXiv | شفرة | |
CodeGeeX2 | نموذج أكثر قوة لإنشاء الأكواد البرمجية متعدد اللغات. | شفرة | ||
كودجيX4 | CodeGeeX4: فتح نموذج إنشاء التعليمات البرمجية متعدد اللغات. | شفرة | ||
كودجن | CodeGen هو نموذج مفتوح المصدر لتوليف البرنامج. تم تدريبه على TPU-v4. تنافسية مع OpenAI Codex. | arXiv | شفرة | |
كودجن2 | نماذج CodeGen2 لتوليف البرنامج. | arXiv | شفرة | |
كود لاما | Code Llama عبارة عن نماذج لغة كبيرة للتعليمات البرمجية تعتمد على Llama 2. | شفرة | ||
كودتف | مكتبة المحولات الشاملة لأحدث كود LLM. | شفرة | ||
كودT5 | افتح Code LLMs لفهم الكود وإنشاءه. | شفرة | ||
المؤشر | قم بكتابة التعليمات البرمجية الخاصة بك وتحريرها والدردشة حولها باستخدام GPT-4 في نوع جديد من المحررات. | شفرة | ||
ديب سيك المبرمج | DeepSeek Coder: دع الكود يكتب نفسه | arXiv | شفرة | |
مخطوطة OpenAI | OpenAI Codex هو سليل GPT-3. | شفرة | ||
بانداساي | Pandas AI هي مكتبة Python تدمج قدرات الذكاء الاصطناعي التوليدي في Pandas، مما يجعل إطارات البيانات محادثة. | شفرة | ||
RobloxScripterAI | RobloxScripterAI هي أداة لإنشاء التعليمات البرمجية مدعومة بالذكاء الاصطناعي لـ Roblox. | روبلوكس | شفرة | |
سيكيت-LLM | يمكنك دمج نماذج اللغة القوية مثل ChatGPT بسلاسة في scikit-Learn لتحسين مهام تحليل النص. | شفرة | ||
سوتانا | مساعد تطوير البرمجيات مفتوحة المصدر. | arXiv | شفرة | |
الكود المستقر 3 ب | الترميز على الحافة. | شفرة | ||
ستاركودر | ؟ StarCoder هو نموذج لغة (LM) تم تدريبه على كود المصدر ونص اللغة الطبيعية. | arXiv | شفرة | |
ستاركودر 2 | StarCoder2 هي عائلة من نماذج إنشاء التعليمات البرمجية (3B و7B و15B)، تم تدريبها على أكثر من 600 لغة برمجة من The Stack v2 وبعض نصوص اللغات الطبيعية مثل مشكلات Wikipedia وArxiv وGitHub. | arXiv | شفرة | |
UnityGen AI | UnityGen AI هو مكون إضافي لإنشاء التعليمات البرمجية مدعوم بالذكاء الاصطناعي لـ Unity. | الوحدة | شفرة | |
فارغ | Void هو بديل مفتوح المصدر للمؤشر. اكتب التعليمات البرمجية باستخدام أفضل أدوات الذكاء الاصطناعي، واحتفظ بالتحكم الكامل في بياناتك، وتمتع بالوصول إلى ميزات الذكاء الاصطناعي القوية. | شفرة |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
كاتب الذكاء الاصطناعي | يقوم الذكاء الاصطناعي بكتابة الروايات، وإنشاء مقالات ويب خيالية ورومانسية، وما إلى ذلك. النموذج التوليدي الصيني المدرب مسبقًا. | الكاتب | ||
Notebook.ai | Notebook.ai عبارة عن مجموعة من الأدوات للكتاب ومصممي الألعاب ولاعبي الأدوار لإنشاء عوالم رائعة - وكل شيء بداخلها. | الكاتب | ||
رواية | محرر WYSIWYG على طراز الفكرة مع الإكمال التلقائي المدعوم بالذكاء الاصطناعي. | الكاتب | ||
NovelAI | مدفوعًا بالذكاء الاصطناعي، يمكنك إنشاء قصص فريدة أو حكايات مثيرة أو روايات رومانسية مغرية دون ألم أو مجرد العبث. | الكاتب |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
AnyDoor | تخصيص الصور على مستوى الكائن بدون لقطة. | arXiv | صورة | |
AnyText | إنشاء وتحرير النصوص المرئية متعددة اللغات. | arXiv | صورة | |
أوتوستوديو | صياغة مواضيع متسقة في إنشاء صور تفاعلية متعددة المنعطفات. | arXiv | صورة | |
Blender-ControlNet | استخدام ControlNet مباشرة في Blender. | خلاط | صورة | |
بريفل | سد الرؤية ونموذج اللغة. | arXiv | صورة | |
كاتفتون | CatVTON: التسلسل هو كل ما تحتاجه للتجربة الافتراضية باستخدام نماذج الانتشار. | arXiv | صورة | |
CLIPasso | طريقة لتحويل صورة كائن إلى رسم تخطيطي، مما يسمح بمستويات مختلفة من التجريد. | arXiv | صورة | |
ClipDrop | أنشئ صورًا مذهلة في ثوانٍ. | صورة | ||
comfyUI | واجهة مستخدم رسومية قوية ومستقرة للنشر مع واجهة رسم بياني/عقد. | صورة | ||
ConceptLab | الجيل الإبداعي باستخدام قيود الانتشار المسبقة. | arXiv | صورة | |
كونترول نت | ControlNet عبارة عن بنية شبكة عصبية للتحكم في نماذج الانتشار عن طريق إضافة شروط إضافية. | arXiv | صورة | |
CSGO | CSGO: تكوين نمط المحتوى في إنشاء النص إلى صورة. | arXiv | صورة | |
دال·ه 2 | DALL·E 2 هو نظام ذكاء اصطناعي يمكنه إنشاء صور وأعمال فنية واقعية من وصف باللغة الطبيعية. | صورة | ||
ستوديو دشتون | Dashtoon Studio عبارة عن منصة لإنشاء القصص المصورة مدعومة بالذكاء الاصطناعي. | هزلي | ||
DeepAI | يقدم DeepAI مجموعة من الأدوات التي تستخدم الذكاء الاصطناعي لتعزيز قدراتك الإبداعية. | صورة | ||
ديب فلويد إذا | IF بواسطة مختبر DeepFloyd في StabilityAI. | صورة | ||
عمق أي شيء V2 | عمق أي شيء V2 | arXiv | صورة | |
مكتبة خريطة العمق والمشكلة | مكتبة خرائط العمق للاستخدام مع ملحق Control Net لـ Automatic1111/stable-diffusion-webui. | صورة | ||
منتشر للاختيار | إثراء الصورة المشروطة بالطلاء في نماذج الانتشار الكامنة للتجربة الافتراضية. | arXiv | صورة | |
انتشار الديسكو | مزيج صريح من دفاتر الملاحظات والنماذج والتقنيات لتوليد فنون الذكاء الاصطناعي والرسوم المتحركة. | صورة | ||
دراججان | المعالجة التفاعلية القائمة على النقاط على مشعب الصور التوليدية. | arXiv | صورة | |
ارسم الأشياء | توليد الصور بمساعدة الذكاء الاصطناعي في جيبك. | صورة | ||
DWPose | تقدير وضعية الجسم بالكامل بشكل فعال باستخدام التقطير على مرحلتين. | arXiv | صورة | |
صور سهلة | مولد الصور الذكي الخاص بك. | صورة | ||
تدفق | يحتوي هذا الريبو على الحد الأدنى من كود الاستدلال لتشغيل تحويل النص إلى صورة وصورة إلى صورة باستخدام محولات التدفق المصححة الكامنة الخاصة بـ Flux. | صورة | ||
اتبع نقرتك | الرسوم المتحركة للصور الإقليمية ذات المجال المفتوح عبر المطالبات القصيرة. | arXiv | صورة | |
فوكوس | التركيز على الحث والتوليد. | صورة | ||
GIFfusion | قم بإنشاء صور GIF ومقاطع فيديو باستخدام Stable Diffusion. | صورة | ||
مؤرض-الجزء-أي شيء | اكتشاف وتقسيم وإنشاء أي شيء تلقائيًا باستخدام مدخلات الصورة والنص والصوت. | arXiv | صورة | |
HivisionIDPhotos | HivisionIDPhotos: أدوات صور AI خفيفة الوزن وفعالة. | صورة | ||
هوا | Hua هو محرر صور يعمل بالذكاء الاصطناعي مع تقنية Stable Diffusion (والمزيد). | صورة | ||
هونيوان-ديت | محول نشر قوي متعدد الدقة مع الفهم الصيني الدقيق. | arXiv | صورة | |
آي سي لايت | IC-Light هو مشروع لمعالجة إضاءة الصور. | صورة | ||
الأ يديوغرام صورة | مساعدة الناس على أن يصبحوا أكثر إبداعا. | صورة | ||
إيماجين | Imagen هو نظام ذكاء اصطناعي يقوم بإنشاء صور واقعية من نص الإدخال. | صورة | ||
img2img-turbo | خطوة واحدة من صورة إلى صورة مع SD-Turbo. | صورة | ||
Img2Prompt | احصل على المطالبات من الصور المولدة للانتشار المستقر. | صورة | ||
إنفينيتي | إنفينيتي: تحجيم نمذجة الانحدار التلقائي لـ Bitwise لتوليف الصور عالية الدقة. | arXiv | صورة | |
المعرف الفوري | جيل الحفاظ على الهوية بدون إطلاق النار في ثوانٍ. | arXiv | صورة | |
المتدربLM-XComposer2 | يعد InternLM-XComposer2 نموذجًا كبيرًا مبتكرًا للغة الرؤية (VLLM) يتفوق في تكوين الصور النصية الحرة واستيعابها. | arXiv | صورة | |
كوالا | مسائل الاهتمام الذاتي في تقطير المعرفة لنماذج الانتشار الكامن من أجل تركيب الصور السريع والفعال في الذاكرة. | صورة | ||
كولورز | الألوان: التدريب الفعال على نموذج الانتشار لتوليف النص إلى الصورة الواقعي. | صورة | ||
كريا | أنشئ صورًا ومقاطع فيديو باستخدام أداة تصميم مبهجة تعمل بالذكاء الاصطناعي. | صورة | ||
جسر لافي | سد نماذج اللغة المختلفة ونماذج الرؤية التوليدية لتوليد النص إلى صورة. | arXiv | صورة | |
انتشار الطبقة | انتشار طبقة الصورة الشفافة باستخدام الشفافية الكامنة. | arXiv | صورة | |
ليكسيكا | يطالب الانتشار المستقر محرك البحث. | صورة | ||
لاماجين | نموذج الانحدار الذاتي يتفوق على الانتشار: اللاما لتوليد صور قابلة للتطوير. | arXiv | صورة | |
لومينا-mGPT | Lumina-mGPT: إنشاء صور واقعية ومرنة من النص إلى صورة من خلال التدريب المسبق التوليدي متعدد الوسائط. | arXiv | صورة | |
ميتاشوت | MetaShoot هو توأم رقمي لاستوديو الصور، تم تطويره كمكون إضافي لـ Unreal Engine الذي يمنح أي منشئ القدرة على إنتاج عروض واقعية للغاية بأسهل وأسرع طريقة. | محرك غير واقعي | صورة | |
منتصف الرحلة | Midjourney هو مختبر أبحاث مستقل يستكشف وسائل جديدة للفكر ويوسع القدرات التخيلية للجنس البشري. | صورة | ||
MIGC | MIGC: وحدة تحكم إنشاء المثيلات المتعددة لتوليف النص إلى الصورة. | arXiv | صورة | |
MimicBrush | تحرير الصور بدون لقطة مع التقليد المرجعي. | arXiv | صورة | |
أومنيجين | OmniGen: إنشاء الصور الموحدة. | arXiv | صورة | |
أوموست | Omost هو مشروع لتحويل قدرة الترميز LLM إلى القدرة على توليد الصور (أو بشكل أكثر دقة، تكوين الصور). | صورة | ||
محرر مفتوح | افتح المحرر لـ AUTOMATIC1111 المستقر لشبكة webui. | صورة | ||
الزي أي شخص | تجربة افتراضية فائقة الجودة لأي ملابس ولأي شخص. | صورة | ||
PaintsUndo | PaintsUndo: نموذج أساسي لسلوكيات الرسم في اللوحات الرقمية. | صورة | ||
صانع الصور | تخصيص صور بشرية واقعية عبر تضمين المعرفات المكدسة. | arXiv | صورة | |
غرفة الصور | مولد خلفية منظمة العفو الدولية. | صورة | ||
بلاسك | إنشاء صور الذكاء الاصطناعي في السحابة. | صورة | ||
موجه.فن | مركز المولدات. | صورة | ||
PuLID | تخصيص معرف Pure وLightning عبر المحاذاة التباينية. | arXiv | صورة | |
تحويل النص إلى صورة منسقة | إنشاء نص معبر إلى صورة بنص منسق. | arXiv | صورة | |
RPG-DiffusionMaster | إتقان نشر النص إلى الصورة: الاستخلاص والتخطيط والتوليد باستخدام LLM متعدد الوسائط (PRG). | صورة | ||
قصة البذور | قصة SEED: إنشاء قصة طويلة متعددة الوسائط باستخدام نموذج لغة كبير. | arXiv | صورة | |
شريحة أي شيء | نموذج تقسيم أي شيء (SAM): نموذج ذكاء اصطناعي جديد من Meta AI يمكنه "قص" أي كائن في أي صورة بنقرة واحدة. | arXiv | صورة | |
شريحة أي شيء نموذج 2 (SAM 2) | SAM 2: قسّم أي شيء في الصور ومقاطع الفيديو. | arXiv | صورة | |
SD-webui-controlnet | ملحق WebUI لـ ControlNet. | صورة | ||
SDXL-البرق | التقطير الانتشاري العدائي التدريجي. | arXiv | صورة | |
SDXS | نماذج الانتشار الكامن في الوقت الحقيقي بخطوة واحدة مع ظروف الصورة. | صورة | ||
Stable.art | مكون Photoshop الإضافي للنشر الثابت باستخدام Automatic1111 كواجهة خلفية (محليًا أو باستخدام Google Colab). | صورة | ||
تتالي مستقر | يتكون Stable Cascade من ثلاثة نماذج: المرحلة A، والمرحلة B، والمرحلة C، والتي تمثل سلسلة متتالية لتوليد الصور، ومن هنا جاء اسم "Stable Cascade". | صورة | ||
انتشار مستقر | نموذج نشر كامن من النص إلى الصورة. | صورة | ||
نشر مستقر.cpp | انتشار مستقر في C/C++ النقي. | صورة | ||
واجهة مستخدم الويب ذات الانتشار المستقر | واجهة متصفح تعتمد على مكتبة Gradio للانتشار المستقر. | صورة | ||
واجهة مستخدم الويب ذات الانتشار المستقر | واجهة مستخدم على شبكة الإنترنت للانتشار المستقر. | صورة | ||
انتشار مستقر WebUI الصينية | النسخة الصينية من webui المستقر. | صورة | ||
انتشار مستقر XL | توليد الصور من النص. | arXiv | صورة | |
انتشار مستقر XL توربو | في الوقت الحقيقي إنشاء النص إلى صورة. | صورة | ||
انتشار مستقر 3.5 | يتضمن الإصدار المفتوح Stable Diffusion 3.5 نماذج متعددة، بما في ذلك Stable Diffusion 3.5 Large وStable Diffusion 3.5 Large Turbo. | صورة | ||
رسومات الشعار المبتكرة المستقرة | Stable Doodle هي أداة رسم إلى صورة تقوم بتحويل رسم بسيط إلى صورة ديناميكية. | صورة | ||
StableStudio | StableStudio بواسطة Stability AI | صورة | ||
صانع القصص | StoryMaker: نحو شخصيات متسقة وشاملة في إنشاء النص إلى الصورة. | arXiv | صورة | |
StreamDiffusion | حل على مستوى خط الإنتاج للإنشاء التفاعلي في الوقت الفعلي. | صورة | ||
StyleDrop | إنشاء النص إلى صورة بأي نمط. | arXiv | صورة | |
SyncDreamer | إنشاء صور متسقة مع طريقة العرض المتعددة من صورة ذات عرض واحد. | arXiv | صورة | |
تحرير فائق | UltraEdit: تحرير الصور الدقيق القائم على التعليمات على نطاق واسع. | arXiv | صورة | |
ألترا بيكسل | UltraPixel: تطوير تركيب الصور فائق الدقة إلى قمم جديدة. | arXiv | صورة | |
الوحدة ML انتشار مستقر | الانتشار المستقر لـ ML الأساسي على الوحدة. | الوحدة | صورة | |
رؤى فيسبونك | منصة توليد النص إلى صورة. | صورة |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
إدارة علاقات العملاء | صورة واحدة إلى شبكة ثلاثية الأبعاد مع نموذج إعادة البناء التلافيفي. | arXiv | نَسِيج | |
DreamMat | إنشاء مواد PBR عالية الجودة باستخدام نماذج الانتشار المدركة للهندسة والضوء. | arXiv | نَسِيج | |
دريم سبيس | احلم بمساحة غرفتك من خلال نشر النسيج البانورامي القائم على النص. | نَسِيج | ||
حلم القوام | نشر مستقر مدمج في الخلاط. قم بإنشاء الأنسجة والمفاهيم الفنية وأصول الخلفية والمزيد باستخدام رسالة نصية بسيطة. | خلاط | نَسِيج | |
إرشاد البشر | تحرير القوام البشري المتحرك ثلاثي الأبعاد مع التعليمات. | arXiv | نَسِيج | |
انتيكس | التوليف التفاعلي للنص إلى الملمس عبر الرسم الموحد المدرك للعمق. | arXiv | نَسِيج | |
لاما-مش | LLaMA-Mesh: توحيد إنشاء الشبكات ثلاثية الأبعاد مع نماذج اللغة. | arXiv | مش | |
الموادSeg3D | MaterialSeg3D: تجزئة المواد الكثيفة من المواد ثنائية الأبعاد للأصول ثلاثية الأبعاد. | arXiv | نَسِيج | |
MeshAnything | MaterialSeg3D: تجزئة المواد الكثيفة من المواد ثنائية الأبعاد للأصول ثلاثية الأبعاد. | arXiv | مش | |
نيوراليانجيلو | إعادة بناء السطح العصبي بدقة عالية. | arXiv | نَسِيج | |
الطلاء عليه | تركيب النص إلى نسيج من خلال تحسين خريطة النسيج التلافيفي العميق والعرض الفعلي. | نَسِيج | ||
بوليكام | قم بإنشاء القوام ثلاثي الأبعاد الخاص بك فقط عن طريق الكتابة. | نَسِيج | ||
تيكس فيوجن | تركيب الأنسجة ثلاثية الأبعاد باستخدام نماذج نشر الصور الموجهة بالنص. | arXiv | نَسِيج | |
Text2Tex | تركيب نسيج يحركه النص عبر نماذج الانتشار. | arXiv | نَسِيج | |
مختبر الملمس | القوام الناتج عن الذكاء الاصطناعي. يمكنك إنشاء الخاصة بك مع رسالة نصية. | نَسِيج | ||
مع بولي | إنشاء القوام مع بولي. قم بإنشاء مواد ثلاثية الأبعاد باستخدام الذكاء الاصطناعي في محرر مجاني عبر الإنترنت، أو ابحث في مكتبة مجتمعنا المتنامية. | نَسِيج | ||
شبكة X | X-Mesh: نحو أسلوب ثلاثي الأبعاد سريع ودقيق يعتمد على النص عبر التوجيه النصي الديناميكي. | arXiv | نَسِيج |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
منظمة العفو الدولية شادر | مولد تظليل يعمل بنظام ChatGPT لـ Unity. | الوحدة | شادر |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
Animate3D | Animate3D: تحريك أي نموذج ثلاثي الأبعاد مع نشر فيديو متعدد العرض. | arXiv | 3D | |
أي شيء-3D | شريحة-أي شيء + 3D. دعونا نرفع أي شيء إلى 3D. | arXiv | نموذج | |
Any2Point | Any2Point: تمكين النماذج الكبيرة بأي طريقة من أجل الفهم الفعال ثلاثي الأبعاد. | arXiv | 3D | |
BlenderGPT | استخدم الأوامر باللغة الإنجليزية للتحكم في Blender باستخدام OpenAI's GPT-4. | خلاط | نموذج | |
خلاط-GPT | مساعد خلاط الكل في واحد مدعوم بتكامل GPT3/4 + Whisper. | خلاط | نموذج | |
مختبرات الحصار | أصبحت الكيمياء الرقمية حقيقية مع Skybox Lab - الحل النهائي المدعوم بالذكاء الاصطناعي لإنشاء تجارب Skybox مذهلة بزاوية 360 درجة من المطالبات النصية. | نموذج | ||
CF-3DGS | تقنية الرش الغاوسي ثلاثية الأبعاد خالية من COLMAP. | arXiv | 3D | |
CharacterGen | CharacterGen: إنشاء أحرف ثلاثية الأبعاد فعالة من صور فردية مع تحديد وضع العرض المتعدد. | arXiv | 3D | |
chatGPT-مايا | أداة Maya البسيطة التي تستخدم الذكاء الاصطناعي المفتوح لأداء المهام الأساسية بناءً على تعليمات وصفية. | مايا | نموذج | |
CityDreamer | النموذج التوليدي التركيبي للمدن غير المحدودة ثلاثية الأبعاد. | arXiv | 3D | |
CSM | قم بإنشاء عوالم ثلاثية الأبعاد من الصور ومقاطع الفيديو. | 3D | ||
اندفاعة | مساعد الطيار الخاص بك لبناء العالم في Unreal Engine. | محرك غير واقعي | 3D | |
DreamCatalyst | DreamCatalyst: تحرير ثلاثي الأبعاد سريع وعالي الجودة من خلال التحكم في إمكانية التحرير والحفاظ على الهوية. | arXiv | 3D | |
دريم غاوسيان 4 د | التوليدي 4D Gaussian Splatting. | arXiv | 4D | |
DUST3R | أصبحت الرؤية الهندسية ثلاثية الأبعاد سهلة. | arXiv | 3D | |
تحرير 3D | Edify 3D: إنشاء أصول ثلاثية الأبعاد عالية الجودة وقابلة للتطوير. | arXiv | 3D | |
GALA3D | GALA3D: نحو إنشاء مشهد معقد من النص إلى ثلاثي الأبعاد عبر الرش الغاوسي التوليدي الموجه بالتخطيط. | arXiv | 3D | |
غاوس السيطرة | GaussCtrl: تحرير رش غاوسي ثلاثي الأبعاد يعتمد على نص متعدد العرض. | arXiv | 3D | |
غاوسيكيوب | تمثيل إشعاع منظم وصريح للنمذجة التوليدية ثلاثية الأبعاد. | arXiv | 3D | |
غاوسيدريمر | إنشاء سريع من النص إلى الرش الغاوسي ثلاثي الأبعاد باستخدام Point Cloud Priors. | arXiv | 3D | |
جيني لابز | قم بتمكين لعبتك باستخدام AI-UGC. | 3D | ||
هيفا | تحويل النص إلى ثلاثي الأبعاد بدقة عالية مع توجيهات نشر متقدمة. | نموذج | ||
HoloDreamer | HoloDreamer: جيل عالمي بانورامي ثلاثي الأبعاد شامل من أوصاف النص. | arXiv | 3D | |
هونيوان3D-1.0 | Hunyuan3D-1.0: إطار عمل موحد لإنشاء تحويل النص إلى ثلاثي الأبعاد والصورة إلى ثلاثي الأبعاد. | arXiv | 3D | |
إنفينيجن | عوالم واقعية لا حصر لها باستخدام الجيل الإجرائي. | arXiv | 3D | |
تعليمات-NeRF2NeRF | تحرير المشاهد ثلاثية الأبعاد مع التعليمات. | arXiv | نموذج | |
التفاعلية3D | قم بإنشاء ما تريد من خلال الجيل التفاعلي ثلاثي الأبعاد. | arXiv | 3D | |
الخواص3D | إنشاء صورة إلى صورة ثلاثية الأبعاد استنادًا إلى تضمين مقطع واحد. | 3D | ||
LATTE3D | تركيب نص مطفأ واسع النطاق ثلاثي الأبعاد. | arXiv | 3D | |
الأسد | نماذج انتشار النقطة الكامنة لتوليد الشكل ثلاثي الأبعاد. | arXiv | نموذج | |
لوما آي | التقط صورًا ثلاثية الأبعاد نابضة بالحياة. واقعية الصور والتأملات والتفاصيل لا مثيل لها. مستقبل المؤثرات البصرية أصبح الآن للجميع! | نموذج | ||
لومين AI | الإبداع المدعوم بالذكاء الاصطناعي. | 3D | ||
اصنعها ثلاثية الأبعاد | إنشاء ثلاثي الأبعاد عالي الدقة من صورة واحدة مع خاصية الانتشار المسبق. | arXiv | نموذج | |
مشبك ذو عيون شبكية | قم بإنشاء أصول ألعاب ثلاثية الأبعاد مذهلة باستخدام الذكاء الاصطناعي. | 3D | ||
موشن | صانع الرسوم المتحركة السحري ثلاثي الأبعاد AI. | 3D | ||
MVDream | نشر متعدد العرض للجيل ثلاثي الأبعاد. | arXiv | 3D | |
نفيديا فورية نيرف | أساسيات الرسومات العصبية الفورية: NeRF بسرعة البرق والمزيد. | نموذج | ||
واحد-2-3-45 | تحويل أي صورة فردية إلى شبكة ثلاثية الأبعاد في 45 ثانية دون تحسين الشكل. | arXiv | نموذج | |
الرسام3D | قم برسم أي شيء ثلاثي الأبعاد باستخدام نماذج توزيع الملمس بدون إضاءة. | arXiv | 3D | |
بانيك-3D | إعادة بناء ثلاثية الأبعاد بأسلوب منمق من صور شخصيات الأنمي. | arXiv | نموذج | |
النقطة·E | نشر السحابة النقطية لتوليف النماذج ثلاثية الأبعاد. | نموذج | ||
الحالم غزير | إنشاء تحويل نص إلى ثلاثي الأبعاد عالي الدقة ومتنوع مع التقطير المتغير للدرجات. | arXiv | نموذج | |
SF3D | SF3D: إعادة بناء شبكة ثلاثية الأبعاد مستقرة وسريعة مع إزالة التغليف بالأشعة فوق البنفسجية وفك تشابك الإضاءة. | arXiv | 3D | |
شكل | قم بإنشاء كائنات ثلاثية الأبعاد مشروطة بالنص أو الصور. | arXiv | نموذج | |
سلويد | لم تكن النمذجة ثلاثية الأبعاد أسهل من أي وقت مضى. | نموذج | ||
خدد الذكاء الاصطناعي | قوة الذكاء الاصطناعي تصل إلى البعد الثالث. قم بإنشاء الكائنات والرسوم المتحركة والأنسجة باستخدام المطالبات. | نموذج | ||
دريم فيوجن مستقر | تطبيق pytorch لنموذج Dreamfusion لتحويل النص إلى ثلاثي الأبعاد، مدعومًا بنموذج Stable Diffusion لتحويل النص إلى ثنائي الأبعاد. | نموذج | ||
SV3D | تركيب جديد متعدد المشاهد وتوليد ثلاثي الأبعاد من صورة واحدة باستخدام نشر الفيديو الكامن. | arXiv | 3D | |
تافي | نص AI إلى محرك الأحرف ثلاثي الأبعاد. | نموذج | ||
3D-GPT | النمذجة الإجرائية ثلاثية الأبعاد باستخدام نماذج لغوية كبيرة. | arXiv | 3D | |
3D-LLM | إدخال العالم ثلاثي الأبعاد في نماذج لغوية كبيرة. | arXiv | 3D | |
3ديبريسو | استخراج نموذج ثلاثي الأبعاد لكائن تم التقاطه في مقطع فيديو. | نموذج | ||
3Dtopia | إنشاء نص ثلاثي الأبعاد في 5 دقائق. | arXiv | 3D | |
3ديتوبيا-XL | 3DTopia-XL: توسيع نطاق إنشاء الأصول ثلاثية الأبعاد عالية الجودة عبر الانتشار البدائي. | arXiv | 3D | |
com.threestudio | إطار موحد لإنشاء المحتوى ثلاثي الأبعاد. | نموذج | ||
تريبوسر | نموذج مفتوح المصدر متطور لإعادة البناء ثلاثي الأبعاد بسرعة من صورة واحدة. | arXiv | نموذج | |
Unique3D | إنشاء شبكات ثلاثية الأبعاد عالية الجودة وفعالة من صورة واحدة. | arXiv | 3D | |
UnityGaussianSplatting | لعبة التصور غاوسي رش في الوحدة. | الوحدة | 3D | |
حية من 1 إلى 3 | توليف عرض جديد مع نماذج نشر الفيديو. | arXiv | 3D | |
voxcraft | صياغة نماذج ثلاثية الأبعاد جاهزة للاستخدام مع الذكاء الاصطناعي. | 3D | ||
Wonder3d | صورة واحدة إلى ثلاثية الأبعاد باستخدام انتشار النطاق عبر المجال. | arXiv | 3D | |
Zero-1-to-3 | صفر ، صورة واحدة إلى كائن ثلاثي الأبعاد. | arXiv | نموذج |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
aniportrait | توليف مدفوع الصوت من الرسوم المتحركة صورة الواقعية. | arXiv | الصورة الرمزية | |
هادئ | النماذج الكامنة العدائية الشرطية للأحرف الافتراضية القابلة للتوجيه. | arXiv | الصورة الرمزية | |
Chatavatar | الجيل التدريجي من الوجوه ثلاثية الأبعاد القابلة للرسوم تحت توجيه النص. | الصورة الرمزية | ||
Chatdollkit | يمكّنك ChatDollkit من جعل طرازك ثلاثي الأبعاد في chatbot. | الوحدة | الصورة الرمزية | |
Dreamtalk | عندما يلتقي توليد رأس الحديث التعبيري نماذج احتمالية للانتشار. | arXiv | الصورة الرمزية | |
الثنائي | DIOX - SDK DIGITAL DIGNAL SILICON؟ | الصورة الرمزية | ||
echomimic | ECHOMIMIC: الرسوم المتحركة التي تعتمد على الصوت التي تعتمد على الصوت من خلال ظروف معلمة قابلة للتحرير. | arXiv | الصورة الرمزية | |
emoportraits | العاطفة متعددة الوسائط ذات الطلقة الواحدة. | الصورة الرمزية | ||
E3 الجنرال | جيل الآلهة الفعال والتعبير والقابل للتحرير. | arXiv | الصورة الرمزية | |
exavatar | exavatar - تعبيرية الكامل للجسم 3D Gaussian Avatar. | arXiv | الصورة الرمزية | |
Geneavatar | تعبير عام-حجمي الحجمي تحرير الصورة الرمزية من صورة واحدة. | arXiv | الصورة الرمزية | |
Geneface ++ | المعمم والمستقر في الوقت الحقيقي 3D توليد وجه التكلم. | الصورة الرمزية | ||
مرحبا | التوليف البصري الصوتي الهرمي للرسوم المتحركة صورة صورة. | arXiv | الصورة الرمزية | |
Hallo2 | HALLO2: الرسوم المتحركة صورة طويلة الأجل وذات الدقة عالية الدقة. | arXiv | الصورة الرمزية | |
منظية الرأس | صياغة الصورة الرمزية ثلاثية الأبعاد مع النص. | arXiv | الصورة الرمزية | |
intrinsicavatar | intrinsicavatar: العكسية الجسدية المعتمدة على البشر الديناميكيين من مقاطع الفيديو أحادية العين عبر تتبع شعاع صريح. | arXiv | الصورة الرمزية | |
مخطط لينلي | نظام المحادثة الرمزية الرقمية. | الصورة الرمزية | ||
LivePortrait | LivePortrait: الرسوم المتحركة الفعالة صورة مع خياطة وإعادة الاستهداف. | arXiv | الصورة الرمزية | |
MotionGpt | الحركة البشرية كلغة أجنبية ، نموذج توليد بنغمة الحركة الموحدة باستخدام LLMS. | arXiv | الصورة الرمزية | |
Musepose | Musepose: إطار صورة إلى Video من أجل الجيل البشري الافتراضي. | الصورة الرمزية | ||
Musetalk | تزامن الشفاه عالي الجودة في الوقت الحقيقي مع الفضاء الكامن. | الصورة الرمزية | ||
Musev | لا حصر له الطول وارتفاع إخلاص الفيديو البشري الافتراضية مع توصيل متوازي مصور. | الصورة الرمزية | ||
Portrait4d | تعلم تخليق الصورة الرمزية برأس واحد باستخدام البيانات الاصطناعية. | arXiv | الصورة الرمزية | |
لاعب جاهز لي | دمج الآلهة القابلة للتخصيص في لعبتك أو التطبيق في أيام. | الصورة الرمزية | ||
رودينهد | RODINHD: توليد الصورة الرمزية ثلاثية الأبعاد عالية الدقة مع نماذج الانتشار. | arXiv | الصورة الرمزية | |
styleavatar3d | الاستفادة من نماذج نشر نص الصورة لتوليد الصورة الرمزية ثلاثية الأبعاد عالية الدقة. | arXiv | الصورة الرمزية | |
Text2Control3d | توليد الصورة الرمزية ثلاثية الأبعاد التي يمكن التحكم فيها في حقول الإشعاع العصبي باستخدام نموذج نشر النص إلى صورة موجه الهندسة. | arXiv | الصورة الرمزية | |
Topo4d | طوبولوجيا تحفيز غوسيا الصمت لالتقاط رأس 4D عالي الدقة. | arXiv | الصورة الرمزية | |
unityaiwithchatgpt | استنادًا إلى الوحدة ، يتم تحقيق شاشة ChatGPT+Unitychan Voice Interactive. | الوحدة | الصورة الرمزية | |
vid2avatar | إعادة بناء الصورة الرمزية ثلاثية الأبعاد من مقاطع الفيديو في البرية عبر تحلل المشهد الخاضع للإشراف ذاتيا. | arXiv | الصورة الرمزية | |
مدونة | انتشار متعدد الوسائط لتوليف تجسد. | الصورة الرمزية | ||
Wild2Avatar | مما يجعل البشر وراء انسداد. | arXiv | الصورة الرمزية |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
تحريك أي شخص | توليف صورة إلى فوتوديو متسقة ويمكن التحكم فيها للرسوم المتحركة للحرف. | arXiv | الرسوم المتحركة | |
الرسوم المتحركة | الرسوم المتحركة لصورة المجال المفتوحة ذات الحبيبات الدقيقة مع إرشادات الحركة. | arXiv | الرسوم المتحركة | |
الرسوم المتحركة | تحريك نماذج نشر النص إلى الصورة المخصصة دون ضبط محدد. | arXiv | الرسوم المتحركة | |
Animatelcm | دعنا نسرع توليد الفيديو في غضون 4 خطوات! | arXiv | الرسوم المتحركة | |
تحريك-x | Animate-X: الرسوم المتحركة لتصوير حرف Universal مع تمثيل محسّن للحركة. | arXiv | الرسوم المتحركة | |
animateero | نماذج نشر الفيديو هي الرسوم المتحركة للصفر. | arXiv | الرسوم المتحركة | |
الرسوم المتحركة | أداة AIGC لتوليد أصول الحركة القتالية. | الرسوم المتحركة | ||
deforum | يعزز Deforum انتشار مستقر لتوليد صور AI المتطورة. | الرسوم المتحركة | ||
drawingspinup | DrawingsPinup: الرسوم المتحركة ثلاثية الأبعاد من رسومات الأحرف الفردية. | arXiv | الرسوم المتحركة | |
Dreamoving | إطار لتوليد الفيديو البشري على أساس نماذج الانتشار. | arXiv | الرسوم المتحركة | |
FaceFusion | الجيل القادم وجه swapper و ensancer. | الرسوم المتحركة | ||
حرة | سد فجوة التهيئة في نماذج نشر الفيديو. | arXiv | الرسوم المتحركة | |
Geneface | المعمم والخطوط العالية التي تحركها الصوت ثلاثية الأبعاد التوليف وجه التوليف. | arXiv | الرسوم المتحركة | |
المعرف | صفر طلق الهوية يحافظ على توليد الفيديو البشري. | arXiv | الرسوم المتحركة | |
السحرية | الرسوم المتحركة للصورة البشرية المتسقة مؤقتًا باستخدام نموذج الانتشار. | arXiv | الرسوم المتحركة | |
نوا | DragNuwa هو نموذج توليد الفيديو القائم على الانتشار المفتوح يأخذ عناصر التحكم في النص والصورة والمسار كمدخلات لتحقيق توليد فيديو يمكن التحكم فيه. | arXiv | الرسوم المتحركة | |
Nuwa-Infinity | Nuwa-Infinity هو نموذج توليني متعدد الوسائط مصمم لإنشاء صور ومقاطع فيديو عالية الجودة من نص أو صورة أو صورة مفيدة. | الرسوم المتحركة | ||
Nuwa-XL | انتشار جديد على بنية الانتشار لتوليد الفيديو الطويل للغاية. | الرسوم المتحركة | ||
الرسوم المتحركة omni | ولدت الذكاء الاصطناعى الرسوم المتحركة عالية الإخلاص. | الرسوم المتحركة | ||
بيا | الرسوم المتحركة الخاصة بك صورة مخصصة عبر وحدات التوصيل والتشغيل في نماذج النص إلى صورة. | arXiv | الرسوم المتحركة | |
Sadtalker | تعلم معاملات الحركة ثلاثية الأبعاد واقعية للرسوم المتحركة التي تحركها الصوت المفردة الصوتية. | arXiv | الرسوم المتحركة | |
Sadtalker-Video-lip-sync | يعتمد هذا المشروع على sadtalkers wav2lip لتوليف الشفة الفيديو. | الرسوم المتحركة | ||
الرسوم المتحركة مستقرة | أداة نصية قوية للمطورين. | الرسوم المتحركة | ||
Talecrafter | أداة تصور قصة تفاعلية تدعم شخصيات متعددة. | arXiv | الرسوم المتحركة | |
Tooncrafter | Tooncrafter: الاستيفاء الرسوم المتحركة. | arXiv | الرسوم المتحركة | |
wav2lip | مقاطع فيديو بدقة الشفاه في البرية. | arXiv | الرسوم المتحركة | |
Wonder Studio | أداة الذكاء الاصطناعى التي تنشط تلقائيًا وأضواء وتؤلف أحرف CG في مشهد مباشر. | الرسوم المتحركة |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
Cambrian-1 | Cambrian-1: استكشاف مفتوح تمامًا يركز على الرؤية لـ LLMs متعددة الوسائط. | arXiv | LLMs متعددة الوسائط | |
COGVLM2 | نموذج متعدد الوسائط على مستوى GPT4V يعتمد على LLAMA3-8B. | مرئي | ||
Cotracker | من الأفضل تتبع معا. | arXiv | مرئي | |
evf-sam | EVF-SAM: اندماج مبكر باللغة الرؤية للقطاع المُعاد بالإكليل من النصي. | arXiv | مرئي | |
Fachi | من الأفضل تتبع معا. | مرئي | ||
internlm-xcomposer2 | Internlm-XComposer2 هو نموذج كبير من النماذج الرائدة (VLLM) يتفوق في تكوين صورة النص الحرة والفهم. | arXiv | مرئي | |
كنغر | Kangaroo: نموذج قوي باللغة الفيديو يدعم إدخال الفيديو طويل السياق. | مرئي | ||
LGVI | نحو الفيديو القائم على اللغة عبر نماذج لغة كبيرة متعددة الوسائط. | مرئي | ||
llava ++ | تمديد القدرات البصرية مع LLAMA-3 و PHI-3. | مرئي | ||
llava-onevision | llava-onevision: نقل المهام البصرية السهل. | arXiv | مرئي | |
لونجفا | نقل السياق الطويل من اللغة إلى الرؤية. | arXiv | مرئي | |
Maskvit | مقنعة مرئية قبل التدريب للتنبؤ بالفيديو. | arXiv | مرئي | |
minicpm-llama3-v 2.5 | MLLM مستوى GPT-4V على هاتفك. | مرئي | ||
مو بلافا | مزيج من الخبراء لنماذج كبيرة باللغة الرؤية. | arXiv | مرئي | |
Motionllm | فهم السلوكيات البشرية من الحركات البشرية ومقاطع الفيديو. | arXiv | مرئي | |
Pllava | امتداد LLAVA الخالي من المعلمة من الصور إلى مقاطع الفيديو للحصول على تسميات توضيحية كثيفة الفيديو. | arXiv | مرئي | |
Qwen-Vl | نموذج متعدد اللغات متعدد الاستخدامات لفهم ، توطين ، قراءة النص ، وما بعده. | arXiv | مرئي | |
العاقل | العاقل: أساس نماذج الرؤية البشرية. | arXiv | مرئي | |
ShareGPT4V | تحسين نماذج كبيرة متعددة الوسائط مع تعليقات أفضل. | arXiv | مرئي | |
منفرد | منفرد: محول واحد لنمذجة لغة الرؤية القابلة للتطوير. | arXiv | مرئي | |
فيديو ccam | الفيديو-CCAM: التقدم في الفهم باللغة الفيديو مع أقنعة الالتحاق المسببة للالتحاق. | مرئي | ||
فيديو اللينافا | تعلم التمثيل البصري المتحدة عن طريق المحاذاة قبل الإسقاط. | arXiv | مرئي | |
Vidollama 2 | التقدم النمذجة المكانية والزمانية وفهم الصوت في الفيديو. | arXiv | مرئي | |
فيديو MME | أول معيار للتقييم الشامل من LLMs متعددة الوسائط في تحليل الفيديو. | arXiv | مرئي | |
Vitron | رؤية موحدة على مستوى البكسل LLM لفهم ، توليد ، تجزئة ، تحرير. | مرئي | ||
فيلا | فيلا: على التدريب المسبق لنماذج اللغة البصرية. | arXiv | مرئي |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
360DVD | توليد فيديو بانوراما يمكن التحكم فيه مع نموذج نشر الفيديو بزاوية 360 درجة. | arXiv | فيديو | |
تحريك القصبة | توليد الفيديو المتمحور في الاسترجاع لرواية قصة. | arXiv | فيديو | |
أي شيء في أي مشهد | إدراج كائن الفيديو الواقعية. | فيديو | ||
الفن • v | توليد النص إلى الفيدويو التلقائي مع نماذج الانتشار. | arXiv | فيديو | |
مساعد | تلبية منصة الفيديو التوليدي التي تجلب أفكارك إلى الحياة. | فيديو | ||
Atomovideo | عالي الإخلاص صورة لفيديو. | arXiv | فيديو | |
BackgroundRemover | يتيح لك مزيل الخلفية إزالة الخلفية من الصور والفيديو باستخدام AI مع واجهة سطر أوامر بسيطة مجانية ومفتوحة المصدر. | فيديو | ||
Boximator | توليد حركات غنية ويمكن التحكم فيها لتوليف الفيديو. | arXiv | فيديو | |
Codef | حقول تشوه المحتوى لمعالجة الفيديو المتسقة مؤقتًا. | arXiv | فيديو | |
Cogvideo | إنشاء مقاطع فيديو من أوصاف النص. | فيديو | ||
cogvideox | Cogvideox هي نسخة مفتوحة المصدر من طراز توليد الفيديو ، وهو متماثل لـ 清影. | فيديو | ||
cogvlm | COGVLM هو نموذج لغة بصرية مفتوحة المصدر (VLM). | مرئي | ||
كونر | أشرطة الفيديو الجينية للرقص الزاهية من أوراق شخصية أنيمي مرسومة باليد (ACS). | arXiv | فيديو | |
decohere | إنشاء ما لا يمكن تصويره. | فيديو | ||
وصفية | الوصفية هي وسيلة بسيطة وقوية وممتعة لتحريرها. | فيديو | ||
Diffutoon | تظليل TOON القابل للتحرير عالي الدقة عبر نماذج الانتشار. | arXiv | فيديو | |
دولفين | منصة تفاعل الفيديو العامة على أساس LLMS. | فيديو | ||
دومواي | تضخيم إبداعك مع Domoai. | فيديو | ||
Dreamcinema | Dreamcinema: نقل سينمائي مع كاميرا مجانية وشخصية ثلاثية الأبعاد. | arXiv | فيديو | |
Dynamicrafter | تحريك صور المجال المفتوح مع أجهزة نشر الفيديو. | arXiv | فيديو | |
حافة | نقدم Edge ، وهي طريقة قوية لتوليد الرقص القابل للتحرير قادر على خلق رقصات واقعية ومعقولة جسديًا مع الحفاظ على وفية لموسيقى المدخلات التعسفية. | arXiv | فيديو | |
ايمو | Emote Portrait Alive - توليد مقاطع فيديو تعبيرية مع نموذج نشر Audio2Video في ظل ظروف ضعيفة. | arXiv | فيديو | |
فيديو EMU | عوامل توليد النص إلى الفيديو عن طريق تكييف الصور الصريح. | فيديو | ||
إتنا | يمكن لـ Etna إنشاء محتوى الفيديو المقابل بناءً على أوصاف نصية قصيرة. | فيديو | ||
جنية | توزيل سريع بالتوازي مع توليف الفيديو إلى video. | فيديو | ||
متابعة canvas | متابعة canvas: تحكم الفيديو عالي الدقة مع توليد محتوى واسع النطاق. | arXiv | فيديو | |
اتبع وضعك | توليد نص إلى video الموجهة إلى الفيديو باستخدام مقاطع فيديو خالية من وضع. | arXiv | فيديو | |
Fulljourney | جناحك الكامل من أدوات إنشاء الذكاء الاصطناعي في متناول يدك. | فيديو | ||
Gen-2 | نظام AI متعدد الوسائط يمكنه إنشاء مقاطع فيديو جديدة بنص أو صور أو مقاطع فيديو. | فيديو | ||
ديناميات التوليد | ديناميات الصورة التوليدية. | فيديو | ||
جني | البيئات التفاعلية التوليدية. | arXiv | فيديو | |
جينمو | جعل مقاطع الفيديو بطريقة سحرية مع الذكاء الاصطناعي. | فيديو | ||
جنتون | محولات الانتشار لتوليد الصور والفيديو. | فيديو | ||
هيغن | فك الارتباط المكاني الهرمي لتوليد النص إلى الفيديو. | فيديو | ||
hotshot-xl | Hotshot-XL هو نموذج من الذكاء الاصطناعي إلى GIF مدرب على العمل جنبًا إلى جنب مع الانتشار المستقر XL. | فيديو | ||
Hunyuanvideo | Hunyuanvideo: إطار منهجي لنموذج توليد الفيديو الكبير. | arXiv | فيديو | |
فيديو Imagen | بالنظر إلى موجه نص ، يقوم Imagen Video بإنشاء مقاطع فيديو عالية الدقة باستخدام نموذج توليد الفيديو الأساسي وتسلسل من النماذج المكانية والفيديو الزمنية الفائقة الدقة. | فيديو | ||
instructvideo | توجيه نماذج نشر الفيديو مع ردود الفعل البشرية. | arXiv | فيديو | |
i2vgen-xl | تخليق الصورة إلى الفيدويو عالية الجودة عبر نماذج الانتشار المتتالية. | arXiv | فيديو | |
لافي | توليد الفيديو عالي الجودة مع نماذج الانتشار الكامنة المتتالية. | arXiv | فيديو | |
LTX Studio | LTX Studio هي منصة لصناعة الأفلام الشاملة التي تعتمد على AI للمبدعين والمسوقين وصانعي الأفلام والاستوديوهات. | فيديو | ||
LTX-Video | LTX-Video هو أول نموذج لتوليد الفيديو القائم على DIT يمكنه إنشاء مقاطع فيديو عالية الجودة في الوقت الفعلي. يمكن أن يولد 24 إطارًا في الثانية بدقة 768 × 512 ، أسرع مما يتطلبه الأمر لمشاهدتها. | فيديو | ||
Lumiere | نموذج نشر وقت الفضاء لتوليد الفيديو. | arXiv | فيديو | |
LVDM | نماذج نشر الفيديو الكامنة لتوليد الفيديو الطويل عالي الدقة. | arXiv | فيديو | |
MagicVideo | توليد الفيديو الفعال مع نماذج الانتشار الكامن. | arXiv | فيديو | |
MagicVideo-V2 | توليد الفيديو متعدد المراحل متعددة المراحل. | arXiv | فيديو | |
الساعة السحرية | فيديو الذكاء الاصطناعى المبدعين جعل بسيطة. | فيديو | ||
Magvit-V2 | Tokenizer هو مفتاح الجيل البصري. | فيديو | ||
ماجفيت | محول الفيديو التوليدي ملثمين. | فيديو | ||
Make-A-Video | Make-A-Video هو نظام منظمة العفو الدولية الحديثة يقوم بإنشاء مقاطع فيديو من النص. | arXiv | فيديو | |
جعل البيكسلات الرقص | جيل الفيديو عالي الديناميك. | arXiv | فيديو | |
صنعك فيديو | توليد الفيديو المخصص باستخدام إرشادات نصية وهيكلية. | arXiv | فيديو | |
microcinema | نهج الفجوة والقهر لتوليد النص إلى الفيديو. | arXiv | فيديو | |
MIMO | MIMO: توليف فيديو يمكن التحكم فيه مع النمذجة المكانية المتحللة. | arXiv | فيديو | |
مصغرة جماعية | تعدين إمكانات نماذج لغة الرؤية متعددة الوسائط. | رؤية | ||
MobileVidFactory | توليد فيديو للوسائط الاجتماعية القائمة على الانتشار للأجهزة المحمولة من النص. | فيديو | ||
موتشي 1 | Mochi 1 هو نموذج توليد فيديو مفتوح على أحدث طراز مع حركة عالية الدقة والالتزام الفوري القوي في التقييم الأولي. | فيديو | ||
Mofa-Video | الرسوم المتحركة للصورة التي يمكن التحكم فيها عبر تكييف حقل الحركة التوليدي في نموذج انتشار الصورة إلى الفيديو المجمدة. | arXiv | فيديو | |
MoneyprinterTurbo | استخدم نماذج كبيرة لإنشاء مقاطع فيديو قصيرة بنقرة واحدة. | فيديو | ||
Moonvalley | Moonvalley هو نموذج جديد من النص العام إلى Video. | فيديو | ||
مورا | أشبه سورا لتوليد الفيديو العام. | arXiv | فيديو | |
استوديو مورف | من خلال Magic من النص إلى Video AI ، اعترض إبداعك من خلال مطالبك. | فيديو | ||
MotionClone | MotionClone: استنساخ الحركة الخالية من التدريب لتوليد الفيديو يمكن التحكم فيه. | arXiv | فيديو | |
MotionCtrl | وحدة تحكم حركة موحدة ومرنة لتوليد الفيديو. | arXiv | فيديو | |
MotionDirector | تخصيص حركة نماذج نشر النص إلى الفيديو. | arXiv | فيديو | |
الحركة | تطبيق لاستبدال الأحرف في الفيديو مع الصورة الرمزية ثلاثية الأبعاد. | فيديو | ||
mov2mov | المكوّن الإضافي MOV2MOV لـ Automatic1111/Diffification-Webui. | فيديو | ||
MovieFactory | إنشاء الفيلم التلقائي من النص باستخدام نماذج توليدية كبيرة للغة والصور. | arXiv | فيديو | |
الإطارات العصبية | اكتشف المزج للعالم البصري. | فيديو | ||
نفرس | خلق عالمك. | فيديو | ||
مفتوح | إضفاء الطابع الديمقراطي على إنتاج الفيديو الفعال للجميع. | فيديو | ||
مفتوح | خطة Open-Sora. | فيديو | ||
فيناكي | نموذج لإنشاء مقاطع فيديو من النص ، مع مطالبات يمكن أن تتغير مع مرور الوقت ، ومقاطع الفيديو التي يمكن أن تكون طالما عدة دقائق. | arXiv | فيديو | |
مختبرات بيكا | تقوم Pika Labs بإحداث ثورة في تجربة صنع الفيديو مع الذكاء الاصطناعي. | فيديو | ||
بكسل | يمكّن Pixeling عملائنا من إنشاء محتوى مرئي دقيق للغاية ، وفعال للغاية ، ويمكن التحكم فيه للغاية بما في ذلك الصور ومقاطع الفيديو والموديلات ثلاثية الأبعاد. | فيديو | ||
Pixverse | قم بإنشاء مقاطع فيديو رائعة مع الذكاء الاصطناعي. | فيديو | ||
الاستطلاعات | يصنع الخلق سهلاً وسريعًا وممتعًا. | فيديو | ||
إعادة استخدام وناشر | تقليل التكرار لتوليد النص إلى الفيديو. | arXiv | فيديو | |
روي | Ruyi هو نموذج من صورة إلى فنية قادرة على توليد مقاطع فيديو ذات جودة سينمائية بدقة 768 ، بمعدل إطار 24 إطارًا في الثانية ، ويبلغ مجموعه 5 ثوان و 120 إطارًا. | فيديو | ||
قصيرة | إطار عمل تجريبي من الذكاء الاصطناعي لإنشاء محتوى الفيديو القصير/الفيديو. | فيديو | ||
Show-1 | الزواج من النماذج البكسل والنماذج الكامنة لتوليد النص إلى الفيديو. | arXiv | فيديو | |
snap video | المحولات المكانية الزمانية المحددة لتوليف النص إلى الفيديو. | arXiv | فيديو | |
سورا | إنشاء فيديو من النص. | فيديو | ||
sorawebui | Sorawebui هو عميل ويب Sora مفتوح المصدر ، مما يمكّن المستخدمين من إنشاء مقاطع فيديو بسهولة من نص باستخدام طراز Sora من Openai. | فيديو | ||
StableVideo | تحرير الفيديو الناتج عن الاتساق المعتمد على النص. | فيديو | ||
انتشار فيديو مستقر | انتشار الفيديو المستقر (SVD) صورة إلى فني. | فيديو | ||
storyDiffusion | التوفيق الذاتي المتسق لتوليد الصور والفيديو بعيدة المدى. | arXiv | فيديو | |
Treamingt2v | توليد فيديو متسق وديناميكي وقابل للتمديد من النص. | arXiv | فيديو | |
Stylecrafter | NHINGING TEXT-TELL-TELLIDEDOLE مع محول النمط. | arXiv | فيديو | |
تاتس | توليد الفيديو الطويل مع VQGAN الزمنية ومحول حساس للوقت. | فيديو | ||
text2video-Zero | نماذج نشر النص إلى صورة هي مولدات فيديو صفرية. | arXiv | فيديو | |
TF-T2V | وصفة لتوسيع نطاق توليد النص إلى الفيديو مع مقاطع فيديو خالية من النصوص. | arXiv | فيديو | |
تورا | تورا: محول الانتشار الموجهة نحو المسار لتوليد الفيديو. | arXiv | فيديو | |
تتبع أي شيء | يعد Track-Itegthing أداة مرنة وتفاعلية لتتبع كائنات الفيديو وتجزئة ، استنادًا إلى أي شيء و XMEM. | arXiv | فيديو | |
Tune-A-Video | ضبط طلقة واحدة لنماذج نشر الصور لتوليد النص إلى الفيديو. | arXiv | فيديو | |
اثنا عشر | منظمة العفو الدولية متعددة الوسائط التي تتفهم مقاطع الفيديو مثل البشر. | فيديو | ||
UNIVG | نحو توليد فيديو موحد. | فيديو | ||
VChitect -2.0 | VChitect -2.0: محول متوازي لتوسيع نطاق نماذج نشر الفيديو. | فيديو | ||
vgen | نظام بيئي شامل لتوليد الفيديو لبناء توليد الفيديو على نماذج الانتشار. | arXiv | فيديو | |
ViewCrafter | ViewCrafter: ترويض نماذج نشر الفيديو لتوليف عرض رواية عالية الدقة. | arXiv | فيديو | |
فيديو Chatgpt | فيديو Chatgpt هو نموذج محادثة فيديو قادر على توليد محادثة ذات معنى حول مقاطع الفيديو. | arXiv | فيديو | |
مركبة الفيديو | تخليق الفيديو التركيبي مع إمكانية التحكم في الحركة. | arXiv | فيديو | |
videocrafter1 | نماذج الانتشار المفتوحة لتوليد الفيديو عالي الجودة. | arXiv | فيديو | |
videocrafter2 | التغلب على قيود البيانات لنماذج نشر الفيديو عالية الجودة. | arXiv | فيديو | |
videodrafter | توليد الفيديو متعدد المشهد المتسق مع LLM. | arXiv | فيديو | |
videolevator | رفع جودة توليد الفيديو مع نماذج انتشار النص إلى الصورة متعددة الاستخدامات. | arXiv | فيديو | |
videofactory | تبديل الانتباه في الانتشار المكاني الزماني لتوليد النص إلى الفيديو. | فيديو | ||
videogen | نهج الانتشار الكامن الموجهة المرجعية لتوليد النص العالي من نص إلى الفيديو. | arXiv | فيديو | |
videolcm | نموذج الاتساق الكامن. | arXiv | فيديو | |
فيديو LDMS | قم بمحاذاة Latouts: تخليق الفيديو عالي الدقة مع نماذج الانتشار الكامن. | arXiv | فيديو | |
فيديو اللينافا | تعلم التمثيل البصري المتحدة عن طريق المحاذاة قبل الإسقاط. | arXiv | فيديو | |
videomamba | نموذج مساحة الدولة لفهم الفيديو الفعال. | arXiv | فيديو | |
فيديو مدروس | فيديو الفكر: فيديو خطوة بخطوة من الإدراك إلى الإدراك. | فيديو | ||
videopoet | نموذج لغة كبير لتوليد الفيديو صفري. | arXiv | فيديو | |
حركة Vispunk | إنشاء مقاطع فيديو واقعية باستخدام نص فقط. | فيديو | ||
VisualRwkv | VisualRwkv هو الإصدار المعزز بالمرئي لنموذج لغة RWKV ، مما يتيح RWKV من التعامل مع مختلف المهام المرئية. | مرئي | ||
V-جيبا | فيديو تضمين العمارة التنبؤية. | arXiv | فيديو | |
والت | توليد الفيديو الواقعية مع نماذج الانتشار. | arXiv | فيديو | |
zeroscope | Zeroscope text to-video. | فيديو |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
Academicodec | نموذج برامج ترميز الصوت مفتوح المصدر للبحث الأكاديمي. | صوتي | ||
برمائي | مجموعة أدوات صوتية وموسيقى وتوليد الكلام مفتوحة المصدر. | arXiv | صوتي | |
Archisound | توليد الصوت باستخدام نماذج الانتشار ، في Pytorch. | صوتي | ||
Audiobox | توليد الصوت الموحد مع مطالبات اللغة الطبيعية. | صوتي | ||
ذرة الصوت | صفر حلقة غير خاضعة للرقابة والتحرير الصوتي المستندة إلى النص باستخدام انقلاب DDPM. | arXiv | صوتي | |
برنامج ترميز Audiogen | ضغط منخفض 48 كيلو هرتز برمز الصوت العصبي الاستريو للصوت العام ، مما يؤدي إلى تحسين الإخلاص الصوتي؟ | صوتي | ||
Audiogpt | فهم وتوليد الكلام والموسيقى والصوت ورأس الحديث. | arXiv | صوتي | |
Audiolcm | توليد النص إلى النماذج مع نماذج الاتساق الكامنة. | arXiv | صوتي | |
Audioldm | توليد نص إلى أذو مع نماذج الانتشار الكامن. | arXiv | صوتي | |
Audioldm 2 | تعلم توليد صوتي شامل مع تدريبة خاضعة للإشراف ذاتيا. | arXiv | صوتي | |
Auffusion | الاستفادة من قوة الانتشار ونماذج اللغة الكبيرة لتوليد نص إلى أمن. | arXiv | صوتي | |
CTAG | توليد نص إبداعي إلى أمن عبر برمجة المزج. | صوتي | ||
foleycrafter | Foleycrafter: قم بإحضار مقاطع فيديو صامتة إلى الحياة مع الأصوات النابضة بالحياة والمزامنة. | arXiv | صوتي | |
مغناطيس | توليد الصوت المقنعة باستخدام محول واحد غير آخذ في الانحدار. | صوتي | ||
صنع أويتو | توليد النص إلى نماذج الانتشار المعززة بالضرب. | arXiv | صوتي | |
صنع-Audio 3 | تحويل النص إلى صوت عبر محولات الانتشار الكبيرة القائمة على التدفق. | arXiv | صوتي | |
العصبية | تخليق الصوت المشروط القائم على التعلم مع النقل الصوتي. | arXiv | صوتي | |
Optimizerai | أصوات للمبدعين ، صانعي الألعاب ، الفنانين ، صانعي الفيديو. | صوتي | ||
Qwen2-Audio | QWEN2-Audio Chat & PretRained Gark Audio Language Model التي اقترحتها Alibaba Cloud. | arXiv | صوتي | |
See-2 Sound | صفر لقطة البيئة المكانية إلى الصوت المكاني. | arXiv | صوتي | |
Soundstorm | جيل صوتي متوازي فعال. | arXiv | صوتي | |
صوت مستقر | انتشار الصوت الكامن المكيف بسرعة. | صوتي | ||
صوت مستقر مفتوح | يقوم الصوت المستقر Open 1.0 بإنشاء صوت استريو متغير (حتى 47 عامًا) عند 44.1 كيلو هرتز من مطالبات النص. | صوتي | ||
المزامنة | Syncfusion: توليف الفيديو إلى المزامنة متعددة الوسائط. | arXiv | صوتي | |
رقصة التانغو | توليد نص إلى أذرو باستخدام تعليمات تم ضبطها LLM ونموذج الانتشار الكامن. | صوتي | ||
VTA-LDM | جيل من الفيديو إلى الجيل مع محاذاة خفية. | arXiv | صوتي | |
Wavjourney | إنشاء صوت تكوين مع نماذج لغة كبيرة. | arXiv | صوتي |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
إيفا | الذكاء الاصطناعي يتألف موسيقى الموسيقى التصويرية العاطفية. | موسيقى | ||
موسيقى أمبير | تقنية توليد الموسيقى المخصصة مدعوم من Amper. | موسيقى | ||
ازدهار | إنشاء موسيقى توليدية. شاركه مع العالم. | موسيقى | ||
أخصائي الدردشة | تعزيز القدرات الموسيقية الجوهرية في LLM. | موسيقى | ||
chord2melody | توليد الموسيقى التلقائي الذكاء الاصطناعي. | موسيقى | ||
Diff-BGM | نموذج نشر لتوليد موسيقى خلفية الفيديو. | arXiv | موسيقى | |
Fluxmusic | Fluxmusic: توليد نص إلى موسيقي مع محول تدفق مصحح. | arXiv | موسيقى | |
GPTABLETON | مسودة البرنامج النصي لمعالجة استجابة GPT وإرسال ملاحظات MIDI إلى مقاطع Ableton مع Abletonosc و Python-Est. | موسيقى | ||
Heimusic.ai | منظمة العفو الدولية مولد الموسيقى | موسيقى | ||
صورة للموسيقى | AI Image to Music Generator هي أداة تستخدم الذكاء الاصطناعي لتحويل الصور إلى موسيقى. | موسيقى | ||
جين -1 | توليد الموسيقى العالمي الموجهة نصية مع نماذج الانتشار متعدد الاتجاهات. | موسيقى | ||
Jukebox | نموذج توليني للموسيقى. | arXiv | موسيقى | |
أرجواني | Magenta هو مشروع بحثي يستكشف دور التعلم الآلي في عملية إنشاء الفن والموسيقى. | موسيقى | ||
لحن | توليد الموسيقى العصبية الفعالة | موسيقى | ||
موبرت | موسيقى AI التوليدية. | موسيقى | ||
Musenet | شبكة عصبية عميقة يمكنها توليد مؤلفات موسيقية مدتها 4 دقائق مع 10 أدوات مختلفة ، ويمكنها الجمع بين الأنماط من البلد إلى موزارت إلى البيتلز. | موسيقى | ||
MusicGen | توليد موسيقى بسيط ويمكن التحكم فيه. | arXiv | موسيقى | |
MusicLdM | تعزيز الجدة في توليد النص إلى الموسيقى باستخدام استراتيجيات الخلط المتزامنة. | arXiv | موسيقى | |
موسيقىLM | توليد الموسيقى من النص. | arXiv | موسيقى | |
تطبيق Riffusion | Riffusion هو تطبيق لتوليد الموسيقى في الوقت الحقيقي مع انتشار مستقر. | موسيقى | ||
Sonauto | Sonauto هو محرر موسيقى منظمة العفو الدولية يحول المطالبات أو الأغاني أو الألحان إلى أغاني كاملة بأي نمط. | موسيقى | ||
Soundraw | مولد موسيقى منظمة العفو الدولية للمبدعين. | موسيقى | ||
Soundry AI | أدوات الذكاء الاصطناعي التوليدي بما في ذلك حزم عينة من النص إلى سليم وعينات. | موسيقى |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
Diffsinger | غناء تخليق الصوت عبر آلية الانتشار الضحلة. | arXiv | صوت الغناء | |
الاسترجاع القائم على الاسترجاع-إنجاب ويبوي | إطار SVC سهل الاستخدام يعتمد على حركات. | صوت الغناء | ||
So-its-SVC | Softvc يزيد التحويل الصوتي الغناء. | صوت الغناء | ||
VI-SVS | استخدم Vits و OpenCpop لتطوير تخليق الصوت الغنائي ؛ يختلف عن Visinger. | صوت الغناء |
^ العودة إلى المحتويات ^
مصدر | وصف | ورق | محرك اللعبة | يكتب |
---|---|---|---|---|
Applio | أداة الاستنساخ الصوتي النهائية ، محسّنة بدقة للطاقة التي لا تضاهى ، وحدات ، وتجربة سهلة الاستخدام. | خطاب | ||
أوديو | نص في. الصوت خارج. | خطاب | ||
نباح | نموذج الصوت التوليدي المقدم نص. | خطاب | ||
Bert-its2 | Vits2 العمود الفقري مع بيرت متعدد اللغات. | خطاب | ||
chattts | Chattts هو نموذج الكلام التوليدي للحوار اليومي. | خطاب | ||
Clapspeech | تعلم الإحسان من سياق النص مع التدريب اللغوي المسبق. | arXiv | خطاب | |
cosyvoice | نموذج توليد صوت كبير متعدد اللغات ، يوفر الاستدلال والتدريب والنشر القدرة الكاملة على المكاسب. | خطاب | ||
DEX-TTS | نص معبر على الانتشار مع النمذجة النمذجة على تباين الوقت. | arXiv | خطاب | |
العاطفة | محرك TTS متعدد الأوساخ والتحكم في موجات. | خطاب | ||
فليكي | تحويل النص إلى مقاطع فيديو مع أصوات الذكاء الاصطناعي. | خطاب | ||
GLM-4-Voice | GLM-4-Voice هو نموذج صوتي شامل يطلقه Zhipu AI. يمكن لـ GLM-4-Voice أن يفهم وتوليد الكلام الصيني والإنجليزي بشكل مباشر ، والانخراط في محادثات صوتية في الوقت الفعلي ، وتغيير سمات مثل العاطفة ، والتجويد ، ومعدل الكلام ، واللهجة بناءً على تعليمات المستخدم. | خطاب | ||
توهج tts | تدفق توليدي للنص إلى الكلام عن طريق البحث المحاذاة الرتابة. | arXiv | خطاب | |
GPT-sovits | تحويل صوت قوي قليل و Webui النص إلى الكلام. | خطاب | ||
لوفو | Lovo هو Go-to AI Voice Generator & Text to Speech منصة لآلاف المبدعين. | خطاب | ||
ماهاتس | نموذج توليد خطاب كبير مفتوح المصدر. | خطاب | ||
ماتشا tts | بنية TTS السريعة مع مطابقة التدفق الشرطي. | arXiv | خطاب | |
melotts | مكتبة نص إلى كلام عالية الجودة من قبل myshell.ai. دعم اللغة الإنجليزية والإسبانية والفرنسية والصينية واليابانية والكورية. | خطاب | ||
metavoice-1b | الذكاء الاصطناعي لذكاء الكلام على مستوى الإنسان. | خطاب | ||
Narakeet | قم بإنشاء الصوتيات الصوتية بسهولة باستخدام نص واقعي إلى الكلام. | خطاب | ||
مصغرة | Mini-Omni: يمكن أن تسمع نماذج اللغة والتحدث أثناء التفكير في البث. Mini-Omni هو نموذج لغة متعددة المصادر مفتوحة المصدر يمكن أن يسمع ، والتحدث أثناء التفكير. يتميز بإدخال إدخال الكلام في الوقت الفعلي وتدفق إمكانات محادثة صوتية. | arXiv | خطاب | |
واحد لقطة واحدة | طلقة واحدة استنساخ صوت على unet-tts. | خطاب | ||
OpenVoice | الصوت الفوري استنساخ MyShell. | خطاب | ||
الفائض | وضع التدفقات فوق محولات الطاقة العصبية ل TTS أفضل. | خطاب | ||
realTimetts | RealTimetts هي مكتبة من أحدث النصوص إلى الحديث (TTS) مصممة للتطبيقات في الوقت الفعلي. | خطاب | ||
Sensevoice | Sensevoice هو نموذج مؤسسة الكلام مع قدرات لفهم الكلام المتعددة ، بما في ذلك التعرف على الكلام التلقائي (ASR) ، وتحديد اللغة المنطوقة (LID) ، والتعرف على مشاعر الكلام (SER) ، والكشف عن الأحداث الصوتية (AED). | خطاب | ||
الكلام | تمكين نماذج اللغة الكبيرة مع قدرات المحادثة عبر الوسائط الداخلية. | arXiv | خطاب | |
الكلام إلى النص GPT3-UNITY | هذا هو الريبو الذي أستخدمه Whisper و ChatGPT API من Openai in Unity. | الوحدة | خطاب | |
خطاب مستقر | استقرار نموذج النص إلى كلام منظمة العفو الدولية. | خطاب | ||
stabletts | طراز TTS من الجيل التالي باستخدام مطابقة التدفق و DIT ، مستوحاة من الانتشار المستقر 3. | خطاب | ||
Stylets 2 | نحو النص على مستوى الإنسان من خلال نشر النمط والتدريب العدواني مع نماذج لغة الكلام الكبيرة. | arXiv | خطاب | |
السلحفاة | Tortoise.cpp: GGML تنفيذ السلحفاة TTS. | خطاب | ||
السلحفاة tts | تم تدريب نظام TTS متعدد الفرسات مع التركيز على الجودة. | خطاب | ||
TTS Generation Webui | TTS Generation Webui (Bark ، MusicGen ، Tortoise ، RVC ، Vocos ، Demucs). | خطاب | ||
فال | نماذج لغة الترميز العصبية هي نص صفري إلى توليفات الكلام. | arXiv | خطاب | |
Vall-e x | تحدث اللغات الأجنبية بصوتك الخاصة: نمذجة لغة الترميز العصبية عبر اللغات | arXiv | خطاب | |
Vocode | Vocode هي مكتبة مفتوحة المصدر لبناء تطبيقات LLM القائمة على الصوت. | خطاب | ||
VoiceBox | توليد الكلام العالمي متعدد اللغات الموجهة نصية على نطاق واسع. | arXiv | خطاب | |
Voicecraft | تحرير الكلام صفر وراقت نصية إلى خط الكلام في البرية. | خطاب | ||
الهمس | Whisper هو نموذج التعرف على الكلام للأغراض العامة. | خطاب | ||
همسة | نظام نص إلى كلام مفتوح المصدر مصمم عن طريق تقلب الهمس. | خطاب | ||
xe-الكلام | إطار التدريب المشترك بين النص العاطفي غير العاطفي غير العاطفي والتحويل الصوتي. | خطاب | ||
XTTS | XTTS هي مكتبة لتوليد النص إلى الكلام المتقدم. | خطاب | ||
yourtts | نحو صفر طلقة متعددة TTS وتحويل صوت الصفر للجميع. | arXiv | خطاب | |
ZMM-TTS | صفر لقطة متعددة اللغات ومتعددة اللاعبين تكييف على تمثيلات الكلام المنفصلة التي يتم إشرافها ذاتيا. | arXiv | خطاب |
^ العودة إلى المحتويات ^
مصدر | وصف | محرك اللعبة | يكتب |
---|---|---|---|
ludo.ai | مساعد لبحث اللعبة والتصميم. | التحليلات |
^ العودة إلى المحتويات ^