ai game devtools
1.0.0
Di sini kami akan melacak Alat Pengembangan Game AI terbaru, termasuk LLM, Agen, Kode, Penulis, Gambar, Tekstur, Shader, Model 3D, Animasi, Video, Audio, Musik, Suara Bernyanyi, dan Analisis.
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
AgenGPT | ? Rakit, konfigurasikan, dan terapkan Agen AI otonom di browser Anda. | Alat | ||
Perintah AI | Integrasi ChatGPT dengan Unity Editor. | Persatuan | Alat | |
AIOS | Sistem Operasi Agen LLM. | Alat | ||
Ilmuwan AI | Ilmuwan AI: Menuju Penemuan Ilmiah Terbuka yang Sepenuhnya Otomatis. | arXiv | Alat | |
Asisten CLI | Alat CLI yang nyaman untuk menggunakan layanan ChatGPT | Alat | ||
GPT Otomatis | Upaya sumber terbuka eksperimental untuk membuat GPT-4 sepenuhnya otonom. | Alat | ||
sayangAGI | Skrip Python ini adalah contoh sistem manajemen tugas yang didukung AI. | Alat | ||
?? BabyAGI UI | BabyAGI UI dirancang untuk memudahkan dijalankan dan dikembangkan dengan babyagi di aplikasi web, seperti ChatGPT. | Alat | ||
baichuan-7B | Model bahasa pra-pelatihan 7B skala besar yang dikembangkan oleh Baichuan. | Alat | ||
Baichuan-13B | Model bahasa besar 13B yang dikembangkan oleh Baichuan Intelligent Technology. | Alat | ||
Baichuan 2 | Serangkaian model bahasa besar yang dikembangkan oleh Baichuan Intelligent Technology. | Alat | ||
Bisheng | Bisheng adalah platform pengembang LLM terbuka untuk aplikasi AI generasi berikutnya. | Alat | ||
Karakter-LLM | Agen yang Dapat Dilatih untuk Bermain Peran. | arXiv | Alat | |
Pengembang Obrolan | Agen Komunikatif untuk Pengembangan Perangkat Lunak. | arXiv | Alat | |
ChatGPT-API-unity | Mengikat API penyelesaian obrolan ChatGPT ke C# murni di Unity. | Persatuan | Alat | |
ObrolanGPTForUnity | ChatGPT untuk persatuan. | Persatuan | Alat | |
ObrolanRWKV | ChatRWKV seperti ChatGPT tetapi didukung oleh model bahasa RWKV (100% RNN), dan sumber terbuka. | Alat | ||
ObrolanYuan | Model Bahasa Besar untuk Dialog dalam Bahasa Cina dan Inggris. | Alat | ||
Cina-LLaMA-Alpaca-3 | (Llama-3 LLM Cina) dikembangkan dari Meta Llama 3. | Alat | ||
Chrome-GPT | Agen AutoGPT yang mengontrol Chrome di desktop Anda. | Alat | ||
roda gigiVLM | CogVLM, model dasar bahasa visual sumber terbuka yang kuat. | arXiv | Alat | |
CoreNet | Perpustakaan untuk melatih jaringan saraf dalam. | Alat | ||
Kosmos | Cosmos adalah platform pengembangan model dunia yang terdiri dari model dasar dunia, tokenizer, dan jalur pemrosesan video untuk mempercepat pengembangan AI Fisik di laboratorium Robotika & AV. | LLM | ||
DBRX | DBRX adalah model bahasa besar yang dilatih oleh Databricks. | Alat | ||
DCLM | DataComp untuk Model Bahasa. | arXiv | Alat | |
DeepSeek-V3 | DeepSeek-V3 adalah model bahasa Mixture-of-Experts (MoE) yang kuat dengan total 671 miliar parameter dengan 37 miliar diaktifkan untuk setiap token. | arXiv | LLM | |
DemoGPT | Generator Aplikasi Auto Gen-AI dengan Kekuatan Llama 2 | Alat | ||
Kode Desain2 | Mengotomatiskan Rekayasa Front-End | Alat | ||
Devika | Devika adalah Insinyur Perangkat Lunak AI Agen. | Alat | ||
Devon | Pemrogram pasangan sumber terbuka. | Alat | ||
Dora | Menghasilkan situs web yang kuat, satu demi satu. | Alat | ||
mengalir | Seret & lepas UI untuk membangun aliran LLM khusus Anda menggunakan LangchainJS. | Alat | ||
Gemini | Gemini dibangun dari awal untuk multimodalitas — berpikir dengan mulus dalam teks, gambar, video, audio, dan kode. | Alat | ||
permata | Gemma adalah rangkaian model terbuka yang ringan dan canggih yang dibuat berdasarkan penelitian dan teknologi yang digunakan untuk membuat model Google Gemini. | Alat | ||
gemma.cpp | mesin inferensi C++ yang ringan dan mandiri untuk model Gemma Google. | Alat | ||
GLM-4 | GLM-4-9B adalah versi sumber terbuka dari model terlatih generasi terbaru dalam seri GLM-4 yang diluncurkan oleh Zhipu AI. | Alat | ||
GPT4Semua | Chatbot dilatih tentang kumpulan besar data asisten yang bersih termasuk kode, cerita, dan dialog. | Alat | ||
GPT-4o | GPT-4o (“o” untuk “omni”) adalah langkah menuju interaksi manusia-komputer yang jauh lebih alami— ia menerima kombinasi teks, audio, gambar, dan video apa pun sebagai masukan, serta menghasilkan kombinasi teks, audio, dan gambar apa pun keluaran. | Alat | ||
Skrip GPT | Kembangkan Aplikasi LLM dalam Bahasa Alami. | Alat | ||
Grok-1 | Bobot dan arsitektur model Mixture-of-Experts kami yang memiliki 314 miliar parameter, Grok-1. | Alat | ||
MemelukObrolan | Menjadikan model obrolan AI terbaik komunitas tersedia bagi semua orang. | Alat | ||
Integrasi Persatuan API Wajah Memeluk | Paket Unity ini menyediakan integrasi yang mudah digunakan untuk Hugging Face Inference API, memungkinkan pengembang mengakses dan menggunakan model Hugging Face AI dalam proyek Unity mereka. | Persatuan | Alat | |
Ikatan Gambar | ImageBind Satu Ruang Penyematan untuk Mengikat Semuanya. | arXiv | Alat | |
Indeks-1.9B | LLM multibahasa ringan SOTA. | Alat | ||
InteractML-Unity | InteractML, kerangka kerja Visual Scripting Pembelajaran Mesin Interaktif untuk Unity3D. | Persatuan | Alat | |
InteractML-Mesin Unreal | Menghadirkan Pembelajaran Mesin ke Unreal Engine. | Mesin Tidak Nyata | Alat | |
MagangLM | InternLM memiliki model dasar 7 miliar parameter bersumber terbuka, model obrolan yang disesuaikan untuk skenario praktis dan sistem pelatihan. | arXiv | Alat | |
MagangLM-XComposer | InternLM-XComposer2 adalah model besar bahasa visi (VLLM) inovatif yang unggul dalam komposisi dan pemahaman teks-gambar bentuk bebas. | arXiv | Alat | |
Januari | Hadirkan AI ke Desktop Anda. | Alat | ||
Lamini | Lamini memungkinkan tim teknik mana pun untuk mengungguli LLM tujuan umum melalui RLHF dan menyempurnakan data mereka sendiri. | Alat | ||
LaMini-LM | LaMini-LM adalah kumpulan model bahasa berukuran kecil dan efisien yang disaring dari ChatGPT dan dilatih pada kumpulan data berskala besar yang berisi 2,58 juta instruksi. | Alat | ||
LangChain | LangChain adalah kerangka kerja untuk mengembangkan aplikasi yang didukung oleh model bahasa. | Alat | ||
LangFlow | ⛓️ LangFlow adalah UI untuk LangChain, dirancang dengan aliran reaksi untuk menyediakan cara yang mudah untuk bereksperimen dan membuat prototipe aliran. | Alat | ||
LaVague | Otomatiskan otomatisasi dengan kerangka Model Tindakan Besar. | Alat | ||
Kubung | Model Landasan Terbuka untuk Agen Bahasa. | Alat | ||
Lepton AI | Kerangka kerja Pythonic untuk menyederhanakan pembangunan layanan AI. | Alat | ||
Lit-LLaMA | Implementasi model bahasa LLaMA berbasis nanoGPT. Mendukung perhatian flash, kuantisasi Int8 dan GPTQ 4bit, penyempurnaan Adaptor LoRA dan LLaMA, pra-pelatihan. | Alat | ||
llama2-webui | Jalankan Llama 2 secara lokal dengan gradio UI pada GPU atau CPU dari mana saja (Linux/Windows/Mac). | Alat | ||
Lama 3 | Situs resmi Meta Llama 3 GitHub. | Alat | ||
Lama 3.1 | Llama adalah model bahasa besar terbuka (LLM) yang mudah diakses dan dirancang bagi pengembang, peneliti, dan bisnis untuk membangun, bereksperimen, dan secara bertanggung jawab menskalakan ide AI generatif mereka. | Alat | ||
LLaSM | Model Bahasa dan Ucapan Besar. | Alat | ||
Mesin Penjawab LLM | Bangun Mesin Penjawab yang Terinspirasi Kebingungan Menggunakan Next.js, Groq, Mixtral, Langchain, OpenAI, Brave & Serper. | Alat | ||
llm.c | Pelatihan LLM dalam C/CUDA mentah yang sederhana. | Alat | ||
LLPersatuan | Buat karakter di Unity dengan LLM! | Persatuan | Alat | |
Pencarian Lokal | LLocalSearch adalah mesin pencari yang sepenuhnya berjalan secara lokal menggunakan Agen LLM. | Alat | ||
Pemecah LogicGames | Alat Python untuk menyelesaikan permainan logika dengan AI, Deep Learning, dan Computer Vision. | Alat | ||
Penulis Panjang | LongWriter: Melepaskan 10.000+ Pembuatan Kata Dari LLM Konteks Panjang. | arXiv | Alat | |
Model Dunia Besar (LWM) | Large World Model (LWM) adalah model autoregresif multimodal konteks besar untuk tujuan umum. | arXiv | Alat | |
Lumina-T2X | Lumina-T2X adalah kerangka kerja terpadu untuk Pembuatan Modalitas Teks ke Apa Pun. | arXiv | Alat | |
MetaGPT | Kerangka Multi-Agen | Alat | ||
BPS Mini-2B | LLM sisi akhir mengungguli Llama2-13B. | Alat | ||
MiniGPT-4 | Meningkatkan Pemahaman Bahasa Visi dengan Model Bahasa Besar Tingkat Lanjut. | arXiv | Alat | |
MiniGPT-5 | Generasi Visi-dan-Bahasa yang Disisipkan melalui Voken Generatif. | arXiv | Alat | |
Campuran 8x7B | Campuran Pakar Jarang yang berkualitas tinggi. | arXiv | Alat | |
Mistral 7B | Model 7B terbaik saat ini, Apache 2.0. | Alat | ||
Mistral Besar | Mistral Large adalah model pembuatan teks mutakhir yang baru. Ini mencapai kemampuan penalaran tingkat atas. | Alat | ||
MLC LLM | Memungkinkan semua orang untuk mengembangkan, mengoptimalkan, dan menerapkan model AI secara native di perangkat semua orang. | Alat | ||
MobilLlama | Menuju GPT Transparan Sepenuhnya Akurat dan Ringan. | arXiv | Alat | |
MoE-LLaVA | Campuran Pakar untuk Model Bahasa Penglihatan Besar. | arXiv | Alat | |
Moshi | Moshi adalah AI percakapan eksperimental. | Alat | ||
Moshi | Moshi: model dasar teks pidato untuk dialog waktu nyata. | Alat | ||
LUMUT | Model bahasa percakapan yang dilengkapi alat sumber terbuka dari Universitas Fudan. | Alat | ||
mPLUG-Burung Hantu? | Modularisasi Memberdayakan Model Bahasa Besar dengan Multimodalitas. | arXiv | Alat | |
Nemotron-4 | Model bahasa multibahasa besar dengan 15 miliar parameter dilatih pada 8 triliun token teks. | arXiv | Alat | |
BERIKUTNYA-GPT | Model Bahasa Besar Multimodal Apa Pun. | Alat | ||
OLMo | Model Bahasa Terbuka | arXiv | Alat | |
OmniLMM | Model multi-modal besar untuk kinerja kuat dan penerapan efisien. | Alat | ||
SatuLLM | Satu Kerangka untuk Menyelaraskan Semua Modalitas dengan Bahasa. | arXiv | Alat | |
Asisten Terbuka | OpenAssistant adalah asisten berbasis obrolan yang memahami tugas, dapat berinteraksi dengan sistem pihak ketiga, dan mengambil informasi secara dinamis untuk melakukannya. | Alat | ||
BukaDevin | Seorang insinyur perangkat lunak AI yang otonom. | Alat | ||
Orion-14B | Orion-14B adalah rangkaian model yang mencakup fondasi 14B LLM, dan serangkaian model. | arXiv | Alat | |
Panda | Model bahasa besar sumber terbuka Tiongkok Luar Negeri, berdasarkan Llama-7B, -13B, -33B, -65B untuk pra-pelatihan berkelanjutan di bidang Tiongkok. | Alat | ||
Bingung | Mesin pencari bertenaga AI. | Alat | ||
pi | Chatbot AI dirancang untuk bantuan pribadi dan dukungan emosional. | Alat | ||
Qwen1.5 | Qwen1.5 adalah versi perbaikan dari Qwen. | Alat | ||
Qwen2 | Qwen2 adalah seri model bahasa besar yang dikembangkan oleh tim Qwen, Alibaba Cloud. | Alat | ||
Qwen-7B | Repo resmi obrolan Qwen-7B (通义千问-7B) & model bahasa besar terlatih yang diusulkan oleh Alibaba Cloud. | Alat | ||
Agen Repo | RepoAgent adalah proyek Sumber Terbuka yang didorong oleh Model Bahasa Besar (LLM) yang bertujuan untuk menyediakan cara cerdas untuk mendokumentasikan proyek. | arXiv | Alat | |
Mesin AI Sanitas | Mesin Sanity AI untuk Alat Pengembangan Game Unity. | Persatuan | Alat | |
PencarianGPT | ? Menghubungkan ChatGPT dengan Internet | Alat | ||
BagikanGPT4V | Meningkatkan Model Multi-Modal Besar dengan Teks yang Lebih Baik. | Alat | ||
pekerjaan langit | Model seri Skywork telah dilatih sebelumnya pada data multibahasa dan kode berkualitas tinggi sebesar 3,2 TB (terutama bahasa Mandarin dan Inggris). | Alat | ||
StabilLM | Model Bahasa AI Stabilitas. | arXiv | Alat | |
Stanford Alpaka | Model LLaMA yang mengikuti Instruksi. | Alat | ||
UI web pembuatan teks | UI web gradio untuk menjalankan Model Bahasa Besar seperti LLaMA, llama.cpp, GPT-J, OPT, dan GAACTICA. | Alat | ||
Mesin Obrolan Kecil | Perpustakaan Inferensi LLM Pada Perangkat. | Alat | ||
Bangku Alat | Platform terbuka untuk melatih, menyajikan, dan mengevaluasi model bahasa besar untuk pembelajaran alat. | Alat | ||
Obrolan PersatuanGPT | Eksperimen Persatuan ChatGPT. | Persatuan | Alat | |
Integrasi Persatuan OpenAI-API | Integrasikan model bahasa openai GPT-3 dan API ChatGPT ke dalam proyek Unity. | Persatuan | Alat | |
Mesin Unreal 5 Llama LoRA | Sebuah proyek pembuktian konsep yang menunjukkan potensi penggunaan LLM kecil yang dapat dilatih secara lokal untuk menciptakan alat dokumentasi generasi berikutnya. | Mesin Tidak Nyata | Alat | |
GPT yang tidak nyata | Kumpulan widget Utilitas Editor Unreal Engine 5 yang didukung oleh GPT3/4. | Mesin Tidak Nyata | Alat | |
Video-LLaVA | Mempelajari Representasi Visual Bersatu dengan Penyelarasan Sebelum Proyeksi. | arXiv | Alat | |
WebGPT | Jalankan model GPT di browser dengan WebGPU. | Alat | ||
Web3-GPT | Terapkan kontrak pintar dengan AI | Alat | ||
KataGPT | ? Hadirkan kekuatan ChatGPT ke Microsoft Word | Alat | ||
Agen X | Agen LLM Otonom untuk Pemecahan Tugas Kompleks. | Alat | ||
Yi | Serangkaian model bahasa besar yang dilatih dari awal oleh pengembang. | Alat | ||
01 Proyek | Komputer model bahasa sumber terbuka. | Alat |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
AgenBench | Tolok Ukur Komprehensif untuk Mengevaluasi LLM sebagai Agen. | arXiv | Agen | |
Obrolan Grup Agen | Simulacra Obrolan Grup Interaktif Untuk Memunculkan Perilaku Kolektif yang Muncul dengan Lebih Baik. | arXiv | Agen | |
Agen K | AGI autoagentik yang berkembang sendiri dan modular. | Agen | ||
Lingkup Agen | Mulailah membangun aplikasi multi-agen yang didukung LLM dengan cara yang lebih mudah. | arXiv | Agen | |
AgenSims | Sandbox Sumber Terbuka untuk Evaluasi Model Bahasa Besar. | Agen | ||
Kota AI | AI Town adalah kota virtual tempat karakter AI tinggal, mengobrol, dan bersosialisasi. | Agen | ||
anime.gf | Alternatif Lokal & Sumber Terbuka untuk CharacterAI. | Permainan | ||
Astrocade | Buat game dengan AI | Permainan | ||
Agen Atom | Kerangka kerja Agen Atom dirancang agar bersifat modular, dapat diperluas, dan mudah digunakan. | Agen | ||
Agen Otomatis | Kerangka Kerja untuk Pembuatan Agen Otomatis. | Agen | ||
Generasi Otomatis | Aktifkan Aplikasi Model Bahasa Besar Generasi Berikutnya. | arXiv | Agen | |
berperilaku | Behaviorac adalah kerangka pengembangan AI game. | Kerangka | ||
Bioma | Bioma adalah MMORPG kotak pasir sumber terbuka yang dibuat untuk web menggunakan teknologi web seperti Next.js, TypeScript, React, dan WebAssembly. | Permainan | ||
Penyangga Pikiran | Penalaran yang Ditambah Pikiran dengan Model Bahasa Besar. | arXiv | Agen | |
Agen Byzer | Kerangka kerja agen yang mudah, cepat, dan terdistribusi untuk semua orang. | Agen | ||
Kota Kucing | Simulasi bertenaga AC(h)atGPT dengan kucing. | Agen | ||
Kota Kucing | Simulasi bertenaga AC(h)atGPT dengan kucing. | Agen | ||
KarakterGLM | Menyesuaikan Karakter AI Percakapan Bahasa Mandarin dengan Model Bahasa Besar. | arXiv | Agen | |
Pengembang Obrolan | Agen Komunikatif untuk Pengembangan Perangkat Lunak. | arXiv | Agen | |
Agen Cog | CogAgent adalah model bahasa visual sumber terbuka yang ditingkatkan berdasarkan CogVLM. | arXiv | Agen | |
Buaian | Menuju Pengendalian Komputer Secara Umum. | Agen | ||
kruAI | Kerangka kerja untuk mengatur agen AI otonom yang bermain peran. | Agen | ||
Difikasi | Dify adalah platform pembuatan aplikasi LLM sumber terbuka. | Agen | ||
Proyek Kehidupan Digital | Karakter 3D Otonom dengan Kecerdasan Sosial. | arXiv | Agen | |
semuanya-ai | Asisten chatbot lokal Anda yang sepenuhnya mahir, didukung AI, dan lokal?. | Agen | ||
kain | fabric adalah kerangka kerja sumber terbuka untuk meningkatkan kemampuan manusia menggunakan AI. | Agen | ||
GPT cepat | FastGPT adalah platform berbasis pengetahuan yang dibangun di LLM. | Agen | ||
cepatRAG | Kerangka Augmentasi dan Pembuatan Pengambilan yang Efisien. | Agen | ||
GameAISDK | Kerangka kerja otomatisasi AI game berbasis gambar. | Kerangka | ||
GameNGen | Model Difusi Adalah Mesin Game Real-Time. | arXiv | Permainan | |
GameGen-O | GameGen-O: Generasi Video Game Dunia Terbuka. | Permainan | ||
Agen Gen | GenAgent: Membangun Sistem AI Kolaboratif dengan Pembuatan Alur Kerja Otomatis - Studi Kasus di ComfyUI. | arXiv | Agen | |
Agen Generatif | Simulacra Interaktif Perilaku Manusia. | arXiv | Agen | |
Asal | Genesis: Mesin Fisika Generatif dan Universal untuk Robotika dan Selebihnya. | Permainan | ||
Jin | Lingkungan Interaktif Generatif. | Permainan | ||
gigax | Runtime, NPC bertenaga LLM. | Permainan | ||
HippoRAG | Memori Jangka Panjang yang Terinspirasi Secara Neurobiologis untuk Model Bahasa Besar. | arXiv | Agen | |
NPC Bertenaga LLM Interaktif | NPC Bertenaga LLM Interaktif, adalah proyek sumber terbuka yang sepenuhnya mengubah interaksi Anda dengan karakter non-pemain (NPC) di game apa pun! | Permainan | ||
IoA | Kerangka kerja sumber terbuka untuk agen AI kolaboratif, memungkinkan agen yang beragam dan terdistribusi untuk bekerja sama dan menangani tugas-tugas kompleks melalui konektivitas seperti internet. | Agen | ||
Agen Kwai | Sistem agen pencari informasi umum dengan Model Bahasa Besar (LLM). | arXiv | Agen | |
LangChain | Dapatkan aplikasi LLM Anda dari prototipe hingga produksi. | Agen | ||
aliran Lang | Langflow adalah UI untuk LangChain, dirancang dengan aliran reaksi untuk menyediakan cara yang mudah untuk bereksperimen dan membuat prototipe aliran. | Agen | ||
LangGraph Studio | LangGraph Studio menawarkan cara baru untuk mengembangkan aplikasi LLM dengan menyediakan IDE agen khusus yang memungkinkan visualisasi, interaksi, dan debugging aplikasi agen yang kompleks. | Agen | ||
LARP | Permainan Peran Agen Bahasa untuk game dunia terbuka. | arXiv | Agen | |
Sistem Agen LLama | Komponen agen dari Llama Stack API. | Agen | ||
Indeks Llama | LlamaIndex adalah kerangka data untuk aplikasi LLM Anda. | Agen | ||
Pencarian Pikiran | ? Kerangka Kerja Multi-agen Mesin Pencari Web berbasis LLM (seperti Perplexity.ai Pro dan SearchGPT). | Agen | ||
Campuran Agen (MoA) | Campuran Agen Meningkatkan Kemampuan Model Bahasa Besar. | arXiv | Agen | |
Peran MMR | MMRole: Kerangka Komprehensif untuk Mengembangkan dan Mengevaluasi Agen Role-Playing Multimodal. | arXiv | Agen | |
Moonlander.ai | Mulailah membuat game 3D tanpa coding apa pun menggunakan AI generatif. | Kerangka | ||
Difusi Mug | Difusi MuG adalah AI pembuatan bagan untuk permainan ritme berdasarkan Difusi Stabil (salah satu model AIGC paling kuat) dengan modifikasi besar untuk menggabungkan gelombang audio. | Permainan | ||
Oasis | Oasis adalah model dunia interaktif yang dikembangkan oleh Desart dan Etched. Berdasarkan transformator difusi, Oasis menerima input keyboard pengguna dan menghasilkan gameplay secara autoregresif. | Permainan | ||
Agen Om | Kerangka kerja agen multimodal untuk menyelesaikan tugas-tugas kompleks. | Agen | ||
Agen Terbuka | Platform Terbuka untuk Agen Bahasa di Alam Liar. | Agen | ||
Karya | Aplikasi AI yang mengubah teks menjadi video game. | Permainan | ||
kucing pipa | Kerangka kerja Sumber Terbuka untuk AI percakapan suara dan multimodal. | Agen | ||
Agen Qwen | Qwen-Agent adalah kerangka kerja untuk mengembangkan aplikasi LLM berdasarkan instruksi berikut, penggunaan alat, perencanaan, dan kemampuan memori Qwen. | Agen | ||
Raga | Ragas adalah kerangka kerja yang membantu Anda mengevaluasi alur Retrieval Augmented Generation (RAG). | Agen | ||
RPBench-Otomatis | Saluran otomatis untuk mengevaluasi LLM untuk permainan peran. | Permainan | ||
SIMA | Agen AI generalis untuk lingkungan virtual 3D. | Agen | ||
StoryGames.ai | AI untuk Pemimpi Membuat Game. | Permainan | ||
Agen SWE | Antarmuka Komputer Agen Mengaktifkan Model Bahasa Rekayasa Perangkat Lunak. | arXiv | Agen | |
Gen Tugas | Kerangka kerja agen berbasis tugas yang dibangun berdasarkan keluaran StrictJSON oleh agen LLM. | Agen | ||
SEPULUH Agen | TEN Agent adalah agen multimoda real-time pertama di dunia yang terintegrasi dengan OpenAI Realtime API, RTC, dan dilengkapi fitur pemeriksaan cuaca, pencarian web, penglihatan, dan kemampuan RAG. | Agen | ||
Agen Terjemahan | Terjemahan agen menggunakan alur kerja refleksi. | Agen | ||
Twitter Personality adalah aplikasi web yang menganalisis akun Twitter Anda untuk membuat profil kepribadian yang dipersonalisasi menggunakan Agen AI Wordware. | Agen | |||
Tak terbatas | Tak Terbatas: Game Simulasi Kehidupan Karakter Generatif Tak Terbatas. | arXiv | Permainan | |
Video2Game | Lingkungan Real-time, Interaktif, Realistis, dan Kompatibel dengan Browser dari Satu Video. | arXiv | Permainan | |
V-IRL | Mendasarkan Kecerdasan Virtual dalam Kehidupan Nyata. | arXiv | Agen | |
Agen Desain Web | Agen yang digunakan untuk desain web. | Agen | ||
Agen X | Agen LLM Otonom untuk Pemecahan Tugas Kompleks. | Agen |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
Penerjemah Kode AI | Gunakan AI untuk menerjemahkan kode dari satu bahasa ke bahasa lain. | Kode | ||
aiXcoder-7B | Model Bahasa Besar Kode aiXcoder-7B. | Kode | ||
kesalahan | bloop adalah mesin pencari kode cepat yang ditulis dalam Rust. | Kode | ||
Bab | Penerjemah Kode ChatGPT di Notebook Jupyter. | Kode | ||
KodeGeeX | Model Pembuatan Kode Multibahasa Terbuka. | arXiv | Kode | |
KodeGeeX2 | Model Pembuatan Kode Multibahasa yang Lebih Kuat. | Kode | ||
KodeGeeX4 | CodeGeeX4: Model Pembuatan Kode Multibahasa Terbuka. | Kode | ||
KodeGen | CodeGen adalah model sumber terbuka untuk sintesis program. Dilatih pada TPU-v4. Kompetitif dengan OpenAI Codex. | arXiv | Kode | |
KodeGen2 | Model CodeGen2 untuk sintesis program. | arXiv | Kode | |
Kode Llama | Code Llama adalah model bahasa besar untuk kode berdasarkan Llama 2. | Kode | ||
KodeTF | Perpustakaan Transformer terpadu untuk Code LLM yang canggih. | Kode | ||
KodeT5 | LLM Kode Terbuka untuk Pemahaman dan Pembuatan Kode. | Kode | ||
Kursor | Tulis, edit, dan ngobrol tentang kode Anda dengan GPT-4 di editor jenis baru. | Kode | ||
Pembuat Kode DeepSeek | DeepSeek Coder: Biarkan Kode Menulis Sendiri. | arXiv | Kode | |
Kodeks OpenAI | OpenAI Codex adalah turunan dari GPT-3. | Kode | ||
PandaAI | Pandas AI adalah pustaka Python yang mengintegrasikan kemampuan kecerdasan buatan generatif ke dalam Pandas, menjadikan kerangka data bersifat komunikatif. | Kode | ||
RobloxScripterAI | RobloxScripterAI adalah alat pembuat kode bertenaga AI untuk Roblox. | Roblox | Kode | |
Scikit-LLM | Integrasikan model bahasa canggih seperti ChatGPT dengan lancar ke dalam scikit-learn untuk tugas analisis teks yang ditingkatkan. | Kode | ||
JadiTaNa | Asisten Pengembangan Perangkat Lunak Sumber Terbuka. | arXiv | Kode | |
Kode Stabil 3B | Pengkodean di Edge. | Kode | ||
Kode Bintang | ? StarCoder adalah model bahasa (LM) yang dilatih pada kode sumber dan teks bahasa alami. | arXiv | Kode | |
Kode Bintang 2 | StarCoder2 adalah rangkaian model pembuatan kode (3B, 7B, dan 15B), dilatih pada 600+ bahasa pemrograman dari The Stack v2 dan beberapa teks bahasa alami seperti masalah Wikipedia, Arxiv, dan GitHub. | arXiv | Kode | |
UnityGen AI | UnityGen AI adalah plugin pembuatan kode bertenaga AI untuk Unity. | Persatuan | Kode | |
Ruang kosong | Void adalah alternatif Kursor open source. Tulis kode dengan alat AI terbaik, pertahankan kontrol penuh atas data Anda, dan akses fitur AI canggih. | Kode |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
AI-Penulis | AI menulis novel, membuat artikel web fantasi dan romansa, dll. Model generatif terlatih Tiongkok. | Penulis | ||
Buku catatan.ai | Notebook.ai adalah seperangkat alat bagi penulis, desainer game, dan pemain peran untuk menciptakan alam semesta yang menakjubkan – dan segala sesuatu di dalamnya. | Penulis | ||
Novel | Editor WYSIWYG bergaya Notion dengan pelengkapan otomatis bertenaga AI. | Penulis | ||
NovelAI | Didorong oleh AI, buatlah cerita unik, kisah mendebarkan, romansa yang menggoda, atau sekadar main-main tanpa kesulitan. | Penulis |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
Pintu Mana Saja | Kustomisasi Gambar Tingkat Objek Zero-shot. | arXiv | Gambar | |
Teks Apa Pun | Pembuatan dan Pengeditan Teks Visual Multibahasa. | arXiv | Gambar | |
Studio Otomatis | Membuat Subjek yang Konsisten dalam Pembuatan Gambar Interaktif Multi-putaran. | arXiv | Gambar | |
Blender-ControlNet | Menggunakan ControlNet langsung di Blender. | pencampur | Gambar | |
BriVL | Menjembatani Visi dan Model Bahasa. | arXiv | Gambar | |
CatVTON | CatVTON: Penggabungan Adalah Semua yang Anda Butuhkan untuk Uji Coba Virtual dengan Model Difusi. | arXiv | Gambar | |
CLIPasso | Sebuah metode untuk mengubah gambar suatu objek menjadi sketsa, memungkinkan berbagai tingkat abstraksi. | arXiv | Gambar | |
KlipJatuhkan | Ciptakan visual yang menakjubkan dalam hitungan detik. | Gambar | ||
UI yang nyaman | GUI difusi stabil yang kuat dan modular dengan antarmuka grafik/node. | Gambar | ||
Lab Konsep | Pembuatan Kreatif menggunakan Batasan Difusi Sebelumnya. | arXiv | Gambar | |
KontrolNet | ControlNet adalah struktur jaringan saraf untuk mengontrol model difusi dengan menambahkan kondisi tambahan. | arXiv | Gambar | |
CSGO | CSGO: Komposisi Gaya Konten dalam Pembuatan Teks-ke-Gambar. | arXiv | Gambar | |
DALL·E 2 | DALL·E 2 adalah sistem AI yang dapat membuat gambar dan seni realistis dari deskripsi dalam bahasa alami. | Gambar | ||
Studio Dashtoon | Dashtoon Studio adalah platform pembuatan komik bertenaga AI. | Komik | ||
DeepAI | DeepAI menawarkan serangkaian alat yang menggunakan AI untuk meningkatkan kreativitas Anda. | Gambar | ||
DeepFloyd JIKA | JIKA oleh DeepFloyd Lab di StabilityAI. | Gambar | ||
Kedalaman Apapun V2 | Kedalaman Apapun V2 | arXiv | Gambar | |
Perpustakaan dan masalah peta kedalaman | Pustaka peta kedalaman untuk digunakan dengan ekstensi Control Net untuk Automatic1111/stable-diffusion-webui. | Gambar | ||
Diffuse untuk Memilih | Memperkaya Inpainting Berkondisi Gambar dalam Model Difusi Laten untuk Uji Coba Virtual. | arXiv | Gambar | |
Difusi Disko | Penggabungan buku catatan, model, dan teknik frankensteinian untuk generasi Seni dan Animasi AI. | Gambar | ||
TarikGAN | Manipulasi Berbasis Titik Interaktif pada Manifold Gambar Generatif. | arXiv | Gambar | |
Menggambar Sesuatu | Pembuatan gambar dengan bantuan AI di Saku Anda. | Gambar | ||
DWPose | Estimasi Pose Seluruh Tubuh yang Efektif dengan Distilasi Dua Tahap. | arXiv | Gambar | |
Foto Mudah | Generator Foto AI Cerdas Anda. | Gambar | ||
Aliran | Repo ini berisi kode inferensi minimal untuk menjalankan teks-ke-gambar dan gambar-ke-gambar dengan transformator aliran laten Flux kami yang telah diperbaiki. | Gambar | ||
Ikuti-Klik Anda | Animasi Gambar Regional Domain Terbuka melalui Perintah Singkat. | arXiv | Gambar | |
bodoh | Fokus pada mendorong dan menghasilkan. | Gambar | ||
fusi GIF | Buat GIF dan Video menggunakan Difusi Stabil. | Gambar | ||
Segmen Beralas-Apa Saja | Secara Otomatis Mendeteksi, Menyegmentasikan, dan Menghasilkan Apa Pun dengan Input Gambar, Teks, dan Audio. | arXiv | Gambar | |
Foto HivisionID | HivisionIDPhotos: alat foto ID AI yang ringan dan efisien. | Gambar | ||
Hua | Hua adalah editor gambar AI dengan Difusi Stabil (dan banyak lagi). | Gambar | ||
Hunyuan-DiT | Transformator Difusi Multi-Resolusi yang Kuat dengan Pemahaman Tiongkok yang Mendalam. | arXiv | Gambar | |
IC-Cahaya | IC-Light adalah proyek untuk memanipulasi pencahayaan gambar. | Gambar | ||
Tulisan gambar | Membantu orang menjadi lebih kreatif. | Gambar | ||
Gambar | Imagen adalah sistem AI yang menghasilkan gambar fotorealistik dari teks masukan. | Gambar | ||
img2img-turbo | Gambar-ke-Gambar Satu Langkah dengan SD-Turbo. | Gambar | ||
Img2Prompt | Dapatkan petunjuk dari gambar yang dihasilkan difusi stabil. | Gambar | ||
Ketakterbatasan | Infinity: Menskalakan Pemodelan AutoRegresif Bitwise untuk Sintesis Gambar Resolusi Tinggi. | arXiv | Gambar | |
ID Instan | Generasi Pelestarian Identitas Zero-shot dalam Hitungan Detik. | arXiv | Gambar | |
MagangLM-XComposer2 | InternLM-XComposer2 adalah model besar bahasa visi (VLLM) inovatif yang unggul dalam komposisi dan pemahaman teks-gambar bentuk bebas. | arXiv | Gambar | |
KOALA | Perhatian Diri Penting dalam Distilasi Pengetahuan Model Difusi Laten untuk Sintesis Gambar yang Efisien Memori dan Cepat. | Gambar | ||
Warna | Kolors: Pelatihan Model Difusi yang Efektif untuk Sintesis Teks-ke-Gambar Fotorealistik. | Gambar | ||
KREA | Hasilkan gambar dan video dengan alat desain bertenaga AI yang menyenangkan. | Gambar | ||
Jembatan LaVi | Menjembatani Berbagai Model Bahasa dan Model Visi Generatif untuk Pembuatan Teks-ke-Gambar. | arXiv | Gambar | |
Lapisan Difusi | Difusi Lapisan Gambar Transparan menggunakan Transparansi Laten. | arXiv | Gambar | |
leksika | Difusi Stabil mendorong mesin pencari. | Gambar | ||
LlamaGen | Model Autoregresif Mengalahkan Difusi: Llama untuk Pembuatan Gambar yang Dapat Diskalakan. | arXiv | Gambar | |
Lumina-mGPT | Lumina-mGPT: Menerangi Pembuatan Teks-ke-Gambar Fotorealistik yang Fleksibel dengan Pra-pelatihan Generatif Multimodal. | arXiv | Gambar | |
MetaTembak | MetaShoot adalah kembaran digital dari studio foto, yang dikembangkan sebagai plugin untuk Unreal Engine yang memberikan kemampuan kepada pembuat konten mana pun untuk menghasilkan render yang sangat realistis dengan cara termudah dan tercepat. | Mesin Tidak Nyata | Gambar | |
Tengah perjalanan | Midjourney adalah laboratorium penelitian independen yang mengeksplorasi media pemikiran baru dan memperluas kekuatan imajinatif spesies manusia. | Gambar | ||
MIGC | MIGC: Pengontrol Pembuatan Multi-Instance untuk Sintesis Teks-ke-Gambar. | arXiv | Gambar | |
MimicBrush | Pengeditan Gambar Zero-shot dengan Imitasi Referensi. | arXiv | Gambar | |
MahaGen | OmniGen: Pembuatan Gambar Terpadu. | arXiv | Gambar | |
Ya ampun | Omost adalah proyek untuk mengubah kemampuan pengkodean LLM menjadi kemampuan pembuatan gambar (atau lebih tepatnya, pembuatan gambar). | Gambar | ||
Editor Pose Terbuka | Openpose Editor untuk webui difusi stabil AUTOMATIC1111. | Gambar | ||
Pakaian Siapapun | Uji coba virtual berkualitas sangat tinggi untuk Pakaian Apa Pun dan Siapa Pun. | Gambar | ||
Cat Batalkan | PaintsUndo: Model Dasar Perilaku Menggambar dalam Lukisan Digital. | Gambar | ||
Pembuat Foto | Menyesuaikan Foto Manusia Realistis melalui Penyematan ID Bertumpuk. | arXiv | Gambar | |
ruang foto | Pembuat Latar Belakang AI. | Gambar | ||
plastik | Pembuatan gambar AI di cloud. | Gambar | ||
Cepat.Seni | Hub Generator. | Gambar | ||
PulID | Kustomisasi ID Murni dan Kilat melalui Penyelarasan Kontrasif. | arXiv | Gambar | |
Teks Kaya-ke-Gambar | Pembuatan Teks-ke-Gambar Ekspresif dengan Teks Kaya. | arXiv | Gambar | |
RPG-DiffusionMaster | Menguasai Difusi Teks-ke-Gambar: Pembuatan Ulang, Perencanaan, dan Pembuatan dengan Multimodal LLM (PRG). | Gambar | ||
SEED-Cerita | SEED-Story: Pembuatan Cerita Panjang Multimodal dengan Model Bahasa Besar. | arXiv | Gambar | |
Segmentasikan Apa Saja | Segment Anything Model (SAM): model AI baru dari Meta AI yang dapat "memotong" objek apa pun, di gambar apa pun, dengan satu klik. | arXiv | Gambar | |
Segmen Apapun Model 2 (SAM 2) | SAM 2: Segmentasikan Apa Pun di Gambar dan Video. | arXiv | Gambar | |
sd-webui-controlnet | Ekstensi WebUI untuk ControlNet. | Gambar | ||
SDXL-Petir | Distilasi Difusi Adversarial Progresif. | arXiv | Gambar | |
SDXS | Model Difusi Laten Satu Langkah Waktu Nyata dengan Kondisi Gambar. | Gambar | ||
Stabil.seni | Plugin Photoshop untuk Difusi Stabil dengan Automatic1111 sebagai backend (secara lokal atau dengan Google Colab). | Gambar | ||
Kaskade Stabil | Stable Cascade terdiri dari tiga model: Tahap A, Tahap B, dan Tahap C, yang mewakili kaskade untuk menghasilkan gambar, oleh karena itu dinamakan "Stable Cascade". | Gambar | ||
Difusi Stabil | Model difusi teks-ke-gambar yang laten. | Gambar | ||
stable-diffusion.cpp | Difusi Stabil dalam C/C++ murni. | Gambar | ||
UI web Difusi Stabil | Antarmuka browser berdasarkan perpustakaan Gradio untuk Difusi Stabil. | Gambar | ||
UI web Difusi Stabil | UI berbasis web untuk Difusi Stabil. | Gambar | ||
WebUI Difusi Stabil Cina | versi Cina dari webui difusi stabil. | Gambar | ||
Difusi Stabil XL | Hasilkan gambar dari teks. | arXiv | Gambar | |
Difusi Stabil XL Turbo | Pembuatan Teks-ke-Gambar Waktu Nyata. | Gambar | ||
Difusi Stabil 3.5 | Rilis terbuka Stable Diffusion 3.5 mencakup beberapa varian model, termasuk Stable Diffusion 3.5 Large dan Stable Diffusion 3.5 Large Turbo. | Gambar | ||
Coretan Stabil | Doodle Stabil adalah alat sketsa-ke-gambar yang mengubah gambar sederhana menjadi gambar dinamis. | Gambar | ||
Studio Stabil | StableStudio oleh Stabilitas AI | Gambar | ||
Pembuat Cerita | StoryMaker: Menuju Karakter Holistik yang Konsisten dalam Pembuatan Teks-ke-gambar. | arXiv | Gambar | |
Aliran Difusi | Solusi Tingkat Saluran untuk Pembuatan Interaktif Waktu Nyata. | Gambar | ||
Gaya Jatuhkan | Pembuatan Teks-Ke-Gambar dalam Gaya Apa Pun. | arXiv | Gambar | |
Sinkronisasi Pemimpi | Menghasilkan Gambar yang Konsisten dengan Multiview dari Gambar Tampilan Tunggal. | arXiv | Gambar | |
UltraEdit | UltraEdit: Pengeditan Gambar Berbutir Halus Berbasis Instruksi dalam Skala Besar. | arXiv | Gambar | |
Ultra Piksel | UltraPixel: Meningkatkan Sintesis Gambar Resolusi Ultra Tinggi ke Puncak Baru. | arXiv | Gambar | |
Difusi Stabil Unity ML | Difusi Stabil Core ML pada Unity. | Persatuan | Gambar | |
Visi Vispunk | Platform pembuatan Teks-ke-Gambar. | Gambar |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
CRM | Gambar Tunggal ke Mesh Bertekstur 3D dengan Model Rekonstruksi Konvolusional. | arXiv | Tekstur | |
Mat Mimpi | Pembuatan Material PBR Berkualitas Tinggi dengan Model Difusi Sadar Geometri dan Cahaya. | arXiv | Tekstur | |
Ruang Impian | Impikan Ruang Kamar Anda dengan Propagasi Tekstur Panorama Berbasis Teks. | Tekstur | ||
Tekstur Mimpi | Difusi Stabil yang ada di dalam Blender. Buat tekstur, seni konsep, aset latar belakang, dan banyak lagi dengan perintah teks sederhana. | pencampur | Tekstur | |
Instruksikan Manusia | Mengedit Tekstur Manusia 3D Animasi dengan Instruksi. | arXiv | Tekstur | |
InteX | Sintesis Teks-ke-Tekstur Interaktif melalui Inpainting Sadar Kedalaman Terpadu. | arXiv | Tekstur | |
LLaMA-Mesh | LLaMA-Mesh: Menyatukan Generasi Mesh 3D dengan Model Bahasa. | arXiv | Jala | |
BahanSeg3D | MaterialSeg3D: Menyegmentasikan Material Padat dari Prior 2D untuk Aset 3D. | arXiv | Tekstur | |
Jala Apa Saja | MaterialSeg3D: Menyegmentasikan Material Padat dari Prior 2D untuk Aset 3D. | arXiv | Jala | |
Neurallangelo | Rekonstruksi Permukaan Neural dengan Ketelitian Tinggi. | arXiv | Tekstur | |
Cat-itu | Sintesis Teks-ke-Tekstur melalui Optimasi Peta Tekstur Konvolusional Mendalam dan Rendering Berbasis Fisik. | Tekstur | ||
Polikamera | Buat tekstur 3D Anda sendiri hanya dengan mengetik. | Tekstur | ||
TexFusion | Mensintesis Tekstur 3D dengan Model Difusi Gambar yang Dipandu Teks. | arXiv | Tekstur | |
Teks2Tex | Sintesis tekstur berbasis teks melalui Model Difusi. | arXiv | Tekstur | |
Lab Tekstur | Tekstur yang dihasilkan AI. Anda dapat membuatnya sendiri dengan prompt teks. | Tekstur | ||
Dengan Poli | Buat Tekstur Dengan Poli. Hasilkan materi 3D dengan AI dalam editor online gratis, atau cari di perpustakaan komunitas kami yang terus berkembang. | Tekstur | ||
X-Mesh | X-Mesh: Menuju Stylisasi 3D Berbasis Teks yang Cepat dan Akurat melalui Panduan Tekstual Dinamis. | arXiv | Tekstur |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
AI Shader | Generator shader bertenaga ChatGPT untuk Unity. | Persatuan | peneduh |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin Permainan | Jenis |
---|---|---|---|---|
animasi3D | Animate3D: Menganimasikan Model 3D Apa Pun dengan Difusi Video Multi-tampilan. | arXiv | 3D | |
Apa pun-3D | Segmen-Apa Saja + 3D. Mari kita angkat semuanya menjadi 3D. | arXiv | Model | |
Any2Point | Any2Point: Memberdayakan Model Besar Modalitas Apa pun untuk Pemahaman 3D yang Efisien. | arXiv | 3D | |
BlenderGPT | Gunakan perintah dalam bahasa Inggris untuk mengontrol Blender dengan GPT-4 OpenAI. | pencampur | Model | |
Blender-GPT | Asisten Blender lengkap yang didukung oleh integrasi GPT3/4 + Whisper. | pencampur | Model | |
Lab Blokade | Alkimia digital menjadi nyata dengan Skybox Lab - solusi terbaik yang didukung AI untuk menghasilkan pengalaman skybox 360° yang luar biasa dari perintah teks. | Model | ||
CF-3DGS | Percikan Gaussian 3D Bebas COLMAP. | arXiv | 3D | |
KarakterGen | CharacterGen: Pembuatan Karakter 3D yang Efisien dari Gambar Tunggal dengan Kanonikalisasi Pose Multi-Tampilan. | arXiv | 3D | |
chatGPT-maya | Alat Maya sederhana yang memanfaatkan AI terbuka untuk melakukan tugas dasar berdasarkan instruksi deskriptif. | Maya | Model | |
Pemimpi Kota | Model Generatif Komposisi Kota 3D Tanpa Batas. | arXiv | 3D | |
CSM | Hasilkan dunia 3D dari gambar dan video. | 3D | ||
lari | Kopilot Anda untuk Pembangunan Dunia di Unreal Engine. | Mesin Tidak Nyata | 3D | |
Katalis Mimpi | DreamCatalyst: Pengeditan 3D Cepat dan Berkualitas Tinggi melalui Pengendalian Kemampuan Edit dan Pelestarian Identitas. | arXiv | 3D | |
MimpiGaussian4D | Percikan Gaussian 4D Generatif. | arXiv | 4D | |
DEBU3R | Visi 3D Geometris Menjadi Mudah. | arXiv | 3D | |
Membangun 3D | Edify 3D: Pembuatan Aset 3D Berkualitas Tinggi yang Dapat Diskalakan. | arXiv | 3D | |
GALA3D | GALA3D: Menuju Pembuatan Adegan Kompleks Teks-ke-3D melalui Generative Gaussian Splatting yang dipandu Tata Letak. | arXiv | 3D | |
GaussCtrl | GaussCtrl: Pengeditan Gaussian Splatting 3D Berbasis Teks yang Konsisten Multi-Tampilan. | arXiv | 3D | |
GaussianCube | Representasi Cahaya Terstruktur dan Eksplisit untuk Pemodelan Generatif 3D. | arXiv | 3D | |
Gaussian Dreamer | Pembuatan Cepat dari Teks ke Gaussian Splatting 3D dengan Point Cloud Priors. | arXiv | 3D | |
Lab Genie | Berdayakan game Anda dengan AI-UGC. | 3D | ||
HiFA | Teks-ke-3D dengan ketelitian tinggi dengan panduan Difusi tingkat lanjut. | Model | ||
HoloPemimpi | HoloDreamer: Generasi Dunia Panorama 3D Holistik dari Deskripsi Teks. | arXiv | 3D | |
Hunyuan3D-1.0 | Hunyuan3D-1.0: Kerangka Kerja Terpadu untuk Pembuatan Teks-ke-3D dan Gambar-ke-3D. | arXiv | 3D | |
tak terhingga | Dunia Fotorealistik Tanpa Batas menggunakan Generasi Prosedural. | arXiv | 3D | |
Instruksikan-NeRF2NeRF | Mengedit Adegan 3D dengan Instruksi. | arXiv | Model | |
Interaktif3D | Ciptakan Apa yang Anda Inginkan dengan Generasi 3D Interaktif. | arXiv | 3D | |
Isotropik3D | Pembuatan Gambar-ke-3D Berdasarkan Penyematan CLIP Tunggal. | 3D | ||
TERBARU3D | Sintesis Teks-Ke-3D yang Diamortisasi Skala Besar. | arXiv | 3D | |
SINGA | Model Difusi Titik Laten untuk Pembuatan Bentuk 3D. | arXiv | Model | |
Luma AI | Tangkap dalam 3D yang hidup. Fotorealisme, refleksi, dan detail yang tak tertandingi. Masa depan VFX adalah sekarang, untuk semua orang! | Model | ||
menerangi AI | Kreativitas yang Didukung AI. | 3D | ||
Jadikan-3D | Pembuatan 3D Fidelitas Tinggi dari Satu Gambar dengan Difusi Sebelumnya. | arXiv | Model | |
Bersifat jala | Ciptakan Aset Game 3D yang Menakjubkan dengan AI. | 3D | ||
gerak | Pembuat Animasi AI 3D Ajaib. | 3D | ||
mimpi MVD | Difusi Multi-tampilan untuk Generasi 3D. | arXiv | 3D | |
NVIDIA NeRF Instan | Grafik saraf primitif instan: NeRF secepat kilat dan banyak lagi. | Model | ||
Satu-2-3-45 | Gambar Tunggal apa pun ke Mesh 3D dalam 45 Detik tanpa Optimasi Per Bentuk. | arXiv | Model | |
Cat3D | Lukis Apa Pun 3D dengan Model Difusi Tekstur Tanpa Pencahayaan. | arXiv | 3D | |
PAniC-3D | Rekonstruksi 3D Tampilan Tunggal Bergaya dari Potret Karakter Anime. | arXiv | Model | |
Titik·E | Difusi titik awan untuk sintesis model 3D. | Model | ||
Pemimpi Produktif | Pembuatan Teks-ke-3D dengan Fidelitas Tinggi dan beragam dengan Distilasi skor Variasi. | arXiv | Model | |
SF3D | SF3D: Rekonstruksi Jaring 3D Cepat yang Stabil dengan Pembukaan UV dan Penguraian Iluminasi. | arXiv | 3D | |
Membentuk | Menghasilkan objek 3D yang dikondisikan pada teks atau gambar. | arXiv | Model | |
Sloyd | Pemodelan 3D tidak pernah semudah ini. | Model | ||
Spline AI | Kekuatan AI mencapai dimensi ke-3. Hasilkan objek, animasi, dan tekstur menggunakan petunjuk. | Model | ||
Penggabungan Mimpi yang Stabil | Implementasi pytorch dari model teks-ke-3D Dreamfusion, didukung oleh model teks-ke-2D Difusi Stabil. | Model | ||
SV3D | Sintesis Multi-tampilan Novel dan Pembuatan 3D dari Gambar Tunggal menggunakan Difusi Video Laten. | arXiv | 3D | |
Tafi | Teks AI ke mesin karakter 3D. | Model | ||
3D-GPT | Pemodelan 3D Prosedural dengan Model Bahasa Besar. | arXiv | 3D | |
3D-LLM | Menyuntikkan Dunia 3D ke dalam Model Bahasa Besar. | arXiv | 3D | |
3Dpresso | Ekstrak model 3D suatu objek, yang diambil dalam video. | Model | ||
3DTopia | Pembuatan Teks-ke-3D dalam 5 Menit. | arXiv | 3D | |
3DTopia-XL | 3DTopia-XL: Menskalakan Pembuatan Aset 3D Berkualitas Tinggi melalui Difusi Primitif. | arXiv | 3D | |
tigastudio | Kerangka kerja terpadu untuk pembuatan konten 3D. | Model | ||
TripoSR | Model sumber terbuka tercanggih untuk rekonstruksi 3D feedforward cepat dari satu gambar. | arXiv | Model | |
Unik3D | Pembuatan Mesh 3D Berkualitas Tinggi dan Efisien dari Satu Gambar. | arxiv | 3D | |
Unitygaussiansplatting | Toy Gaussian Splatting Visualisasi dalam Persatuan. | Persatuan | 3D | |
Vivid-1-to-3 | Sintesis tampilan baru dengan model difusi video. | arxiv | 3D | |
Voxcraft | Membuat model 3D yang siap digunakan dengan AI. | 3D | ||
Wonder3d | Gambar tunggal ke 3D menggunakan difusi lintas domain. | arxiv | 3D | |
Zero-1-to-3 | Zero-shot satu gambar ke objek 3D. | arxiv | Model |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
Aniportrait | Sintesis yang digerakkan oleh audio dari animasi potret fotorealistik. | arxiv | Avatar | |
TENANG | Model laten permusuhan bersyarat untuk karakter virtual yang dapat directable. | arxiv | Avatar | |
Chatavatar | Generasi progresif wajah 3D yang dianimasikan di bawah panduan teks. | Avatar | ||
Chatdollkit | ChatDollKit memungkinkan Anda untuk membuat model 3D Anda menjadi chatbot. | Persatuan | Avatar | |
Dreamtalk | Ketika generasi kepala berbicara ekspresif memenuhi model probabilistik difusi. | arxiv | Avatar | |
Duix | DUIX - Digital Human SDK berbasis silikon? | Avatar | ||
Echomimic | Echomimic: Animasi potret yang digerakkan oleh audio seperti hidup melalui kondisi tengara yang dapat diedit. | arxiv | Avatar | |
Emoportraits | Avatar kepala satu tembakan multimodal yang ditingkatkan emosi. | Avatar | ||
E3 Gen | Generasi avatar yang efisien, ekspresif, dan dapat diedit. | arxiv | Avatar | |
Exavatar | Exavatar - Avatar Gaussian 3D seluruh tubuh ekspresif. | arxiv | Avatar | |
Geneavatar | Ekspresi Generik-Aware Volumetric Head Avatar Mengedit dari satu gambar. | arxiv | Avatar | |
Geneface ++ | Generasi pembicaraan 3D real-time yang digeneralisasi dan stabil. | Avatar | ||
Halo | Sintesis visual yang digerakkan oleh audio hierarkis untuk animasi gambar potret. | arxiv | Avatar | |
Hallo2 | Hallo2: Animasi gambar potret yang digerakkan oleh audio dan resolusi tinggi. | arxiv | Avatar | |
Headsculpt | Membuat avatar kepala 3D dengan teks. | arxiv | Avatar | |
Intrinsikavatar | Intrinsicavatar: Rendering terbalik secara fisik manusia dinamis dari video monokular melalui penelusuran ray eksplisit. | arxiv | Avatar | |
Linly-Talker | Sistem Percakapan Avatar Digital. | Avatar | ||
LivePortrait | LivePorTrait: Animasi potret yang efisien dengan jahitan dan kontrol ulang. | arxiv | Avatar | |
Motiongpt | Gerakan manusia sebagai bahasa asing, model generasi gerak gerak terpadu menggunakan LLMS. | arxiv | Avatar | |
Musepose | Musepose: Kerangka kerja gambar-ke-video yang digerakkan oleh pose untuk generasi manusia virtual. | Avatar | ||
Musetalk | Sinkronisasi bibir berkualitas tinggi real-time dengan laten space inpainting. | Avatar | ||
Musev | Generasi video manusia virtual manusia yang sangat panjang dan tinggi dengan denoising paralel yang dikondisikan secara visual. | Avatar | ||
Potret4d | Mempelajari sintesis avatar head 4D 4D menggunakan data sintetis. | arxiv | Avatar | |
Siap pemain saya | Integrasikan avatar yang dapat disesuaikan ke dalam game atau aplikasi Anda dalam beberapa hari. | Avatar | ||
Rodinhd | RODINHD: Generasi Avatar 3D Fidelity Tinggi dengan model difusi. | arxiv | Avatar | |
Styleavatar3d | Memanfaatkan model difusi teks-teks untuk generasi avatar 3D kesetiaan tinggi. | arxiv | Avatar | |
Text2Control3d | Generasi avatar 3D yang dapat dikendalikan dalam bidang pancaran saraf menggunakan model difusi teks-ke-gambar yang dipandu geometri. | arxiv | Avatar | |
Topo4d | Topologi memelihara Gaussian percikan untuk penangkapan kepala 4D kesetiaan tinggi. | arxiv | Avatar | |
Unityaiwithchatgpt | Berdasarkan Unity, Chatgpt+Unitychan Voice Interactive Display direalisasikan. | Persatuan | Avatar | |
Vid2avatar | Rekonstruksi Avatar 3D dari video di alam liar melalui dekomposisi adegan yang di-swadaya. | arxiv | Avatar | |
Vlogger | Difusi multimodal untuk sintesis avatar yang diwujudkan. | Avatar | ||
Wild2avatar | Membuat manusia di belakang oklusi. | arxiv | Avatar |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
Menghidupkan siapa pun | Sintesis gambar-ke-video yang konsisten dan dapat dikendalikan untuk animasi karakter. | arxiv | Animasi | |
Animateeansthing | Animasi gambar domain terbuka berbutir halus dengan panduan gerak. | arxiv | Animasi | |
Animasiff | Hidupkan model difusi teks-ke-gambar Anda yang dipersonalisasi tanpa penyetelan spesifik. | arxiv | Animasi | |
Animatelcm | Mari kita mempercepat pembuatan video dalam 4 langkah! | arxiv | Animasi | |
Animate-x | Animate-X: Animasi gambar karakter universal dengan representasi gerak yang ditingkatkan. | arxiv | Animasi | |
Animatezero | Model difusi video adalah animator gambar nol-shot. | arxiv | Animasi | |
Animationgpt | Alat AIGC untuk menghasilkan aset gerak pertempuran game. | Animasi | ||
Deforum | Deforum memanfaatkan difusi yang stabil untuk menghasilkan visual AI yang berkembang. | Animasi | ||
Drawingspinup | DrawingsPinup: Animasi 3D dari gambar karakter tunggal. | arxiv | Animasi | |
Dreamoving | Kerangka kerja pembuatan video manusia berdasarkan model difusi. | arxiv | Animasi | |
Facefusion | Generasi berikutnya Wajah Swapper dan Penambah. | Animasi | ||
FreeInit | Menjembatani kesenjangan inisialisasi dalam model difusi video. | arxiv | Animasi | |
Geneface | Sintesis wajah pembicaraan 3D yang digerakkan oleh audio-generalisasi dan kesetiaan tinggi. | arxiv | Animasi | |
ID-animator | Generasi video manusia yang memelihara identitas zero-shot. | arxiv | Animasi | |
Magicanimate | Animasi gambar manusia yang konsisten sementara menggunakan model difusi. | arxiv | Animasi | |
Nuwa | Dragnuwa adalah model pembuatan video berbasis difusi domain terbuka mengambil kontrol teks, gambar, dan lintasan sebagai input untuk mencapai pembuatan video yang dapat dikendalikan. | arxiv | Animasi | |
Nuwa-Infinity | Nuwa-Infinity adalah model generatif multimodal yang dirancang untuk menghasilkan gambar dan video berkualitas tinggi dari teks, gambar atau input video yang diberikan. | Animasi | ||
Nuwa-xl | Difusi baru atas arsitektur difusi untuk pembuatan video yang sangat panjang. | Animasi | ||
Animasi Omni | AI menghasilkan animasi kesetiaan tinggi. | Animasi | ||
Pia | Animator gambar pribadi Anda melalui modul plug-and-play dalam model teks-ke-gambar. | arxiv | Animasi | |
Sadtalker | Mempelajari koefisien gerak 3D realistis untuk animasi wajah tunggal yang digerakkan oleh audio-driven. | arxiv | Animasi | |
Sadtalker-Video-Lip-Sync | Proyek ini didasarkan pada sadtalkers wav2lip untuk sintesis bibir video. | Animasi | ||
Animasi yang stabil | Alat teks-ke-animasi yang kuat untuk pengembang. | Animasi | ||
Talecrafter | Alat visualisasi cerita interaktif yang mendukung banyak karakter. | arxiv | Animasi | |
Tooncrafter | Tooncrafter: Interpolasi kartun generatif. | arxiv | Animasi | |
Wav2lip | Video sinkronisasi bibir secara akurat di alam liar. | arxiv | Animasi | |
Studio Wonder | Alat AI yang secara otomatis menjiwai, menyalakan, dan menyusun karakter CG ke dalam adegan aksi langsung. | Animasi |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
Cambrian-1 | Cambrian-1: Eksplorasi LLM multimodal yang sepenuhnya terbuka dan berpusat. | arxiv | LLMS multimodal | |
Cogvlm2 | Model multi-modal open-source tingkat GPT4V berdasarkan LLAMA3-8B. | Visual | ||
Cotracker | Lebih baik melacak bersama. | arxiv | Visual | |
EVF-SAM | EVF-SAM: Fusion-Bahasa Awal untuk Segmen Teks Model apa pun. | arxiv | Visual | |
Facehi | Lebih baik melacak bersama. | Visual | ||
Internlm-xComposer2 | Internlm-xComposer2 adalah model visi-bahasa-besar (VLLM) yang unggul dalam komposisi dan pemahaman gambar teks-bentuk gratis. | arxiv | Visual | |
Kanguru | Kanguru: Model bahasa video yang kuat yang mendukung input video konteks panjang. | Visual | ||
LGVI | Menuju inpaining video yang digerakkan oleh bahasa melalui model bahasa multimodal besar. | Visual | ||
Llava ++ | Memperluas kemampuan visual dengan LLAMA-3 dan PHI-3. | Visual | ||
Llava-onevision | Llava-onevision: Transfer tugas visual yang mudah. | arxiv | Visual | |
Longva | Transfer konteks panjang dari bahasa ke visi. | arxiv | Visual | |
Maskvit | Pra-pelatihan visual bertopeng untuk prediksi video. | arxiv | Visual | |
Minicpm-llama3-v 2.5 | MLLM level GPT-4V di ponsel Anda. | Visual | ||
Moe-llava | Campuran para ahli untuk model bahasa penglihatan yang besar. | arxiv | Visual | |
Motionllm | Memahami perilaku manusia dari gerakan dan video manusia. | arxiv | Visual | |
Pllava | Ekstensi LLAVA bebas parameter dari gambar ke video untuk captioning video padat. | arxiv | Visual | |
Qwen-vl | Model bahasa penglihatan serbaguna untuk pemahaman, lokalisasi, membaca teks, dan seterusnya. | arxiv | Visual | |
Sapiens | Sapiens: Foundation for Human Vision Models. | arxiv | Visual | |
Sharegpt4v | Meningkatkan model multi-modal besar dengan keterangan yang lebih baik. | arxiv | Visual | |
SOLO | Solo: Transformator tunggal untuk pemodelan bahasa penglihatan yang dapat diskalakan. | arxiv | Visual | |
Video-CCAM | Video-CCAM: Memajukan pemahaman bahasa video dengan topeng lintas-perhatian kausal. | Visual | ||
Video -lava | Belajar representasi visual bersatu dengan penyelarasan sebelum proyeksi. | arxiv | Visual | |
Videollama 2 | Memajukan pemodelan spasial-temporal dan pemahaman audio dalam LLM video. | arxiv | Visual | |
Video-mme | Tolok ukur evaluasi komprehensif pertama yang pernah ada dari LLM multi-modal dalam analisis video. | arxiv | Visual | |
Vitron | LLM Visi Pixel-Level Terpadu untuk memahami, menghasilkan, segmentasi, mengedit. | Visual | ||
Vila | VILA: Pada pra-pelatihan untuk model bahasa visual. | arxiv | Visual |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
360DVD | Generasi video Panorama yang dapat dikendalikan dengan model difusi video 360 derajat. | arxiv | Video | |
Animate-a-story | Generasi video pengambilan-pengambilan untuk menceritakan sebuah kisah. | arxiv | Video | |
Apapun di adegan apa pun | Penyisipan Objek Video Photorealistik. | Video | ||
Seni • v | Generasi teks-ke-video regresif auto-regresif dengan model difusi. | arxiv | Video | |
Bantu | Temui platform video generatif yang menghidupkan ide -ide Anda. | Video | ||
Atomovideo | Generasi gambar-ke-video yang tinggi. | arxiv | Video | |
Latar belakangremover | Latar belakang penghapus memungkinkan Anda menghapus latar belakang dari gambar dan video menggunakan AI dengan antarmuka baris perintah sederhana yang gratis dan open source. | Video | ||
Boximator | Menghasilkan gerakan yang kaya dan terkendali untuk sintesis video. | arxiv | Video | |
Codef | Bidang deformasi konten untuk pemrosesan video yang konsisten sementara. | arxiv | Video | |
Cogvideo | Hasilkan video dari deskripsi teks. | Video | ||
Cogvideox | Cogvideox adalah versi open-source dari model generasi video, yang homolog dengan 清影. | Video | ||
COGVLM | COGVLM adalah model bahasa visual open-source yang kuat (VLM). | Visual | ||
Conr | Genarate Vivid menari video dari lembar karakter anime yang digambar tangan (ACS). | arxiv | Video | |
Decohere | Buat apa yang tidak bisa difilmkan. | Video | ||
Deskripsi | Deskripsi adalah cara yang sederhana, kuat, dan menyenangkan untuk diedit. | Video | ||
Difuton | Toon Shading yang dapat diedit resolusi tinggi melalui model difusi. | arxiv | Video | |
lumba-lumba | Platform interaksi video umum berdasarkan LLMS. | Video | ||
Domoai | Memperkuat kreativitas Anda dengan domoai. | Video | ||
Dreamcinema | DreamCinema: Transfer sinematik dengan kamera gratis dan karakter 3D. | arxiv | Video | |
Dynamicrafter | Menjiwai gambar domain terbuka dengan prior difusi video. | arxiv | Video | |
TEPIAN | Kami memperkenalkan Edge, metode yang kuat untuk generasi tari yang dapat diedit yang mampu menciptakan tarian yang realistis, secara fisik-masuk akal sementara tetap setia pada musik input yang sewenang-wenang. | arxiv | Video | |
emosi | Emote Portrait Alive - Menghasilkan video potret ekspresif dengan model difusi audio2Video dalam kondisi lemah. | arxiv | Video | |
Video EMU | Faktorisasi pembuatan teks-ke-video dengan pengkondisian gambar eksplisit. | Video | ||
Etna | ETNA dapat menghasilkan konten video yang sesuai berdasarkan deskripsi teks pendek. | Video | ||
Peri | Sintesis video-ke-video yang dipandu instruksi yang dipandu oleh instruksi. | Video | ||
Ikuti kanvas Anda | Follow-Canvas Anda: Outpaining video resolusi lebih tinggi dengan generasi konten yang luas. | arxiv | Video | |
Ikuti pose Anda | Generasi teks-ke-video berpemandu pose menggunakan video bebas pose. | arxiv | Video | |
Fulljourney | Rangkaian lengkap alat pembuatan AI Anda di ujung jari Anda. | Video | ||
Gen-2 | Sistem AI multi-modal yang dapat menghasilkan video baru dengan teks, gambar, atau klip video. | Video | ||
Dinamika generatif | Dinamika gambar generatif. | Video | ||
Jin | Lingkungan interaktif generatif. | arxiv | Video | |
Genmo | Secara ajaib membuat video dengan AI. | Video | ||
Gentron | Transformer difusi untuk pembuatan gambar dan video. | Video | ||
Higen | Decoupling spatio-temporal hierarkis untuk generasi teks-ke-video. | Video | ||
Hotshot-xl | Hotshot-XL adalah model teks-ke-gif AI yang dilatih untuk bekerja bersama difusi stabil XL. | Video | ||
HUNYUANVideo | HUNYUANVideo: Kerangka kerja sistematis untuk model pembuatan video besar. | arxiv | Video | |
Video Imagen | Diberikan prompt teks, video Imagen menghasilkan video definisi tinggi menggunakan model pembuatan video dasar dan urutan model spasial dan video super-resolusi yang diselingi. | Video | ||
Instruktur | Menginstruksikan model difusi video dengan umpan balik manusia. | arxiv | Video | |
I2vgen-xl | Sintesis gambar-ke-video berkualitas tinggi melalui model difusi bertingkat. | arxiv | Video | |
Lavie | Generasi video berkualitas tinggi dengan model difusi laten bertingkat. | arxiv | Video | |
LTX Studio | LTX Studio adalah platform pembuatan film yang holistik, yang digerakkan oleh AI untuk pencipta, pemasar, pembuat film, dan studio. | Video | ||
LTX-Video | LTX-Video adalah model pembuatan video berbasis DIT pertama yang dapat menghasilkan video berkualitas tinggi secara real-time. Ini dapat menghasilkan 24 video fps pada resolusi 768x512, lebih cepat dari yang diperlukan untuk menontonnya. | Video | ||
Lumiere | Model difusi ruang-waktu untuk pembuatan video. | arxiv | Video | |
LVDM | Model difusi video laten untuk pembuatan video panjang kesetiaan tinggi. | arxiv | Video | |
MagicVideo | Generasi video yang efisien dengan model difusi laten. | arxiv | Video | |
MagicVideo-V2 | Generasi video multi-tahap tinggi. | arxiv | Video | |
Jam ajaib | AI Video untuk pembuatnya dibuat sederhana. | Video | ||
Magvit-V2 | Tokenizer adalah kunci pembuatan visual. | Video | ||
Magvit | Transformator video generatif bertopeng. | Video | ||
Make-a-Video | Make-A-Video adalah sistem AI canggih yang menghasilkan video dari teks. | arxiv | Video | |
Buat piksel menari | Pembuatan video dinamis tinggi. | arxiv | Video | |
Buat-Video-Anda | Pembuatan video yang disesuaikan menggunakan panduan tekstual dan struktural. | arxiv | Video | |
Microcinema | Pendekatan pembagian-dan-penakluk untuk generasi teks-ke-video. | arxiv | Video | |
Mimo | MIMO: Sintesis video karakter yang dapat dikendalikan dengan pemodelan terurai spasial. | arxiv | Video | |
Mini-gemini | Menambang potensi model bahasa visi multi-modalitas. | Penglihatan | ||
MobileVidFactory | Generasi video media sosial berbasis difusi otomatis untuk perangkat seluler dari teks. | Video | ||
Mochi 1 | Mochi 1 adalah model pembuatan video canggih terbuka dengan gerakan kesetiaan tinggi dan kepatuhan yang kuat dalam evaluasi pendahuluan. | Video | ||
Mofa-video | Animasi gambar yang dapat dikendalikan melalui adaptasi bidang gerak generatif dalam model difusi gambar-ke-video beku. | arxiv | Video | |
MoneyPrinterturbo | Gunakan model besar untuk menghasilkan video pendek dengan satu klik. | Video | ||
Moonvalley | Moonvalley adalah model AI generatif teks-ke-video baru. | Video | ||
Mora | Lebih seperti Sora untuk pembuatan video generalis. | arxiv | Video | |
Studio Morph | Dengan sihir AI teks-ke-video kami, memanifestasikan kreativitas Anda melalui prompt Anda. | Video | ||
Motionclone | MotionClone: Kloning gerak bebas pelatihan untuk pembuatan video yang dapat dikendalikan. | arxiv | Video | |
Motionctrl | Pengontrol gerak terpadu dan fleksibel untuk pembuatan video. | arxiv | Video | |
MotionDirector | Kustomisasi gerakan model difusi teks-ke-video. | arxiv | Video | |
Motionshop | Aplikasi mengganti karakter dalam video dengan avatar 3D. | Video | ||
Mov2mov | Plugin MOV2MOV untuk Otomatis11111/Stable-Difusion-WebUi. | Video | ||
Moviefactory | Pembuatan film otomatis dari teks menggunakan model generatif besar untuk bahasa dan gambar. | arxiv | Video | |
Bingkai saraf | Temukan synthesizer untuk dunia visual. | Video | ||
Tidak pernah ada | Buat dunia Anda. | Video | ||
Open-Sora | Mendemokratisasi produksi video yang efisien untuk semua. | Video | ||
Open-Sora | Paket Open-Sora. | Video | ||
Phenaki | Model untuk menghasilkan video dari teks, dengan petunjuk yang dapat berubah dari waktu ke waktu, dan video yang bisa selama beberapa menit. | arxiv | Video | |
Pika Labs | Pika Labs merevolusi pengalaman pembuatan video dengan AI. | Video | ||
Pixeling | Pixeling memberdayakan pelanggan kami untuk membuat konten visual yang sangat tepat, ultra-realistis, dan sangat terkendali termasuk gambar, video, dan model 3D. | Video | ||
Pixverse | Buat video yang menarik dengan AI. | Video | ||
Penyerbukan | Membuat menjadi mudah, cepat, dan menyenangkan. | Video | ||
Gunakan kembali dan menyebar | Denoising iteratif untuk generasi teks-ke-video. | arxiv | Video | |
Ruyi | Ruyi adalah model gambar-ke-video yang mampu menghasilkan video berkualitas sinematik pada resolusi 768, dengan laju bingkai 24 frame per detik, total 5 detik dan 120 frame. | Video | ||
Shortgpt | Kerangka kerja AI eksperimental untuk pembuatan konten pendek/video otomatis. | Video | ||
Tampilkan-1 | Menikah dengan model difusi piksel dan laten untuk generasi teks-ke-video. | arxiv | Video | |
Video Snap | Transformer spatiotemporal yang diskalakan untuk sintesis teks-ke-video. | arxiv | Video | |
Sora | Membuat video dari teks. | Video | ||
Sorawebui | Sorawebui adalah klien web Sora open-source, memungkinkan pengguna untuk dengan mudah membuat video dari teks dengan model Sora OpenAI. | Video | ||
Stablevideo | Pengeditan video difusi konsistensi yang digerakkan oleh teks. | Video | ||
Difusi video yang stabil | Gambar stabil difusi video (SVD) ke video. | Video | ||
StoryDiffusion | Perhatian diri yang konsisten untuk pembuatan gambar dan video jarak jauh. | arxiv | Video | |
Streamingt2v | Generasi video panjang yang konsisten, dinamis, dan dapat diperpanjang dari teks. | arxiv | Video | |
Stylecrafter | NHancing generasi teks-ke-video bergaya dengan adaptor gaya. | arxiv | Video | |
Tats | Generasi video panjang dengan VQGAN waktu-agnostik dan transformator waktu-sensitif. | Video | ||
Text2Video-Zero | Model difusi teks-ke-gambar adalah generator video nol-shot. | arxiv | Video | |
TF-T2V | Resep untuk meningkatkan pembuatan teks-ke-video dengan video bebas teks. | arxiv | Video | |
Tora | Tora: Transformator difusi berorientasi lintasan untuk pembuatan video. | arxiv | Video | |
Trek-apa pun | Lacak-apa pun adalah alat yang fleksibel dan interaktif untuk pelacakan dan segmentasi objek video, berdasarkan segmen apa pun dan XMEM. | arxiv | Video | |
Tune-A-Video | Tuning satu-shot dari model difusi gambar untuk pembuatan teks-ke-video. | arxiv | Video | |
Twelvelabs | AI multimodal yang memahami video seperti manusia. | Video | ||
Univg | Menuju pembuatan video modal terpadu. | Video | ||
Vchitect-2.0 | Vchitect-2.0: Transformator paralel untuk meningkatkan model difusi video. | Video | ||
Vgen | Ekosistem pembuatan video holistik untuk pembuatan video yang dibangun pada model difusi. | arxiv | Video | |
Viewcrafter | ViewCrafter: Model difusi video menjinakkan untuk sintesis novel novel kesetiaan tinggi. | arxiv | Video | |
Video-Chatgpt | Video-Chatgpt adalah model percakapan video yang mampu menghasilkan percakapan yang bermakna tentang video. | arxiv | Video | |
Komposer video | Sintesis video komposisi dengan kemampuan pengendalian gerak. | arxiv | Video | |
Videocrafter1 | Model difusi terbuka untuk pembuatan video berkualitas tinggi. | arxiv | Video | |
Videocrafter2 | Mengatasi keterbatasan data untuk model difusi video berkualitas tinggi. | arxiv | Video | |
Videodrafter | Pembuatan video multi-adegan yang konsisten dengan konten dengan LLM. | arxiv | Video | |
VideoLevator | Meningkatkan kualitas pembuatan video dengan model difusi teks-ke-gambar serbaguna. | arxiv | Video | |
Videofactory | Pertukaran perhatian dalam difusi spatiotemporal untuk generasi teks-ke-video. | Video | ||
Videogen | Pendekatan difusi laten yang dipandu referensi untuk generasi teks-ke-video definisi tinggi. | arxiv | Video | |
VideoLCM | Model konsistensi laten video. | arxiv | Video | |
Video LDMS | Sejajarkan laten Anda: Sintesis video resolusi tinggi dengan model difusi laten. | arxiv | Video | |
Video -lava | Belajar representasi visual bersatu dengan penyelarasan sebelum proyeksi. | arxiv | Video | |
Videomamba | Model ruang status untuk pemahaman video yang efisien. | arxiv | Video | |
Video-of-Thought | Video-of-Thought: Penalaran video langkah demi langkah dari persepsi ke kognisi. | Video | ||
VideoPoet | Model bahasa besar untuk pembuatan video nol-shot. | arxiv | Video | |
Gerakan Vispunk | Buat video realistis hanya menggunakan teks. | Video | ||
VisualRWKV | VisualRWKV adalah versi visual yang ditingkatkan dari model bahasa RWKV, memungkinkan RWKV untuk menangani berbagai tugas visual. | Visual | ||
V-JEPA | Video Joint Embedding Arsitektur Prediktif. | arxiv | Video | |
Walt | Generasi video fotorealistik dengan model difusi. | arxiv | Video | |
Zeroscope | Teks-ke-Video Zeroscope. | Video |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
Academicodec | Model codec audio open source untuk penelitian akademik. | Audio | ||
Amphion | Audio open-source, musik, dan alat pembuatan wicara. | arxiv | Audio | |
Archisound | Generasi audio menggunakan model difusi, di Pytorch. | Audio | ||
Audiobox | Generasi audio terpadu dengan permintaan bahasa alami. | Audio | ||
Audioedit | Pengeditan audio nol-shot tanpa pengawasan dan berbasis teks menggunakan inversi DDPM. | arxiv | Audio | |
Audiogen codec | Kompresi rendah 48kHz stereo saraf codec audio untuk audio umum, mengoptimalkan kesetiaan audio? | Audio | ||
Audiogpt | Memahami dan menghasilkan pidato, musik, suara, dan kepala yang berbicara. | arxiv | Audio | |
Audiolcm | Generasi teks-ke-audio dengan model konsistensi laten. | arxiv | Audio | |
Audioldm | Generasi teks-ke-audio dengan model difusi laten. | arxiv | Audio | |
Audioldm 2 | Mempelajari generasi audio holistik dengan pretraining yang di-swadaya. | arxiv | Audio | |
Auffusion | Memanfaatkan kekuatan difusi dan model bahasa besar untuk generasi teks-ke-audio. | arxiv | Audio | |
Ctag | Generasi Teks-ke-Audio Kreatif melalui Pemrograman Synthesizer. | Audio | ||
Foleycrafter | Foleycrafter: Hidupkan video yang diam dengan suara yang hidup dan disinkronkan. | arxiv | Audio | |
Magnet | Generasi audio bertopeng menggunakan transformator non-otegresif tunggal. | Audio | ||
Make-an-audio | Generasi teks-ke-audio dengan model difusi yang ditingkatkan cepat. | arxiv | Audio | |
Make-an-audio 3 | Mengubah teks menjadi audio melalui transformator difusi besar berbasis aliran. | arxiv | Audio | |
Neuralsound | Sintesis suara modal berbasis pembelajaran dengan transfer akustik. | arxiv | Audio | |
Optimizerai | Suara untuk pencipta, pembuat game, artis, pembuat video. | Audio | ||
Qwen2-audio | Qwen2-Audio Chat & Pretrained Model Bahasa Audio Besar Diusulkan oleh Alibaba Cloud. | arxiv | Audio | |
Lihat-2-sound | Suara lingkungan-ke-spasial zero-shot. | arxiv | Audio | |
Badai soundst | Generasi audio paralel yang efisien. | arxiv | Audio | |
Audio yang stabil | Difusi audio laten yang dikondisikan dengan waktu cepat. | Audio | ||
Audio stabil terbuka | Stabil Audio Open 1.0 menghasilkan audio stereo panjang variabel (hingga 47s) pada 44.1kHz dari permintaan teks. | Audio | ||
Sinkrusi | Syncfusion: Sintesis Foley video-ke-sinkronisasi multimodal. | arxiv | Audio | |
TANGO | Generasi Teks-ke-Audio Menggunakan Instruksi Tuned LLM dan Model Difusi Laten. | Audio | ||
VTA-LDM | Generasi video-ke-audio dengan penyelarasan tersembunyi. | arxiv | Audio | |
Wavjourney | Pembuatan audio komposisi dengan model bahasa besar. | arxiv | Audio |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
AIVA | Kecerdasan buatan menyusun musik soundtrack emosional. | Musik | ||
Musik Amper | Teknologi Generasi Musik Kustom Didukung oleh Amper. | Musik | ||
Boomy | Buat musik generatif. Bagikan dengan dunia. | Musik | ||
ChatMusician | Membina kemampuan musik intrinsik menjadi LLM. | Musik | ||
Chord2melody | AI Generasi Musik Otomatis. | Musik | ||
Diff-bgm | Model difusi untuk generasi musik latar belakang video. | arxiv | Musik | |
Fluksmusik | FluxMusic: Generasi teks-ke-musik dengan transformator aliran yang diperbaiki. | arxiv | Musik | |
GPlableton | Draf skrip untuk memproses respons GPT dan mengirim catatan MIDI ke klip Ableton dengan Abletonosc dan Python-Osc. | Musik | ||
Heymusic.ai | AI Generator Musik | Musik | ||
Gambar ke musik | AI Image to Music Generator adalah alat yang menggunakan kecerdasan buatan untuk mengubah gambar menjadi musik. | Musik | ||
Jen-1 | Generasi musik universal yang dipandu teks dengan model difusi omnidirectional. | Musik | ||
kotak juke | Model generatif untuk musik. | arxiv | Musik | |
ungu | Magenta adalah proyek penelitian yang mengeksplorasi peran pembelajaran mesin dalam proses menciptakan seni dan musik. | Musik | ||
Melodi | Generasi musik saraf yang efisien | Musik | ||
MUBERT | AI Musik Generatif. | Musik | ||
Musenet | Jaringan saraf dalam yang dapat menghasilkan komposisi musik 4 menit dengan 10 instrumen yang berbeda, dan dapat menggabungkan gaya dari negara ke Mozart ke The Beatles. | Musik | ||
Musicgen | Generasi musik yang sederhana dan terkendali. | arxiv | Musik | |
Musicldm | Meningkatkan kebaruan dalam generasi teks-ke-musik menggunakan strategi mixup beat-synchronous. | arxiv | Musik | |
MusikLM | Menghasilkan musik dari teks. | arxiv | Musik | |
Aplikasi Riffusion | Riffusion adalah aplikasi untuk generasi musik real-time dengan difusi yang stabil. | Musik | ||
Sonauto | Sonauto adalah editor musik AI yang mengubah permintaan, lirik, atau melodi menjadi lagu -lagu lengkap dengan gaya apa pun. | Musik | ||
Soundraw | AI Generator Musik untuk Pencipta. | Musik | ||
AI Soundry | Alat AI generatif termasuk paket sampel teks-ke-suara dan tak terbatas. | Musik |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
Diffsinger | Bernyanyi sintesis suara melalui mekanisme difusi dangkal. | arxiv | Suara bernyanyi | |
Pengambilan-voice-voice-conversion-webui | Kerangka kerja SVC yang mudah digunakan berdasarkan VIT. | Suara bernyanyi | ||
So-Vits-SVC | SoftVC Vits menyanyikan konversi suara. | Suara bernyanyi | ||
VI-SVS | Gunakan Vits dan Opencpop untuk mengembangkan sintesis suara bernyanyi; Berbeda dari pengunjung. | Suara bernyanyi |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Kertas | Mesin game | Jenis |
---|---|---|---|---|
Aplikasi | Alat kloning suara tertinggi, dioptimalkan dengan cermat untuk kekuatan yang tak tertandingi, modularitas, dan pengalaman ramah pengguna. | Pidato | ||
Audyo | Teks masuk. Audio out. | Pidato | ||
Kulit pohon | Model audio generatif yang dipicu teks. | Pidato | ||
Bert-Vits2 | Backbone Vits2 dengan Bert multibahasa. | Pidato | ||
Chattts | Chattts adalah model bicara generatif untuk dialog harian. | Pidato | ||
Clapspeech | Mempelajari prosodi dari konteks teks dengan pra-pelatihan bahasa-audio kontras. | arxiv | Pidato | |
Cosyvoice | Model generasi suara besar multi-bahasa, memberikan kesimpulan, pelatihan, dan penerapan kemampuan tumpukan penuh. | Pidato | ||
DEX-TTS | Teks ekspresif berbasis difusi-ke-speech dengan pemodelan gaya pada variabilitas waktu. | arxiv | Pidato | |
Emosional | Mesin TTS multi-suara dan terkontrol cepat. | Pidato | ||
Faliki | Ubah teks menjadi video dengan suara AI. | Pidato | ||
GLM-4-VOICE | GLM-4-Voice adalah model suara ujung ke ujung yang diluncurkan oleh Zhipu AI. GLM-4-VOICE dapat secara langsung memahami dan menghasilkan pidato Cina dan Inggris, terlibat dalam percakapan suara real-time, dan mengubah atribut seperti emosi, intonasi, kecepatan bicara, dan dialek berdasarkan instruksi pengguna. | Pidato | ||
Glow-tts | Aliran generatif untuk teks-ke-speech melalui pencarian penyelarasan monotonik. | arxiv | Pidato | |
GPT-Sovits | Konversi suara beberapa shot yang kuat dan webui teks-ke-ucapan. | Pidato | ||
Lovo | Lovo adalah generator suara & teks ke platform ucapan untuk ribuan pencipta. | Pidato | ||
Mahatts | Model pembuatan bicara yang besar open-source. | Pidato | ||
Matcha-tts | Arsitektur TTS cepat dengan pencocokan aliran bersyarat. | arxiv | Pidato | |
Melotts | Perpustakaan multi-bahasa multi-bahasa berkualitas tinggi oleh myshell.ai. Mendukung bahasa Inggris, Spanyol, Prancis, Cina, Jepang, dan Korea. | Pidato | ||
Metavoice-1b | AI untuk kecerdasan pidato tingkat manusia. | Pidato | ||
NARAKEET | Mudah membuat sulih suara menggunakan teks realistis untuk berbicara. | Pidato | ||
Mini-Omni | Mini-Omni: Model bahasa dapat mendengar, berbicara sambil berpikir dalam streaming. Mini-Omni adalah model bahasa multimodel open-source yang dapat mendengar, berbicara sambil berpikir. Menampilkan input ucapan end-to-end waktu nyata dan streaming kemampuan percakapan output audio. | arxiv | Pidato | |
Cloning One-Shot-Voice | Satu basis suara kloning suara di UNET-TTS. | Pidato | ||
OpenVoice | Suara instan kloning oleh myshell. | Pidato | ||
Meluap | Menempatkan aliran di atas transduser saraf untuk TT yang lebih baik. | Pidato | ||
Realtimetts | Realtimetts adalah perpustakaan teks-ke-speech (TTS) yang dirancang untuk aplikasi real-time. | Pidato | ||
Sensevoice | Sensevoice adalah model fondasi wicara dengan kemampuan pemahaman ucapan berganda, termasuk pengenalan wicara otomatis (ASR), identifikasi bahasa lisan (LID), pengenalan ucapan emosi (SER), dan deteksi acara audio (AED). | Pidato | ||
Pidato | Memberdayakan model bahasa besar dengan kemampuan percakapan lintas modal intrinsik. | arxiv | Pidato | |
Pidato-ke-Text-GPT3-Unity | Ini adalah repo yang saya gunakan Whisper dan chatgpt API dari Openai in Unity. | Persatuan | Pidato | |
Pidato yang stabil | Stabilitas model teks-ke-speech AI. | Pidato | ||
Stabletts | Model TTS generasi berikutnya menggunakan pencocokan aliran dan DIT, terinspirasi oleh difusi stabil 3. | Pidato | ||
Styletts 2 | Menuju teks-ke-pidato tingkat manusia melalui difusi gaya dan pelatihan permusuhan dengan model bahasa ucapan besar. | arxiv | Pidato | |
Tortoise.cpp | Tortoise.cpp: Implementasi GGML dari TTS-TTS. | Pidato | ||
Kura-kura-tts | Sistem TTS multi-suara yang dilatih dengan penekanan pada kualitas. | Pidato | ||
TTS Generation WebUI | TTS Generation WebUI (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs). | Pidato | ||
Vall-e | Model bahasa codec saraf adalah teks nol-shot untuk synthesizer ucapan. | arxiv | Pidato | |
Vall-e x | Bicara Bahasa Asing dengan Suara Anda Sendiri: Pemodelan Bahasa Cross-Lingual Neural Codec | arxiv | Pidato | |
Vokode | Vocode adalah perpustakaan open-source untuk membangun aplikasi LLM berbasis suara. | Pidato | ||
Kotak suara | Generasi ucapan universal multibahasa yang dipandu teks pada skala. | arxiv | Pidato | |
Voicecraft | Pengeditan pidato zero-shot dan teks-ke-pidato di alam liar. | Pidato | ||
Berbisik | Whisper adalah model pengenalan ucapan tujuan umum. | Pidato | ||
Whisperspeech | Sistem teks-ke-ucapan sumber terbuka yang dibangun dengan membalikkan bisikan. | Pidato | ||
Xe-speech | Kerangka kerja pelatihan bersama dari teks-ke-ucapan dan konversi suara non-autoregressive. | Pidato | ||
Xtts | XTTS adalah perpustakaan untuk pembuatan teks-ke-unggun tingkat lanjut. | Pidato | ||
Anda | Menuju TTS multi-speaker zero-shot dan konversi suara nol-shot untuk semua orang. | arxiv | Pidato | |
ZMM-TTS | Sintesis ucapan multibahasa dan multipeaker zero-shot dikondisikan pada representasi ucapan diskrit yang di-swadaya. | arxiv | Pidato |
^ Kembali ke Daftar Isi ^
Sumber | Keterangan | Mesin game | Jenis |
---|---|---|---|
Ludo.ai | Asisten untuk Penelitian dan Desain Game. | Analisis |
^ Kembali ke Daftar Isi ^