Unduh ai game devtools - unduh kode sumber ai game devtools

ai game devtools

Kode Sumber AI

1.0.0

Unduh

Alat Pengembang Game AI (AI-GDT)?

AI-Game

Di sini kami akan melacak Alat Pengembangan Game AI terbaru, termasuk LLM, Agen, Kode, Penulis, Gambar, Tekstur, Shader, Model 3D, Animasi, Video, Audio, Musik, Suara Bernyanyi, dan Analisis.

Daftar isi

Alat (AI LLM)
Permainan (Agen)
Kode
Penulis
Gambar
Tekstur
peneduh
Model 3D
Avatar
Animasi
Visual
Video
Audio
Musik
Suara Bernyanyi
Pidato
Analisis

Daftar Proyek

Alat (AI LLM)

Sumber	Keterangan	Kertas	Mesin Permainan	Jenis
AgenGPT	? Rakit, konfigurasikan, dan terapkan Agen AI otonom di browser Anda.			Alat
Perintah AI	Integrasi ChatGPT dengan Unity Editor.		Persatuan	Alat
AIOS	Sistem Operasi Agen LLM.			Alat
Ilmuwan AI	Ilmuwan AI: Menuju Penemuan Ilmiah Terbuka yang Sepenuhnya Otomatis.	arXiv		Alat
Asisten CLI	Alat CLI yang nyaman untuk menggunakan layanan ChatGPT			Alat
GPT Otomatis	Upaya sumber terbuka eksperimental untuk membuat GPT-4 sepenuhnya otonom.			Alat
sayangAGI	Skrip Python ini adalah contoh sistem manajemen tugas yang didukung AI.			Alat
?? BabyAGI UI	BabyAGI UI dirancang untuk memudahkan dijalankan dan dikembangkan dengan babyagi di aplikasi web, seperti ChatGPT.			Alat
baichuan-7B	Model bahasa pra-pelatihan 7B skala besar yang dikembangkan oleh Baichuan.			Alat
Baichuan-13B	Model bahasa besar 13B yang dikembangkan oleh Baichuan Intelligent Technology.			Alat
Baichuan 2	Serangkaian model bahasa besar yang dikembangkan oleh Baichuan Intelligent Technology.			Alat
Bisheng	Bisheng adalah platform pengembang LLM terbuka untuk aplikasi AI generasi berikutnya.			Alat
Karakter-LLM	Agen yang Dapat Dilatih untuk Bermain Peran.	arXiv		Alat
Pengembang Obrolan	Agen Komunikatif untuk Pengembangan Perangkat Lunak.	arXiv		Alat
ChatGPT-API-unity	Mengikat API penyelesaian obrolan ChatGPT ke C# murni di Unity.		Persatuan	Alat
ObrolanGPTForUnity	ChatGPT untuk persatuan.		Persatuan	Alat
ObrolanRWKV	ChatRWKV seperti ChatGPT tetapi didukung oleh model bahasa RWKV (100% RNN), dan sumber terbuka.			Alat
ObrolanYuan	Model Bahasa Besar untuk Dialog dalam Bahasa Cina dan Inggris.			Alat
Cina-LLaMA-Alpaca-3	(Llama-3 LLM Cina) dikembangkan dari Meta Llama 3.			Alat
Chrome-GPT	Agen AutoGPT yang mengontrol Chrome di desktop Anda.			Alat
roda gigiVLM	CogVLM, model dasar bahasa visual sumber terbuka yang kuat.	arXiv		Alat
CoreNet	Perpustakaan untuk melatih jaringan saraf dalam.			Alat
Kosmos	Cosmos adalah platform pengembangan model dunia yang terdiri dari model dasar dunia, tokenizer, dan jalur pemrosesan video untuk mempercepat pengembangan AI Fisik di laboratorium Robotika & AV.			LLM
DBRX	DBRX adalah model bahasa besar yang dilatih oleh Databricks.			Alat
DCLM	DataComp untuk Model Bahasa.	arXiv		Alat
DeepSeek-V3	DeepSeek-V3 adalah model bahasa Mixture-of-Experts (MoE) yang kuat dengan total 671 miliar parameter dengan 37 miliar diaktifkan untuk setiap token.	arXiv		LLM
DemoGPT	Generator Aplikasi Auto Gen-AI dengan Kekuatan Llama 2			Alat
Kode Desain2	Mengotomatiskan Rekayasa Front-End			Alat
Devika	Devika adalah Insinyur Perangkat Lunak AI Agen.			Alat
Devon	Pemrogram pasangan sumber terbuka.			Alat
Dora	Menghasilkan situs web yang kuat, satu demi satu.			Alat
mengalir	Seret & lepas UI untuk membangun aliran LLM khusus Anda menggunakan LangchainJS.			Alat
Gemini	Gemini dibangun dari awal untuk multimodalitas — berpikir dengan mulus dalam teks, gambar, video, audio, dan kode.			Alat
permata	Gemma adalah rangkaian model terbuka yang ringan dan canggih yang dibuat berdasarkan penelitian dan teknologi yang digunakan untuk membuat model Google Gemini.			Alat
gemma.cpp	mesin inferensi C++ yang ringan dan mandiri untuk model Gemma Google.			Alat
GLM-4	GLM-4-9B adalah versi sumber terbuka dari model terlatih generasi terbaru dalam seri GLM-4 yang diluncurkan oleh Zhipu AI.			Alat
GPT4Semua	Chatbot dilatih tentang kumpulan besar data asisten yang bersih termasuk kode, cerita, dan dialog.			Alat
GPT-4o	GPT-4o (“o” untuk “omni”) adalah langkah menuju interaksi manusia-komputer yang jauh lebih alami— ia menerima kombinasi teks, audio, gambar, dan video apa pun sebagai masukan, serta menghasilkan kombinasi teks, audio, dan gambar apa pun keluaran.			Alat
Skrip GPT	Kembangkan Aplikasi LLM dalam Bahasa Alami.			Alat
Grok-1	Bobot dan arsitektur model Mixture-of-Experts kami yang memiliki 314 miliar parameter, Grok-1.			Alat
MemelukObrolan	Menjadikan model obrolan AI terbaik komunitas tersedia bagi semua orang.			Alat
Integrasi Persatuan API Wajah Memeluk	Paket Unity ini menyediakan integrasi yang mudah digunakan untuk Hugging Face Inference API, memungkinkan pengembang mengakses dan menggunakan model Hugging Face AI dalam proyek Unity mereka.		Persatuan	Alat
Ikatan Gambar	ImageBind Satu Ruang Penyematan untuk Mengikat Semuanya.	arXiv		Alat
Indeks-1.9B	LLM multibahasa ringan SOTA.			Alat
InteractML-Unity	InteractML, kerangka kerja Visual Scripting Pembelajaran Mesin Interaktif untuk Unity3D.		Persatuan	Alat
InteractML-Mesin Unreal	Menghadirkan Pembelajaran Mesin ke Unreal Engine.		Mesin Tidak Nyata	Alat
MagangLM	InternLM memiliki model dasar 7 miliar parameter bersumber terbuka, model obrolan yang disesuaikan untuk skenario praktis dan sistem pelatihan.	arXiv		Alat
MagangLM-XComposer	InternLM-XComposer2 adalah model besar bahasa visi (VLLM) inovatif yang unggul dalam komposisi dan pemahaman teks-gambar bentuk bebas.	arXiv		Alat
Januari	Hadirkan AI ke Desktop Anda.			Alat
Lamini	Lamini memungkinkan tim teknik mana pun untuk mengungguli LLM tujuan umum melalui RLHF dan menyempurnakan data mereka sendiri.			Alat
LaMini-LM	LaMini-LM adalah kumpulan model bahasa berukuran kecil dan efisien yang disaring dari ChatGPT dan dilatih pada kumpulan data berskala besar yang berisi 2,58 juta instruksi.			Alat
LangChain	LangChain adalah kerangka kerja untuk mengembangkan aplikasi yang didukung oleh model bahasa.			Alat
LangFlow	⛓️ LangFlow adalah UI untuk LangChain, dirancang dengan aliran reaksi untuk menyediakan cara yang mudah untuk bereksperimen dan membuat prototipe aliran.			Alat
LaVague	Otomatiskan otomatisasi dengan kerangka Model Tindakan Besar.			Alat
Kubung	Model Landasan Terbuka untuk Agen Bahasa.			Alat
Lepton AI	Kerangka kerja Pythonic untuk menyederhanakan pembangunan layanan AI.			Alat
Lit-LLaMA	Implementasi model bahasa LLaMA berbasis nanoGPT. Mendukung perhatian flash, kuantisasi Int8 dan GPTQ 4bit, penyempurnaan Adaptor LoRA dan LLaMA, pra-pelatihan.			Alat
llama2-webui	Jalankan Llama 2 secara lokal dengan gradio UI pada GPU atau CPU dari mana saja (Linux/Windows/Mac).			Alat
Lama 3	Situs resmi Meta Llama 3 GitHub.			Alat
Lama 3.1	Llama adalah model bahasa besar terbuka (LLM) yang mudah diakses dan dirancang bagi pengembang, peneliti, dan bisnis untuk membangun, bereksperimen, dan secara bertanggung jawab menskalakan ide AI generatif mereka.			Alat
LLaSM	Model Bahasa dan Ucapan Besar.			Alat
Mesin Penjawab LLM	Bangun Mesin Penjawab yang Terinspirasi Kebingungan Menggunakan Next.js, Groq, Mixtral, Langchain, OpenAI, Brave & Serper.			Alat
llm.c	Pelatihan LLM dalam C/CUDA mentah yang sederhana.			Alat
LLPersatuan	Buat karakter di Unity dengan LLM!		Persatuan	Alat
Pencarian Lokal	LLocalSearch adalah mesin pencari yang sepenuhnya berjalan secara lokal menggunakan Agen LLM.			Alat
Pemecah LogicGames	Alat Python untuk menyelesaikan permainan logika dengan AI, Deep Learning, dan Computer Vision.			Alat
Penulis Panjang	LongWriter: Melepaskan 10.000+ Pembuatan Kata Dari LLM Konteks Panjang.	arXiv		Alat
Model Dunia Besar (LWM)	Large World Model (LWM) adalah model autoregresif multimodal konteks besar untuk tujuan umum.	arXiv		Alat
Lumina-T2X	Lumina-T2X adalah kerangka kerja terpadu untuk Pembuatan Modalitas Teks ke Apa Pun.	arXiv		Alat
MetaGPT	Kerangka Multi-Agen			Alat
BPS Mini-2B	LLM sisi akhir mengungguli Llama2-13B.			Alat
MiniGPT-4	Meningkatkan Pemahaman Bahasa Visi dengan Model Bahasa Besar Tingkat Lanjut.	arXiv		Alat
MiniGPT-5	Generasi Visi-dan-Bahasa yang Disisipkan melalui Voken Generatif.	arXiv		Alat
Campuran 8x7B	Campuran Pakar Jarang yang berkualitas tinggi.	arXiv		Alat
Mistral 7B	Model 7B terbaik saat ini, Apache 2.0.			Alat
Mistral Besar	Mistral Large adalah model pembuatan teks mutakhir yang baru. Ini mencapai kemampuan penalaran tingkat atas.			Alat
MLC LLM	Memungkinkan semua orang untuk mengembangkan, mengoptimalkan, dan menerapkan model AI secara native di perangkat semua orang.			Alat
MobilLlama	Menuju GPT Transparan Sepenuhnya Akurat dan Ringan.	arXiv		Alat
MoE-LLaVA	Campuran Pakar untuk Model Bahasa Penglihatan Besar.	arXiv		Alat
Moshi	Moshi adalah AI percakapan eksperimental.			Alat
Moshi	Moshi: model dasar teks pidato untuk dialog waktu nyata.			Alat
LUMUT	Model bahasa percakapan yang dilengkapi alat sumber terbuka dari Universitas Fudan.			Alat
mPLUG-Burung Hantu?	Modularisasi Memberdayakan Model Bahasa Besar dengan Multimodalitas.	arXiv		Alat
Nemotron-4	Model bahasa multibahasa besar dengan 15 miliar parameter dilatih pada 8 triliun token teks.	arXiv		Alat
BERIKUTNYA-GPT	Model Bahasa Besar Multimodal Apa Pun.			Alat
OLMo	Model Bahasa Terbuka	arXiv		Alat
OmniLMM	Model multi-modal besar untuk kinerja kuat dan penerapan efisien.			Alat
SatuLLM	Satu Kerangka untuk Menyelaraskan Semua Modalitas dengan Bahasa.	arXiv		Alat
Asisten Terbuka	OpenAssistant adalah asisten berbasis obrolan yang memahami tugas, dapat berinteraksi dengan sistem pihak ketiga, dan mengambil informasi secara dinamis untuk melakukannya.			Alat
BukaDevin	Seorang insinyur perangkat lunak AI yang otonom.			Alat
Orion-14B	Orion-14B adalah rangkaian model yang mencakup fondasi 14B LLM, dan serangkaian model.	arXiv		Alat
Panda	Model bahasa besar sumber terbuka Tiongkok Luar Negeri, berdasarkan Llama-7B, -13B, -33B, -65B untuk pra-pelatihan berkelanjutan di bidang Tiongkok.			Alat
Bingung	Mesin pencari bertenaga AI.			Alat
pi	Chatbot AI dirancang untuk bantuan pribadi dan dukungan emosional.			Alat
Qwen1.5	Qwen1.5 adalah versi perbaikan dari Qwen.			Alat
Qwen2	Qwen2 adalah seri model bahasa besar yang dikembangkan oleh tim Qwen, Alibaba Cloud.			Alat
Qwen-7B	Repo resmi obrolan Qwen-7B (通义千问-7B) & model bahasa besar terlatih yang diusulkan oleh Alibaba Cloud.			Alat
Agen Repo	RepoAgent adalah proyek Sumber Terbuka yang didorong oleh Model Bahasa Besar (LLM) yang bertujuan untuk menyediakan cara cerdas untuk mendokumentasikan proyek.	arXiv		Alat
Mesin AI Sanitas	Mesin Sanity AI untuk Alat Pengembangan Game Unity.		Persatuan	Alat
PencarianGPT	? Menghubungkan ChatGPT dengan Internet			Alat
BagikanGPT4V	Meningkatkan Model Multi-Modal Besar dengan Teks yang Lebih Baik.			Alat
pekerjaan langit	Model seri Skywork telah dilatih sebelumnya pada data multibahasa dan kode berkualitas tinggi sebesar 3,2 TB (terutama bahasa Mandarin dan Inggris).			Alat
StabilLM	Model Bahasa AI Stabilitas.	arXiv		Alat
Stanford Alpaka	Model LLaMA yang mengikuti Instruksi.			Alat
UI web pembuatan teks	UI web gradio untuk menjalankan Model Bahasa Besar seperti LLaMA, llama.cpp, GPT-J, OPT, dan GAACTICA.			Alat
Mesin Obrolan Kecil	Perpustakaan Inferensi LLM Pada Perangkat.			Alat
Bangku Alat	Platform terbuka untuk melatih, menyajikan, dan mengevaluasi model bahasa besar untuk pembelajaran alat.			Alat
Obrolan PersatuanGPT	Eksperimen Persatuan ChatGPT.		Persatuan	Alat
Integrasi Persatuan OpenAI-API	Integrasikan model bahasa openai GPT-3 dan API ChatGPT ke dalam proyek Unity.		Persatuan	Alat
Mesin Unreal 5 Llama LoRA	Sebuah proyek pembuktian konsep yang menunjukkan potensi penggunaan LLM kecil yang dapat dilatih secara lokal untuk menciptakan alat dokumentasi generasi berikutnya.		Mesin Tidak Nyata	Alat
GPT yang tidak nyata	Kumpulan widget Utilitas Editor Unreal Engine 5 yang didukung oleh GPT3/4.		Mesin Tidak Nyata	Alat
Video-LLaVA	Mempelajari Representasi Visual Bersatu dengan Penyelarasan Sebelum Proyeksi.	arXiv		Alat
WebGPT	Jalankan model GPT di browser dengan WebGPU.			Alat
Web3-GPT	Terapkan kontrak pintar dengan AI			Alat
KataGPT	? Hadirkan kekuatan ChatGPT ke Microsoft Word			Alat
Agen X	Agen LLM Otonom untuk Pemecahan Tugas Kompleks.			Alat
Yi	Serangkaian model bahasa besar yang dilatih dari awal oleh pengembang.			Alat
01 Proyek	Komputer model bahasa sumber terbuka.			Alat

^ Kembali ke Daftar Isi ^

Permainan (Agen)

Sumber	Keterangan	Kertas	Jenis
AgenBench	Tolok Ukur Komprehensif untuk Mengevaluasi LLM sebagai Agen.	arXiv	Agen
Obrolan Grup Agen	Simulacra Obrolan Grup Interaktif Untuk Memunculkan Perilaku Kolektif yang Muncul dengan Lebih Baik.	arXiv	Agen
Agen K	AGI autoagentik yang berkembang sendiri dan modular.		Agen
Lingkup Agen	Mulailah membangun aplikasi multi-agen yang didukung LLM dengan cara yang lebih mudah.	arXiv	Agen
AgenSims	Sandbox Sumber Terbuka untuk Evaluasi Model Bahasa Besar.		Agen
Kota AI	AI Town adalah kota virtual tempat karakter AI tinggal, mengobrol, dan bersosialisasi.		Agen
anime.gf	Alternatif Lokal & Sumber Terbuka untuk CharacterAI.		Permainan
Astrocade	Buat game dengan AI		Permainan
Agen Atom	Kerangka kerja Agen Atom dirancang agar bersifat modular, dapat diperluas, dan mudah digunakan.		Agen
Agen Otomatis	Kerangka Kerja untuk Pembuatan Agen Otomatis.		Agen
Generasi Otomatis	Aktifkan Aplikasi Model Bahasa Besar Generasi Berikutnya.	arXiv	Agen
berperilaku	Behaviorac adalah kerangka pengembangan AI game.		Kerangka
Bioma	Bioma adalah MMORPG kotak pasir sumber terbuka yang dibuat untuk web menggunakan teknologi web seperti Next.js, TypeScript, React, dan WebAssembly.		Permainan
Penyangga Pikiran	Penalaran yang Ditambah Pikiran dengan Model Bahasa Besar.	arXiv	Agen
Agen Byzer	Kerangka kerja agen yang mudah, cepat, dan terdistribusi untuk semua orang.		Agen
Kota Kucing	Simulasi bertenaga AC(h)atGPT dengan kucing.		Agen
Kota Kucing	Simulasi bertenaga AC(h)atGPT dengan kucing.		Agen
KarakterGLM	Menyesuaikan Karakter AI Percakapan Bahasa Mandarin dengan Model Bahasa Besar.	arXiv	Agen
Pengembang Obrolan	Agen Komunikatif untuk Pengembangan Perangkat Lunak.	arXiv	Agen
Agen Cog	CogAgent adalah model bahasa visual sumber terbuka yang ditingkatkan berdasarkan CogVLM.	arXiv	Agen
Buaian	Menuju Pengendalian Komputer Secara Umum.		Agen
kruAI	Kerangka kerja untuk mengatur agen AI otonom yang bermain peran.		Agen
Difikasi	Dify adalah platform pembuatan aplikasi LLM sumber terbuka.		Agen
Proyek Kehidupan Digital	Karakter 3D Otonom dengan Kecerdasan Sosial.	arXiv	Agen
semuanya-ai	Asisten chatbot lokal Anda yang sepenuhnya mahir, didukung AI, dan lokal?.		Agen
kain	fabric adalah kerangka kerja sumber terbuka untuk meningkatkan kemampuan manusia menggunakan AI.		Agen
GPT cepat	FastGPT adalah platform berbasis pengetahuan yang dibangun di LLM.		Agen
cepatRAG	Kerangka Augmentasi dan Pembuatan Pengambilan yang Efisien.		Agen
GameAISDK	Kerangka kerja otomatisasi AI game berbasis gambar.		Kerangka
GameNGen	Model Difusi Adalah Mesin Game Real-Time.	arXiv	Permainan
GameGen-O	GameGen-O: Generasi Video Game Dunia Terbuka.		Permainan
Agen Gen	GenAgent: Membangun Sistem AI Kolaboratif dengan Pembuatan Alur Kerja Otomatis - Studi Kasus di ComfyUI.	arXiv	Agen
Agen Generatif	Simulacra Interaktif Perilaku Manusia.	arXiv	Agen
Asal	Genesis: Mesin Fisika Generatif dan Universal untuk Robotika dan Selebihnya.		Permainan
Jin	Lingkungan Interaktif Generatif.		Permainan
gigax	Runtime, NPC bertenaga LLM.		Permainan
HippoRAG	Memori Jangka Panjang yang Terinspirasi Secara Neurobiologis untuk Model Bahasa Besar.	arXiv	Agen
NPC Bertenaga LLM Interaktif	NPC Bertenaga LLM Interaktif, adalah proyek sumber terbuka yang sepenuhnya mengubah interaksi Anda dengan karakter non-pemain (NPC) di game apa pun!		Permainan
IoA	Kerangka kerja sumber terbuka untuk agen AI kolaboratif, memungkinkan agen yang beragam dan terdistribusi untuk bekerja sama dan menangani tugas-tugas kompleks melalui konektivitas seperti internet.		Agen
Agen Kwai	Sistem agen pencari informasi umum dengan Model Bahasa Besar (LLM).	arXiv	Agen
LangChain	Dapatkan aplikasi LLM Anda dari prototipe hingga produksi.		Agen
aliran Lang	Langflow adalah UI untuk LangChain, dirancang dengan aliran reaksi untuk menyediakan cara yang mudah untuk bereksperimen dan membuat prototipe aliran.		Agen
LangGraph Studio	LangGraph Studio menawarkan cara baru untuk mengembangkan aplikasi LLM dengan menyediakan IDE agen khusus yang memungkinkan visualisasi, interaksi, dan debugging aplikasi agen yang kompleks.		Agen
LARP	Permainan Peran Agen Bahasa untuk game dunia terbuka.	arXiv	Agen
Sistem Agen LLama	Komponen agen dari Llama Stack API.		Agen
Indeks Llama	LlamaIndex adalah kerangka data untuk aplikasi LLM Anda.		Agen
Pencarian Pikiran	? Kerangka Kerja Multi-agen Mesin Pencari Web berbasis LLM (seperti Perplexity.ai Pro dan SearchGPT).		Agen
Campuran Agen (MoA)	Campuran Agen Meningkatkan Kemampuan Model Bahasa Besar.	arXiv	Agen
Peran MMR	MMRole: Kerangka Komprehensif untuk Mengembangkan dan Mengevaluasi Agen Role-Playing Multimodal.	arXiv	Agen
Moonlander.ai	Mulailah membuat game 3D tanpa coding apa pun menggunakan AI generatif.		Kerangka
Difusi Mug	Difusi MuG adalah AI pembuatan bagan untuk permainan ritme berdasarkan Difusi Stabil (salah satu model AIGC paling kuat) dengan modifikasi besar untuk menggabungkan gelombang audio.		Permainan
Oasis	Oasis adalah model dunia interaktif yang dikembangkan oleh Desart dan Etched. Berdasarkan transformator difusi, Oasis menerima input keyboard pengguna dan menghasilkan gameplay secara autoregresif.		Permainan
Agen Om	Kerangka kerja agen multimodal untuk menyelesaikan tugas-tugas kompleks.		Agen
Agen Terbuka	Platform Terbuka untuk Agen Bahasa di Alam Liar.		Agen
Karya	Aplikasi AI yang mengubah teks menjadi video game.		Permainan
kucing pipa	Kerangka kerja Sumber Terbuka untuk AI percakapan suara dan multimodal.		Agen
Agen Qwen	Qwen-Agent adalah kerangka kerja untuk mengembangkan aplikasi LLM berdasarkan instruksi berikut, penggunaan alat, perencanaan, dan kemampuan memori Qwen.		Agen
Raga	Ragas adalah kerangka kerja yang membantu Anda mengevaluasi alur Retrieval Augmented Generation (RAG).		Agen
RPBench-Otomatis	Saluran otomatis untuk mengevaluasi LLM untuk permainan peran.		Permainan
SIMA	Agen AI generalis untuk lingkungan virtual 3D.		Agen
StoryGames.ai	AI untuk Pemimpi Membuat Game.		Permainan
Agen SWE	Antarmuka Komputer Agen Mengaktifkan Model Bahasa Rekayasa Perangkat Lunak.	arXiv	Agen
Gen Tugas	Kerangka kerja agen berbasis tugas yang dibangun berdasarkan keluaran StrictJSON oleh agen LLM.		Agen
SEPULUH Agen	TEN Agent adalah agen multimoda real-time pertama di dunia yang terintegrasi dengan OpenAI Realtime API, RTC, dan dilengkapi fitur pemeriksaan cuaca, pencarian web, penglihatan, dan kemampuan RAG.		Agen
Agen Terjemahan	Terjemahan agen menggunakan alur kerja refleksi.		Agen
Twitter	Twitter Personality adalah aplikasi web yang menganalisis akun Twitter Anda untuk membuat profil kepribadian yang dipersonalisasi menggunakan Agen AI Wordware.		Agen
Tak terbatas	Tak Terbatas: Game Simulasi Kehidupan Karakter Generatif Tak Terbatas.	arXiv	Permainan
Video2Game	Lingkungan Real-time, Interaktif, Realistis, dan Kompatibel dengan Browser dari Satu Video.	arXiv	Permainan
V-IRL	Mendasarkan Kecerdasan Virtual dalam Kehidupan Nyata.	arXiv	Agen
Agen Desain Web	Agen yang digunakan untuk desain web.		Agen
Agen X	Agen LLM Otonom untuk Pemecahan Tugas Kompleks.		Agen

^ Kembali ke Daftar Isi ^

Kode

Sumber	Keterangan	Kertas	Mesin Permainan	Jenis
Penerjemah Kode AI	Gunakan AI untuk menerjemahkan kode dari satu bahasa ke bahasa lain.			Kode
aiXcoder-7B	Model Bahasa Besar Kode aiXcoder-7B.			Kode
kesalahan	bloop adalah mesin pencari kode cepat yang ditulis dalam Rust.			Kode
Bab	Penerjemah Kode ChatGPT di Notebook Jupyter.			Kode
KodeGeeX	Model Pembuatan Kode Multibahasa Terbuka.	arXiv		Kode
KodeGeeX2	Model Pembuatan Kode Multibahasa yang Lebih Kuat.			Kode
KodeGeeX4	CodeGeeX4: Model Pembuatan Kode Multibahasa Terbuka.			Kode
KodeGen	CodeGen adalah model sumber terbuka untuk sintesis program. Dilatih pada TPU-v4. Kompetitif dengan OpenAI Codex.	arXiv		Kode
KodeGen2	Model CodeGen2 untuk sintesis program.	arXiv		Kode
Kode Llama	Code Llama adalah model bahasa besar untuk kode berdasarkan Llama 2.			Kode
KodeTF	Perpustakaan Transformer terpadu untuk Code LLM yang canggih.			Kode
KodeT5	LLM Kode Terbuka untuk Pemahaman dan Pembuatan Kode.			Kode
Kursor	Tulis, edit, dan ngobrol tentang kode Anda dengan GPT-4 di editor jenis baru.			Kode
Pembuat Kode DeepSeek	DeepSeek Coder: Biarkan Kode Menulis Sendiri.	arXiv		Kode
Kodeks OpenAI	OpenAI Codex adalah turunan dari GPT-3.			Kode
PandaAI	Pandas AI adalah pustaka Python yang mengintegrasikan kemampuan kecerdasan buatan generatif ke dalam Pandas, menjadikan kerangka data bersifat komunikatif.			Kode
RobloxScripterAI	RobloxScripterAI adalah alat pembuat kode bertenaga AI untuk Roblox.		Roblox	Kode
Scikit-LLM	Integrasikan model bahasa canggih seperti ChatGPT dengan lancar ke dalam scikit-learn untuk tugas analisis teks yang ditingkatkan.			Kode
JadiTaNa	Asisten Pengembangan Perangkat Lunak Sumber Terbuka.	arXiv		Kode
Kode Stabil 3B	Pengkodean di Edge.			Kode
Kode Bintang	? StarCoder adalah model bahasa (LM) yang dilatih pada kode sumber dan teks bahasa alami.	arXiv		Kode
Kode Bintang 2	StarCoder2 adalah rangkaian model pembuatan kode (3B, 7B, dan 15B), dilatih pada 600+ bahasa pemrograman dari The Stack v2 dan beberapa teks bahasa alami seperti masalah Wikipedia, Arxiv, dan GitHub.	arXiv		Kode
UnityGen AI	UnityGen AI adalah plugin pembuatan kode bertenaga AI untuk Unity.		Persatuan	Kode
Ruang kosong	Void adalah alternatif Kursor open source. Tulis kode dengan alat AI terbaik, pertahankan kontrol penuh atas data Anda, dan akses fitur AI canggih.			Kode

^ Kembali ke Daftar Isi ^

Penulis

Sumber	Keterangan	Jenis
AI-Penulis	AI menulis novel, membuat artikel web fantasi dan romansa, dll. Model generatif terlatih Tiongkok.	Penulis
Buku catatan.ai	Notebook.ai adalah seperangkat alat bagi penulis, desainer game, dan pemain peran untuk menciptakan alam semesta yang menakjubkan – dan segala sesuatu di dalamnya.	Penulis
Novel	Editor WYSIWYG bergaya Notion dengan pelengkapan otomatis bertenaga AI.	Penulis
NovelAI	Didorong oleh AI, buatlah cerita unik, kisah mendebarkan, romansa yang menggoda, atau sekadar main-main tanpa kesulitan.	Penulis

^ Kembali ke Daftar Isi ^

Gambar

Sumber	Keterangan	Kertas	Mesin Permainan	Jenis
Pintu Mana Saja	Kustomisasi Gambar Tingkat Objek Zero-shot.	arXiv		Gambar
Teks Apa Pun	Pembuatan dan Pengeditan Teks Visual Multibahasa.	arXiv		Gambar
Studio Otomatis	Membuat Subjek yang Konsisten dalam Pembuatan Gambar Interaktif Multi-putaran.	arXiv		Gambar
Blender-ControlNet	Menggunakan ControlNet langsung di Blender.		pencampur	Gambar
BriVL	Menjembatani Visi dan Model Bahasa.	arXiv		Gambar
CatVTON	CatVTON: Penggabungan Adalah Semua yang Anda Butuhkan untuk Uji Coba Virtual dengan Model Difusi.	arXiv		Gambar
CLIPasso	Sebuah metode untuk mengubah gambar suatu objek menjadi sketsa, memungkinkan berbagai tingkat abstraksi.	arXiv		Gambar
KlipJatuhkan	Ciptakan visual yang menakjubkan dalam hitungan detik.			Gambar
UI yang nyaman	GUI difusi stabil yang kuat dan modular dengan antarmuka grafik/node.			Gambar
Lab Konsep	Pembuatan Kreatif menggunakan Batasan Difusi Sebelumnya.	arXiv		Gambar
KontrolNet	ControlNet adalah struktur jaringan saraf untuk mengontrol model difusi dengan menambahkan kondisi tambahan.	arXiv		Gambar
CSGO	CSGO: Komposisi Gaya Konten dalam Pembuatan Teks-ke-Gambar.	arXiv		Gambar
DALL·E 2	DALL·E 2 adalah sistem AI yang dapat membuat gambar dan seni realistis dari deskripsi dalam bahasa alami.			Gambar
Studio Dashtoon	Dashtoon Studio adalah platform pembuatan komik bertenaga AI.			Komik
DeepAI	DeepAI menawarkan serangkaian alat yang menggunakan AI untuk meningkatkan kreativitas Anda.			Gambar
DeepFloyd JIKA	JIKA oleh DeepFloyd Lab di StabilityAI.			Gambar
Kedalaman Apapun V2	Kedalaman Apapun V2	arXiv		Gambar
Perpustakaan dan masalah peta kedalaman	Pustaka peta kedalaman untuk digunakan dengan ekstensi Control Net untuk Automatic1111/stable-diffusion-webui.			Gambar
Diffuse untuk Memilih	Memperkaya Inpainting Berkondisi Gambar dalam Model Difusi Laten untuk Uji Coba Virtual.	arXiv		Gambar
Difusi Disko	Penggabungan buku catatan, model, dan teknik frankensteinian untuk generasi Seni dan Animasi AI.			Gambar
TarikGAN	Manipulasi Berbasis Titik Interaktif pada Manifold Gambar Generatif.	arXiv		Gambar
Menggambar Sesuatu	Pembuatan gambar dengan bantuan AI di Saku Anda.			Gambar
DWPose	Estimasi Pose Seluruh Tubuh yang Efektif dengan Distilasi Dua Tahap.	arXiv		Gambar
Foto Mudah	Generator Foto AI Cerdas Anda.			Gambar
Aliran	Repo ini berisi kode inferensi minimal untuk menjalankan teks-ke-gambar dan gambar-ke-gambar dengan transformator aliran laten Flux kami yang telah diperbaiki.			Gambar
Ikuti-Klik Anda	Animasi Gambar Regional Domain Terbuka melalui Perintah Singkat.	arXiv		Gambar
bodoh	Fokus pada mendorong dan menghasilkan.			Gambar
fusi GIF	Buat GIF dan Video menggunakan Difusi Stabil.			Gambar
Segmen Beralas-Apa Saja	Secara Otomatis Mendeteksi, Menyegmentasikan, dan Menghasilkan Apa Pun dengan Input Gambar, Teks, dan Audio.	arXiv		Gambar
Foto HivisionID	HivisionIDPhotos: alat foto ID AI yang ringan dan efisien.			Gambar
Hua	Hua adalah editor gambar AI dengan Difusi Stabil (dan banyak lagi).			Gambar
Hunyuan-DiT	Transformator Difusi Multi-Resolusi yang Kuat dengan Pemahaman Tiongkok yang Mendalam.	arXiv		Gambar
IC-Cahaya	IC-Light adalah proyek untuk memanipulasi pencahayaan gambar.			Gambar
Tulisan gambar	Membantu orang menjadi lebih kreatif.			Gambar
Gambar	Imagen adalah sistem AI yang menghasilkan gambar fotorealistik dari teks masukan.			Gambar
img2img-turbo	Gambar-ke-Gambar Satu Langkah dengan SD-Turbo.			Gambar
Img2Prompt	Dapatkan petunjuk dari gambar yang dihasilkan difusi stabil.			Gambar
Ketakterbatasan	Infinity: Menskalakan Pemodelan AutoRegresif Bitwise untuk Sintesis Gambar Resolusi Tinggi.	arXiv		Gambar
ID Instan	Generasi Pelestarian Identitas Zero-shot dalam Hitungan Detik.	arXiv		Gambar
MagangLM-XComposer2	InternLM-XComposer2 adalah model besar bahasa visi (VLLM) inovatif yang unggul dalam komposisi dan pemahaman teks-gambar bentuk bebas.	arXiv		Gambar
KOALA	Perhatian Diri Penting dalam Distilasi Pengetahuan Model Difusi Laten untuk Sintesis Gambar yang Efisien Memori dan Cepat.			Gambar
Warna	Kolors: Pelatihan Model Difusi yang Efektif untuk Sintesis Teks-ke-Gambar Fotorealistik.			Gambar
KREA	Hasilkan gambar dan video dengan alat desain bertenaga AI yang menyenangkan.			Gambar
Jembatan LaVi	Menjembatani Berbagai Model Bahasa dan Model Visi Generatif untuk Pembuatan Teks-ke-Gambar.	arXiv		Gambar
Lapisan Difusi	Difusi Lapisan Gambar Transparan menggunakan Transparansi Laten.	arXiv		Gambar
leksika	Difusi Stabil mendorong mesin pencari.			Gambar
LlamaGen	Model Autoregresif Mengalahkan Difusi: Llama untuk Pembuatan Gambar yang Dapat Diskalakan.	arXiv		Gambar
Lumina-mGPT	Lumina-mGPT: Menerangi Pembuatan Teks-ke-Gambar Fotorealistik yang Fleksibel dengan Pra-pelatihan Generatif Multimodal.	arXiv		Gambar
MetaTembak	MetaShoot adalah kembaran digital dari studio foto, yang dikembangkan sebagai plugin untuk Unreal Engine yang memberikan kemampuan kepada pembuat konten mana pun untuk menghasilkan render yang sangat realistis dengan cara termudah dan tercepat.		Mesin Tidak Nyata	Gambar
Tengah perjalanan	Midjourney adalah laboratorium penelitian independen yang mengeksplorasi media pemikiran baru dan memperluas kekuatan imajinatif spesies manusia.			Gambar
MIGC	MIGC: Pengontrol Pembuatan Multi-Instance untuk Sintesis Teks-ke-Gambar.	arXiv		Gambar
MimicBrush	Pengeditan Gambar Zero-shot dengan Imitasi Referensi.	arXiv		Gambar
MahaGen	OmniGen: Pembuatan Gambar Terpadu.	arXiv		Gambar
Ya ampun	Omost adalah proyek untuk mengubah kemampuan pengkodean LLM menjadi kemampuan pembuatan gambar (atau lebih tepatnya, pembuatan gambar).			Gambar
Editor Pose Terbuka	Openpose Editor untuk webui difusi stabil AUTOMATIC1111.			Gambar
Pakaian Siapapun	Uji coba virtual berkualitas sangat tinggi untuk Pakaian Apa Pun dan Siapa Pun.			Gambar
Cat Batalkan	PaintsUndo: Model Dasar Perilaku Menggambar dalam Lukisan Digital.			Gambar
Pembuat Foto	Menyesuaikan Foto Manusia Realistis melalui Penyematan ID Bertumpuk.	arXiv		Gambar
ruang foto	Pembuat Latar Belakang AI.			Gambar
plastik	Pembuatan gambar AI di cloud.			Gambar
Cepat.Seni	Hub Generator.			Gambar
PulID	Kustomisasi ID Murni dan Kilat melalui Penyelarasan Kontrasif.	arXiv		Gambar
Teks Kaya-ke-Gambar	Pembuatan Teks-ke-Gambar Ekspresif dengan Teks Kaya.	arXiv		Gambar
RPG-DiffusionMaster	Menguasai Difusi Teks-ke-Gambar: Pembuatan Ulang, Perencanaan, dan Pembuatan dengan Multimodal LLM (PRG).			Gambar
SEED-Cerita	SEED-Story: Pembuatan Cerita Panjang Multimodal dengan Model Bahasa Besar.	arXiv		Gambar
Segmentasikan Apa Saja	Segment Anything Model (SAM): model AI baru dari Meta AI yang dapat "memotong" objek apa pun, di gambar apa pun, dengan satu klik.	arXiv		Gambar
Segmen Apapun Model 2 (SAM 2)	SAM 2: Segmentasikan Apa Pun di Gambar dan Video.	arXiv		Gambar
sd-webui-controlnet	Ekstensi WebUI untuk ControlNet.			Gambar
SDXL-Petir	Distilasi Difusi Adversarial Progresif.	arXiv		Gambar
SDXS	Model Difusi Laten Satu Langkah Waktu Nyata dengan Kondisi Gambar.			Gambar
Stabil.seni	Plugin Photoshop untuk Difusi Stabil dengan Automatic1111 sebagai backend (secara lokal atau dengan Google Colab).			Gambar
Kaskade Stabil	Stable Cascade terdiri dari tiga model: Tahap A, Tahap B, dan Tahap C, yang mewakili kaskade untuk menghasilkan gambar, oleh karena itu dinamakan "Stable Cascade".			Gambar
Difusi Stabil	Model difusi teks-ke-gambar yang laten.			Gambar
stable-diffusion.cpp	Difusi Stabil dalam C/C++ murni.			Gambar
UI web Difusi Stabil	Antarmuka browser berdasarkan perpustakaan Gradio untuk Difusi Stabil.			Gambar
UI web Difusi Stabil	UI berbasis web untuk Difusi Stabil.			Gambar
WebUI Difusi Stabil Cina	versi Cina dari webui difusi stabil.			Gambar
Difusi Stabil XL	Hasilkan gambar dari teks.	arXiv		Gambar
Difusi Stabil XL Turbo	Pembuatan Teks-ke-Gambar Waktu Nyata.			Gambar
Difusi Stabil 3.5	Rilis terbuka Stable Diffusion 3.5 mencakup beberapa varian model, termasuk Stable Diffusion 3.5 Large dan Stable Diffusion 3.5 Large Turbo.			Gambar
Coretan Stabil	Doodle Stabil adalah alat sketsa-ke-gambar yang mengubah gambar sederhana menjadi gambar dinamis.			Gambar
Studio Stabil	StableStudio oleh Stabilitas AI			Gambar
Pembuat Cerita	StoryMaker: Menuju Karakter Holistik yang Konsisten dalam Pembuatan Teks-ke-gambar.	arXiv		Gambar
Aliran Difusi	Solusi Tingkat Saluran untuk Pembuatan Interaktif Waktu Nyata.			Gambar
Gaya Jatuhkan	Pembuatan Teks-Ke-Gambar dalam Gaya Apa Pun.	arXiv		Gambar
Sinkronisasi Pemimpi	Menghasilkan Gambar yang Konsisten dengan Multiview dari Gambar Tampilan Tunggal.	arXiv		Gambar
UltraEdit	UltraEdit: Pengeditan Gambar Berbutir Halus Berbasis Instruksi dalam Skala Besar.	arXiv		Gambar
Ultra Piksel	UltraPixel: Meningkatkan Sintesis Gambar Resolusi Ultra Tinggi ke Puncak Baru.	arXiv		Gambar
Difusi Stabil Unity ML	Difusi Stabil Core ML pada Unity.		Persatuan	Gambar
Visi Vispunk	Platform pembuatan Teks-ke-Gambar.			Gambar

^ Kembali ke Daftar Isi ^

Tekstur

Sumber	Keterangan	Kertas	Mesin Permainan	Jenis
CRM	Gambar Tunggal ke Mesh Bertekstur 3D dengan Model Rekonstruksi Konvolusional.	arXiv		Tekstur
Mat Mimpi	Pembuatan Material PBR Berkualitas Tinggi dengan Model Difusi Sadar Geometri dan Cahaya.	arXiv		Tekstur
Ruang Impian	Impikan Ruang Kamar Anda dengan Propagasi Tekstur Panorama Berbasis Teks.			Tekstur
Tekstur Mimpi	Difusi Stabil yang ada di dalam Blender. Buat tekstur, seni konsep, aset latar belakang, dan banyak lagi dengan perintah teks sederhana.		pencampur	Tekstur
Instruksikan Manusia	Mengedit Tekstur Manusia 3D Animasi dengan Instruksi.	arXiv		Tekstur
InteX	Sintesis Teks-ke-Tekstur Interaktif melalui Inpainting Sadar Kedalaman Terpadu.	arXiv		Tekstur
LLaMA-Mesh	LLaMA-Mesh: Menyatukan Generasi Mesh 3D dengan Model Bahasa.	arXiv		Jala
BahanSeg3D	MaterialSeg3D: Menyegmentasikan Material Padat dari Prior 2D untuk Aset 3D.	arXiv		Tekstur
Jala Apa Saja	MaterialSeg3D: Menyegmentasikan Material Padat dari Prior 2D untuk Aset 3D.	arXiv		Jala
Neurallangelo	Rekonstruksi Permukaan Neural dengan Ketelitian Tinggi.	arXiv		Tekstur
Cat-itu	Sintesis Teks-ke-Tekstur melalui Optimasi Peta Tekstur Konvolusional Mendalam dan Rendering Berbasis Fisik.			Tekstur
Polikamera	Buat tekstur 3D Anda sendiri hanya dengan mengetik.			Tekstur
TexFusion	Mensintesis Tekstur 3D dengan Model Difusi Gambar yang Dipandu Teks.	arXiv		Tekstur
Teks2Tex	Sintesis tekstur berbasis teks melalui Model Difusi.	arXiv		Tekstur
Lab Tekstur	Tekstur yang dihasilkan AI. Anda dapat membuatnya sendiri dengan prompt teks.			Tekstur
Dengan Poli	Buat Tekstur Dengan Poli. Hasilkan materi 3D dengan AI dalam editor online gratis, atau cari di perpustakaan komunitas kami yang terus berkembang.			Tekstur
X-Mesh	X-Mesh: Menuju Stylisasi 3D Berbasis Teks yang Cepat dan Akurat melalui Panduan Tekstual Dinamis.	arXiv		Tekstur

^ Kembali ke Daftar Isi ^

peneduh

Sumber	Keterangan	Kertas	Mesin Permainan	Jenis
AI Shader	Generator shader bertenaga ChatGPT untuk Unity.		Persatuan	peneduh

^ Kembali ke Daftar Isi ^

Model 3D

Sumber	Keterangan	Kertas	Mesin Permainan	Jenis
animasi3D	Animate3D: Menganimasikan Model 3D Apa Pun dengan Difusi Video Multi-tampilan.	arXiv		3D
Apa pun-3D	Segmen-Apa Saja + 3D. Mari kita angkat semuanya menjadi 3D.	arXiv		Model
Any2Point	Any2Point: Memberdayakan Model Besar Modalitas Apa pun untuk Pemahaman 3D yang Efisien.	arXiv		3D
BlenderGPT	Gunakan perintah dalam bahasa Inggris untuk mengontrol Blender dengan GPT-4 OpenAI.		pencampur	Model
Blender-GPT	Asisten Blender lengkap yang didukung oleh integrasi GPT3/4 + Whisper.		pencampur	Model
Lab Blokade	Alkimia digital menjadi nyata dengan Skybox Lab - solusi terbaik yang didukung AI untuk menghasilkan pengalaman skybox 360° yang luar biasa dari perintah teks.			Model
CF-3DGS	Percikan Gaussian 3D Bebas COLMAP.	arXiv		3D
KarakterGen	CharacterGen: Pembuatan Karakter 3D yang Efisien dari Gambar Tunggal dengan Kanonikalisasi Pose Multi-Tampilan.	arXiv		3D
chatGPT-maya	Alat Maya sederhana yang memanfaatkan AI terbuka untuk melakukan tugas dasar berdasarkan instruksi deskriptif.		Maya	Model
Pemimpi Kota	Model Generatif Komposisi Kota 3D Tanpa Batas.	arXiv		3D
CSM	Hasilkan dunia 3D dari gambar dan video.			3D
lari	Kopilot Anda untuk Pembangunan Dunia di Unreal Engine.		Mesin Tidak Nyata	3D
Katalis Mimpi	DreamCatalyst: Pengeditan 3D Cepat dan Berkualitas Tinggi melalui Pengendalian Kemampuan Edit dan Pelestarian Identitas.	arXiv		3D
MimpiGaussian4D	Percikan Gaussian 4D Generatif.	arXiv		4D
DEBU3R	Visi 3D Geometris Menjadi Mudah.	arXiv		3D
Membangun 3D	Edify 3D: Pembuatan Aset 3D Berkualitas Tinggi yang Dapat Diskalakan.	arXiv		3D
GALA3D	GALA3D: Menuju Pembuatan Adegan Kompleks Teks-ke-3D melalui Generative Gaussian Splatting yang dipandu Tata Letak.	arXiv		3D
GaussCtrl	GaussCtrl: Pengeditan Gaussian Splatting 3D Berbasis Teks yang Konsisten Multi-Tampilan.	arXiv		3D
GaussianCube	Representasi Cahaya Terstruktur dan Eksplisit untuk Pemodelan Generatif 3D.	arXiv		3D
Gaussian Dreamer	Pembuatan Cepat dari Teks ke Gaussian Splatting 3D dengan Point Cloud Priors.	arXiv		3D
Lab Genie	Berdayakan game Anda dengan AI-UGC.			3D
HiFA	Teks-ke-3D dengan ketelitian tinggi dengan panduan Difusi tingkat lanjut.			Model
HoloPemimpi	HoloDreamer: Generasi Dunia Panorama 3D Holistik dari Deskripsi Teks.	arXiv		3D
Hunyuan3D-1.0	Hunyuan3D-1.0: Kerangka Kerja Terpadu untuk Pembuatan Teks-ke-3D dan Gambar-ke-3D.	arXiv		3D
tak terhingga	Dunia Fotorealistik Tanpa Batas menggunakan Generasi Prosedural.	arXiv		3D
Instruksikan-NeRF2NeRF	Mengedit Adegan 3D dengan Instruksi.	arXiv		Model
Interaktif3D	Ciptakan Apa yang Anda Inginkan dengan Generasi 3D Interaktif.	arXiv		3D
Isotropik3D	Pembuatan Gambar-ke-3D Berdasarkan Penyematan CLIP Tunggal.			3D
TERBARU3D	Sintesis Teks-Ke-3D yang Diamortisasi Skala Besar.	arXiv		3D
SINGA	Model Difusi Titik Laten untuk Pembuatan Bentuk 3D.	arXiv		Model
Luma AI	Tangkap dalam 3D yang hidup. Fotorealisme, refleksi, dan detail yang tak tertandingi. Masa depan VFX adalah sekarang, untuk semua orang!			Model
menerangi AI	Kreativitas yang Didukung AI.			3D
Jadikan-3D	Pembuatan 3D Fidelitas Tinggi dari Satu Gambar dengan Difusi Sebelumnya.	arXiv		Model
Bersifat jala	Ciptakan Aset Game 3D yang Menakjubkan dengan AI.			3D
gerak	Pembuat Animasi AI 3D Ajaib.			3D
mimpi MVD	Difusi Multi-tampilan untuk Generasi 3D.	arXiv		3D
NVIDIA NeRF Instan	Grafik saraf primitif instan: NeRF secepat kilat dan banyak lagi.			Model
Satu-2-3-45	Gambar Tunggal apa pun ke Mesh 3D dalam 45 Detik tanpa Optimasi Per Bentuk.	arXiv		Model
Cat3D	Lukis Apa Pun 3D dengan Model Difusi Tekstur Tanpa Pencahayaan.	arXiv		3D
PAniC-3D	Rekonstruksi 3D Tampilan Tunggal Bergaya dari Potret Karakter Anime.	arXiv		Model
Titik·E	Difusi titik awan untuk sintesis model 3D.			Model
Pemimpi Produktif	Pembuatan Teks-ke-3D dengan Fidelitas Tinggi dan beragam dengan Distilasi skor Variasi.	arXiv		Model
SF3D	SF3D: Rekonstruksi Jaring 3D Cepat yang Stabil dengan Pembukaan UV dan Penguraian Iluminasi.	arXiv		3D
Membentuk	Menghasilkan objek 3D yang dikondisikan pada teks atau gambar.	arXiv		Model
Sloyd	Pemodelan 3D tidak pernah semudah ini.			Model
Spline AI	Kekuatan AI mencapai dimensi ke-3. Hasilkan objek, animasi, dan tekstur menggunakan petunjuk.			Model
Penggabungan Mimpi yang Stabil	Implementasi pytorch dari model teks-ke-3D Dreamfusion, didukung oleh model teks-ke-2D Difusi Stabil.			Model
SV3D	Sintesis Multi-tampilan Novel dan Pembuatan 3D dari Gambar Tunggal menggunakan Difusi Video Laten.	arXiv		3D
Tafi	Teks AI ke mesin karakter 3D.			Model
3D-GPT	Pemodelan 3D Prosedural dengan Model Bahasa Besar.	arXiv		3D
3D-LLM	Menyuntikkan Dunia 3D ke dalam Model Bahasa Besar.	arXiv		3D
3Dpresso	Ekstrak model 3D suatu objek, yang diambil dalam video.			Model
3DTopia	Pembuatan Teks-ke-3D dalam 5 Menit.	arXiv		3D
3DTopia-XL	3DTopia-XL: Menskalakan Pembuatan Aset 3D Berkualitas Tinggi melalui Difusi Primitif.	arXiv		3D
tigastudio	Kerangka kerja terpadu untuk pembuatan konten 3D.			Model
TripoSR	Model sumber terbuka tercanggih untuk rekonstruksi 3D feedforward cepat dari satu gambar.	arXiv		Model
Unik3D	Pembuatan Mesh 3D Berkualitas Tinggi dan Efisien dari Satu Gambar.	arxiv		3D
Unitygaussiansplatting	Toy Gaussian Splatting Visualisasi dalam Persatuan.		Persatuan	3D
Vivid-1-to-3	Sintesis tampilan baru dengan model difusi video.	arxiv		3D
Voxcraft	Membuat model 3D yang siap digunakan dengan AI.			3D
Wonder3d	Gambar tunggal ke 3D menggunakan difusi lintas domain.	arxiv		3D
Zero-1-to-3	Zero-shot satu gambar ke objek 3D.	arxiv		Model

^ Kembali ke Daftar Isi ^

Avatar

Sumber	Keterangan	Kertas	Mesin game	Jenis
Aniportrait	Sintesis yang digerakkan oleh audio dari animasi potret fotorealistik.	arxiv		Avatar
TENANG	Model laten permusuhan bersyarat untuk karakter virtual yang dapat directable.	arxiv		Avatar
Chatavatar	Generasi progresif wajah 3D yang dianimasikan di bawah panduan teks.			Avatar
Chatdollkit	ChatDollKit memungkinkan Anda untuk membuat model 3D Anda menjadi chatbot.		Persatuan	Avatar
Dreamtalk	Ketika generasi kepala berbicara ekspresif memenuhi model probabilistik difusi.	arxiv		Avatar
Duix	DUIX - Digital Human SDK berbasis silikon?			Avatar
Echomimic	Echomimic: Animasi potret yang digerakkan oleh audio seperti hidup melalui kondisi tengara yang dapat diedit.	arxiv		Avatar
Emoportraits	Avatar kepala satu tembakan multimodal yang ditingkatkan emosi.			Avatar
E3 Gen	Generasi avatar yang efisien, ekspresif, dan dapat diedit.	arxiv		Avatar
Exavatar	Exavatar - Avatar Gaussian 3D seluruh tubuh ekspresif.	arxiv		Avatar
Geneavatar	Ekspresi Generik-Aware Volumetric Head Avatar Mengedit dari satu gambar.	arxiv		Avatar
Geneface ++	Generasi pembicaraan 3D real-time yang digeneralisasi dan stabil.			Avatar
Halo	Sintesis visual yang digerakkan oleh audio hierarkis untuk animasi gambar potret.	arxiv		Avatar
Hallo2	Hallo2: Animasi gambar potret yang digerakkan oleh audio dan resolusi tinggi.	arxiv		Avatar
Headsculpt	Membuat avatar kepala 3D dengan teks.	arxiv		Avatar
Intrinsikavatar	Intrinsicavatar: Rendering terbalik secara fisik manusia dinamis dari video monokular melalui penelusuran ray eksplisit.	arxiv		Avatar
Linly-Talker	Sistem Percakapan Avatar Digital.			Avatar
LivePortrait	LivePorTrait: Animasi potret yang efisien dengan jahitan dan kontrol ulang.	arxiv		Avatar
Motiongpt	Gerakan manusia sebagai bahasa asing, model generasi gerak gerak terpadu menggunakan LLMS.	arxiv		Avatar
Musepose	Musepose: Kerangka kerja gambar-ke-video yang digerakkan oleh pose untuk generasi manusia virtual.			Avatar
Musetalk	Sinkronisasi bibir berkualitas tinggi real-time dengan laten space inpainting.			Avatar
Musev	Generasi video manusia virtual manusia yang sangat panjang dan tinggi dengan denoising paralel yang dikondisikan secara visual.			Avatar
Potret4d	Mempelajari sintesis avatar head 4D 4D menggunakan data sintetis.	arxiv		Avatar
Siap pemain saya	Integrasikan avatar yang dapat disesuaikan ke dalam game atau aplikasi Anda dalam beberapa hari.			Avatar
Rodinhd	RODINHD: Generasi Avatar 3D Fidelity Tinggi dengan model difusi.	arxiv		Avatar
Styleavatar3d	Memanfaatkan model difusi teks-teks untuk generasi avatar 3D kesetiaan tinggi.	arxiv		Avatar
Text2Control3d	Generasi avatar 3D yang dapat dikendalikan dalam bidang pancaran saraf menggunakan model difusi teks-ke-gambar yang dipandu geometri.	arxiv		Avatar
Topo4d	Topologi memelihara Gaussian percikan untuk penangkapan kepala 4D kesetiaan tinggi.	arxiv		Avatar
Unityaiwithchatgpt	Berdasarkan Unity, Chatgpt+Unitychan Voice Interactive Display direalisasikan.		Persatuan	Avatar
Vid2avatar	Rekonstruksi Avatar 3D dari video di alam liar melalui dekomposisi adegan yang di-swadaya.	arxiv		Avatar
Vlogger	Difusi multimodal untuk sintesis avatar yang diwujudkan.			Avatar
Wild2avatar	Membuat manusia di belakang oklusi.	arxiv		Avatar

^ Kembali ke Daftar Isi ^

Animasi

Sumber	Keterangan	Kertas	Jenis
Menghidupkan siapa pun	Sintesis gambar-ke-video yang konsisten dan dapat dikendalikan untuk animasi karakter.	arxiv	Animasi
Animateeansthing	Animasi gambar domain terbuka berbutir halus dengan panduan gerak.	arxiv	Animasi
Animasiff	Hidupkan model difusi teks-ke-gambar Anda yang dipersonalisasi tanpa penyetelan spesifik.	arxiv	Animasi
Animatelcm	Mari kita mempercepat pembuatan video dalam 4 langkah!	arxiv	Animasi
Animate-x	Animate-X: Animasi gambar karakter universal dengan representasi gerak yang ditingkatkan.	arxiv	Animasi
Animatezero	Model difusi video adalah animator gambar nol-shot.	arxiv	Animasi
Animationgpt	Alat AIGC untuk menghasilkan aset gerak pertempuran game.		Animasi
Deforum	Deforum memanfaatkan difusi yang stabil untuk menghasilkan visual AI yang berkembang.		Animasi
Drawingspinup	DrawingsPinup: Animasi 3D dari gambar karakter tunggal.	arxiv	Animasi
Dreamoving	Kerangka kerja pembuatan video manusia berdasarkan model difusi.	arxiv	Animasi
Facefusion	Generasi berikutnya Wajah Swapper dan Penambah.		Animasi
FreeInit	Menjembatani kesenjangan inisialisasi dalam model difusi video.	arxiv	Animasi
Geneface	Sintesis wajah pembicaraan 3D yang digerakkan oleh audio-generalisasi dan kesetiaan tinggi.	arxiv	Animasi
ID-animator	Generasi video manusia yang memelihara identitas zero-shot.	arxiv	Animasi
Magicanimate	Animasi gambar manusia yang konsisten sementara menggunakan model difusi.	arxiv	Animasi
Nuwa	Dragnuwa adalah model pembuatan video berbasis difusi domain terbuka mengambil kontrol teks, gambar, dan lintasan sebagai input untuk mencapai pembuatan video yang dapat dikendalikan.	arxiv	Animasi
Nuwa-Infinity	Nuwa-Infinity adalah model generatif multimodal yang dirancang untuk menghasilkan gambar dan video berkualitas tinggi dari teks, gambar atau input video yang diberikan.		Animasi
Nuwa-xl	Difusi baru atas arsitektur difusi untuk pembuatan video yang sangat panjang.		Animasi
Animasi Omni	AI menghasilkan animasi kesetiaan tinggi.		Animasi
Pia	Animator gambar pribadi Anda melalui modul plug-and-play dalam model teks-ke-gambar.	arxiv	Animasi
Sadtalker	Mempelajari koefisien gerak 3D realistis untuk animasi wajah tunggal yang digerakkan oleh audio-driven.	arxiv	Animasi
Sadtalker-Video-Lip-Sync	Proyek ini didasarkan pada sadtalkers wav2lip untuk sintesis bibir video.		Animasi
Animasi yang stabil	Alat teks-ke-animasi yang kuat untuk pengembang.		Animasi
Talecrafter	Alat visualisasi cerita interaktif yang mendukung banyak karakter.	arxiv	Animasi
Tooncrafter	Tooncrafter: Interpolasi kartun generatif.	arxiv	Animasi
Wav2lip	Video sinkronisasi bibir secara akurat di alam liar.	arxiv	Animasi
Studio Wonder	Alat AI yang secara otomatis menjiwai, menyalakan, dan menyusun karakter CG ke dalam adegan aksi langsung.		Animasi

^ Kembali ke Daftar Isi ^

Visual

Sumber	Keterangan	Kertas	Jenis
Cambrian-1	Cambrian-1: Eksplorasi LLM multimodal yang sepenuhnya terbuka dan berpusat.	arxiv	LLMS multimodal
Cogvlm2	Model multi-modal open-source tingkat GPT4V berdasarkan LLAMA3-8B.		Visual
Cotracker	Lebih baik melacak bersama.	arxiv	Visual
EVF-SAM	EVF-SAM: Fusion-Bahasa Awal untuk Segmen Teks Model apa pun.	arxiv	Visual
Facehi	Lebih baik melacak bersama.		Visual
Internlm-xComposer2	Internlm-xComposer2 adalah model visi-bahasa-besar (VLLM) yang unggul dalam komposisi dan pemahaman gambar teks-bentuk gratis.	arxiv	Visual
Kanguru	Kanguru: Model bahasa video yang kuat yang mendukung input video konteks panjang.		Visual
LGVI	Menuju inpaining video yang digerakkan oleh bahasa melalui model bahasa multimodal besar.		Visual
Llava ++	Memperluas kemampuan visual dengan LLAMA-3 dan PHI-3.		Visual
Llava-onevision	Llava-onevision: Transfer tugas visual yang mudah.	arxiv	Visual
Longva	Transfer konteks panjang dari bahasa ke visi.	arxiv	Visual
Maskvit	Pra-pelatihan visual bertopeng untuk prediksi video.	arxiv	Visual
Minicpm-llama3-v 2.5	MLLM level GPT-4V di ponsel Anda.		Visual
Moe-llava	Campuran para ahli untuk model bahasa penglihatan yang besar.	arxiv	Visual
Motionllm	Memahami perilaku manusia dari gerakan dan video manusia.	arxiv	Visual
Pllava	Ekstensi LLAVA bebas parameter dari gambar ke video untuk captioning video padat.	arxiv	Visual
Qwen-vl	Model bahasa penglihatan serbaguna untuk pemahaman, lokalisasi, membaca teks, dan seterusnya.	arxiv	Visual
Sapiens	Sapiens: Foundation for Human Vision Models.	arxiv	Visual
Sharegpt4v	Meningkatkan model multi-modal besar dengan keterangan yang lebih baik.	arxiv	Visual
SOLO	Solo: Transformator tunggal untuk pemodelan bahasa penglihatan yang dapat diskalakan.	arxiv	Visual
Video-CCAM	Video-CCAM: Memajukan pemahaman bahasa video dengan topeng lintas-perhatian kausal.		Visual
Video -lava	Belajar representasi visual bersatu dengan penyelarasan sebelum proyeksi.	arxiv	Visual
Videollama 2	Memajukan pemodelan spasial-temporal dan pemahaman audio dalam LLM video.	arxiv	Visual
Video-mme	Tolok ukur evaluasi komprehensif pertama yang pernah ada dari LLM multi-modal dalam analisis video.	arxiv	Visual
Vitron	LLM Visi Pixel-Level Terpadu untuk memahami, menghasilkan, segmentasi, mengedit.		Visual
Vila	VILA: Pada pra-pelatihan untuk model bahasa visual.	arxiv	Visual

^ Kembali ke Daftar Isi ^

Video

Sumber	Keterangan	Kertas	Jenis
360DVD	Generasi video Panorama yang dapat dikendalikan dengan model difusi video 360 derajat.	arxiv	Video
Animate-a-story	Generasi video pengambilan-pengambilan untuk menceritakan sebuah kisah.	arxiv	Video
Apapun di adegan apa pun	Penyisipan Objek Video Photorealistik.		Video
Seni • v	Generasi teks-ke-video regresif auto-regresif dengan model difusi.	arxiv	Video
Bantu	Temui platform video generatif yang menghidupkan ide -ide Anda.		Video
Atomovideo	Generasi gambar-ke-video yang tinggi.	arxiv	Video
Latar belakangremover	Latar belakang penghapus memungkinkan Anda menghapus latar belakang dari gambar dan video menggunakan AI dengan antarmuka baris perintah sederhana yang gratis dan open source.		Video
Boximator	Menghasilkan gerakan yang kaya dan terkendali untuk sintesis video.	arxiv	Video
Codef	Bidang deformasi konten untuk pemrosesan video yang konsisten sementara.	arxiv	Video
Cogvideo	Hasilkan video dari deskripsi teks.		Video
Cogvideox	Cogvideox adalah versi open-source dari model generasi video, yang homolog dengan 清影.		Video
COGVLM	COGVLM adalah model bahasa visual open-source yang kuat (VLM).		Visual
Conr	Genarate Vivid menari video dari lembar karakter anime yang digambar tangan (ACS).	arxiv	Video
Decohere	Buat apa yang tidak bisa difilmkan.		Video
Deskripsi	Deskripsi adalah cara yang sederhana, kuat, dan menyenangkan untuk diedit.		Video
Difuton	Toon Shading yang dapat diedit resolusi tinggi melalui model difusi.	arxiv	Video
lumba-lumba	Platform interaksi video umum berdasarkan LLMS.		Video
Domoai	Memperkuat kreativitas Anda dengan domoai.		Video
Dreamcinema	DreamCinema: Transfer sinematik dengan kamera gratis dan karakter 3D.	arxiv	Video
Dynamicrafter	Menjiwai gambar domain terbuka dengan prior difusi video.	arxiv	Video
TEPIAN	Kami memperkenalkan Edge, metode yang kuat untuk generasi tari yang dapat diedit yang mampu menciptakan tarian yang realistis, secara fisik-masuk akal sementara tetap setia pada musik input yang sewenang-wenang.	arxiv	Video
emosi	Emote Portrait Alive - Menghasilkan video potret ekspresif dengan model difusi audio2Video dalam kondisi lemah.	arxiv	Video
Video EMU	Faktorisasi pembuatan teks-ke-video dengan pengkondisian gambar eksplisit.		Video
Etna	ETNA dapat menghasilkan konten video yang sesuai berdasarkan deskripsi teks pendek.		Video
Peri	Sintesis video-ke-video yang dipandu instruksi yang dipandu oleh instruksi.		Video
Ikuti kanvas Anda	Follow-Canvas Anda: Outpaining video resolusi lebih tinggi dengan generasi konten yang luas.	arxiv	Video
Ikuti pose Anda	Generasi teks-ke-video berpemandu pose menggunakan video bebas pose.	arxiv	Video
Fulljourney	Rangkaian lengkap alat pembuatan AI Anda di ujung jari Anda.		Video
Gen-2	Sistem AI multi-modal yang dapat menghasilkan video baru dengan teks, gambar, atau klip video.		Video
Dinamika generatif	Dinamika gambar generatif.		Video
Jin	Lingkungan interaktif generatif.	arxiv	Video
Genmo	Secara ajaib membuat video dengan AI.		Video
Gentron	Transformer difusi untuk pembuatan gambar dan video.		Video
Higen	Decoupling spatio-temporal hierarkis untuk generasi teks-ke-video.		Video
Hotshot-xl	Hotshot-XL adalah model teks-ke-gif AI yang dilatih untuk bekerja bersama difusi stabil XL.		Video
HUNYUANVideo	HUNYUANVideo: Kerangka kerja sistematis untuk model pembuatan video besar.	arxiv	Video
Video Imagen	Diberikan prompt teks, video Imagen menghasilkan video definisi tinggi menggunakan model pembuatan video dasar dan urutan model spasial dan video super-resolusi yang diselingi.		Video
Instruktur	Menginstruksikan model difusi video dengan umpan balik manusia.	arxiv	Video
I2vgen-xl	Sintesis gambar-ke-video berkualitas tinggi melalui model difusi bertingkat.	arxiv	Video
Lavie	Generasi video berkualitas tinggi dengan model difusi laten bertingkat.	arxiv	Video
LTX Studio	LTX Studio adalah platform pembuatan film yang holistik, yang digerakkan oleh AI untuk pencipta, pemasar, pembuat film, dan studio.		Video
LTX-Video	LTX-Video adalah model pembuatan video berbasis DIT pertama yang dapat menghasilkan video berkualitas tinggi secara real-time. Ini dapat menghasilkan 24 video fps pada resolusi 768x512, lebih cepat dari yang diperlukan untuk menontonnya.		Video
Lumiere	Model difusi ruang-waktu untuk pembuatan video.	arxiv	Video
LVDM	Model difusi video laten untuk pembuatan video panjang kesetiaan tinggi.	arxiv	Video
MagicVideo	Generasi video yang efisien dengan model difusi laten.	arxiv	Video
MagicVideo-V2	Generasi video multi-tahap tinggi.	arxiv	Video
Jam ajaib	AI Video untuk pembuatnya dibuat sederhana.		Video
Magvit-V2	Tokenizer adalah kunci pembuatan visual.		Video
Magvit	Transformator video generatif bertopeng.		Video
Make-a-Video	Make-A-Video adalah sistem AI canggih yang menghasilkan video dari teks.	arxiv	Video
Buat piksel menari	Pembuatan video dinamis tinggi.	arxiv	Video
Buat-Video-Anda	Pembuatan video yang disesuaikan menggunakan panduan tekstual dan struktural.	arxiv	Video
Microcinema	Pendekatan pembagian-dan-penakluk untuk generasi teks-ke-video.	arxiv	Video
Mimo	MIMO: Sintesis video karakter yang dapat dikendalikan dengan pemodelan terurai spasial.	arxiv	Video
Mini-gemini	Menambang potensi model bahasa visi multi-modalitas.		Penglihatan
MobileVidFactory	Generasi video media sosial berbasis difusi otomatis untuk perangkat seluler dari teks.		Video
Mochi 1	Mochi 1 adalah model pembuatan video canggih terbuka dengan gerakan kesetiaan tinggi dan kepatuhan yang kuat dalam evaluasi pendahuluan.		Video
Mofa-video	Animasi gambar yang dapat dikendalikan melalui adaptasi bidang gerak generatif dalam model difusi gambar-ke-video beku.	arxiv	Video
MoneyPrinterturbo	Gunakan model besar untuk menghasilkan video pendek dengan satu klik.		Video
Moonvalley	Moonvalley adalah model AI generatif teks-ke-video baru.		Video
Mora	Lebih seperti Sora untuk pembuatan video generalis.	arxiv	Video
Studio Morph	Dengan sihir AI teks-ke-video kami, memanifestasikan kreativitas Anda melalui prompt Anda.		Video
Motionclone	MotionClone: Kloning gerak bebas pelatihan untuk pembuatan video yang dapat dikendalikan.	arxiv	Video
Motionctrl	Pengontrol gerak terpadu dan fleksibel untuk pembuatan video.	arxiv	Video
MotionDirector	Kustomisasi gerakan model difusi teks-ke-video.	arxiv	Video
Motionshop	Aplikasi mengganti karakter dalam video dengan avatar 3D.		Video
Mov2mov	Plugin MOV2MOV untuk Otomatis11111/Stable-Difusion-WebUi.		Video
Moviefactory	Pembuatan film otomatis dari teks menggunakan model generatif besar untuk bahasa dan gambar.	arxiv	Video
Bingkai saraf	Temukan synthesizer untuk dunia visual.		Video
Tidak pernah ada	Buat dunia Anda.		Video
Open-Sora	Mendemokratisasi produksi video yang efisien untuk semua.		Video
Open-Sora	Paket Open-Sora.		Video
Phenaki	Model untuk menghasilkan video dari teks, dengan petunjuk yang dapat berubah dari waktu ke waktu, dan video yang bisa selama beberapa menit.	arxiv	Video
Pika Labs	Pika Labs merevolusi pengalaman pembuatan video dengan AI.		Video
Pixeling	Pixeling memberdayakan pelanggan kami untuk membuat konten visual yang sangat tepat, ultra-realistis, dan sangat terkendali termasuk gambar, video, dan model 3D.		Video
Pixverse	Buat video yang menarik dengan AI.		Video
Penyerbukan	Membuat menjadi mudah, cepat, dan menyenangkan.		Video
Gunakan kembali dan menyebar	Denoising iteratif untuk generasi teks-ke-video.	arxiv	Video
Ruyi	Ruyi adalah model gambar-ke-video yang mampu menghasilkan video berkualitas sinematik pada resolusi 768, dengan laju bingkai 24 frame per detik, total 5 detik dan 120 frame.		Video
Shortgpt	Kerangka kerja AI eksperimental untuk pembuatan konten pendek/video otomatis.		Video
Tampilkan-1	Menikah dengan model difusi piksel dan laten untuk generasi teks-ke-video.	arxiv	Video
Video Snap	Transformer spatiotemporal yang diskalakan untuk sintesis teks-ke-video.	arxiv	Video
Sora	Membuat video dari teks.		Video
Sorawebui	Sorawebui adalah klien web Sora open-source, memungkinkan pengguna untuk dengan mudah membuat video dari teks dengan model Sora OpenAI.		Video
Stablevideo	Pengeditan video difusi konsistensi yang digerakkan oleh teks.		Video
Difusi video yang stabil	Gambar stabil difusi video (SVD) ke video.		Video
StoryDiffusion	Perhatian diri yang konsisten untuk pembuatan gambar dan video jarak jauh.	arxiv	Video
Streamingt2v	Generasi video panjang yang konsisten, dinamis, dan dapat diperpanjang dari teks.	arxiv	Video
Stylecrafter	NHancing generasi teks-ke-video bergaya dengan adaptor gaya.	arxiv	Video
Tats	Generasi video panjang dengan VQGAN waktu-agnostik dan transformator waktu-sensitif.		Video
Text2Video-Zero	Model difusi teks-ke-gambar adalah generator video nol-shot.	arxiv	Video
TF-T2V	Resep untuk meningkatkan pembuatan teks-ke-video dengan video bebas teks.	arxiv	Video
Tora	Tora: Transformator difusi berorientasi lintasan untuk pembuatan video.	arxiv	Video
Trek-apa pun	Lacak-apa pun adalah alat yang fleksibel dan interaktif untuk pelacakan dan segmentasi objek video, berdasarkan segmen apa pun dan XMEM.	arxiv	Video
Tune-A-Video	Tuning satu-shot dari model difusi gambar untuk pembuatan teks-ke-video.	arxiv	Video
Twelvelabs	AI multimodal yang memahami video seperti manusia.		Video
Univg	Menuju pembuatan video modal terpadu.		Video
Vchitect-2.0	Vchitect-2.0: Transformator paralel untuk meningkatkan model difusi video.		Video
Vgen	Ekosistem pembuatan video holistik untuk pembuatan video yang dibangun pada model difusi.	arxiv	Video
Viewcrafter	ViewCrafter: Model difusi video menjinakkan untuk sintesis novel novel kesetiaan tinggi.	arxiv	Video
Video-Chatgpt	Video-Chatgpt adalah model percakapan video yang mampu menghasilkan percakapan yang bermakna tentang video.	arxiv	Video
Komposer video	Sintesis video komposisi dengan kemampuan pengendalian gerak.	arxiv	Video
Videocrafter1	Model difusi terbuka untuk pembuatan video berkualitas tinggi.	arxiv	Video
Videocrafter2	Mengatasi keterbatasan data untuk model difusi video berkualitas tinggi.	arxiv	Video
Videodrafter	Pembuatan video multi-adegan yang konsisten dengan konten dengan LLM.	arxiv	Video
VideoLevator	Meningkatkan kualitas pembuatan video dengan model difusi teks-ke-gambar serbaguna.	arxiv	Video
Videofactory	Pertukaran perhatian dalam difusi spatiotemporal untuk generasi teks-ke-video.		Video
Videogen	Pendekatan difusi laten yang dipandu referensi untuk generasi teks-ke-video definisi tinggi.	arxiv	Video
VideoLCM	Model konsistensi laten video.	arxiv	Video
Video LDMS	Sejajarkan laten Anda: Sintesis video resolusi tinggi dengan model difusi laten.	arxiv	Video
Video -lava	Belajar representasi visual bersatu dengan penyelarasan sebelum proyeksi.	arxiv	Video
Videomamba	Model ruang status untuk pemahaman video yang efisien.	arxiv	Video
Video-of-Thought	Video-of-Thought: Penalaran video langkah demi langkah dari persepsi ke kognisi.		Video
VideoPoet	Model bahasa besar untuk pembuatan video nol-shot.	arxiv	Video
Gerakan Vispunk	Buat video realistis hanya menggunakan teks.		Video
VisualRWKV	VisualRWKV adalah versi visual yang ditingkatkan dari model bahasa RWKV, memungkinkan RWKV untuk menangani berbagai tugas visual.		Visual
V-JEPA	Video Joint Embedding Arsitektur Prediktif.	arxiv	Video
Walt	Generasi video fotorealistik dengan model difusi.	arxiv	Video
Zeroscope	Teks-ke-Video Zeroscope.		Video

^ Kembali ke Daftar Isi ^

Audio

Sumber	Keterangan	Kertas	Jenis
Academicodec	Model codec audio open source untuk penelitian akademik.		Audio
Amphion	Audio open-source, musik, dan alat pembuatan wicara.	arxiv	Audio
Archisound	Generasi audio menggunakan model difusi, di Pytorch.		Audio
Audiobox	Generasi audio terpadu dengan permintaan bahasa alami.		Audio
Audioedit	Pengeditan audio nol-shot tanpa pengawasan dan berbasis teks menggunakan inversi DDPM.	arxiv	Audio
Audiogen codec	Kompresi rendah 48kHz stereo saraf codec audio untuk audio umum, mengoptimalkan kesetiaan audio?		Audio
Audiogpt	Memahami dan menghasilkan pidato, musik, suara, dan kepala yang berbicara.	arxiv	Audio
Audiolcm	Generasi teks-ke-audio dengan model konsistensi laten.	arxiv	Audio
Audioldm	Generasi teks-ke-audio dengan model difusi laten.	arxiv	Audio
Audioldm 2	Mempelajari generasi audio holistik dengan pretraining yang di-swadaya.	arxiv	Audio
Auffusion	Memanfaatkan kekuatan difusi dan model bahasa besar untuk generasi teks-ke-audio.	arxiv	Audio
Ctag	Generasi Teks-ke-Audio Kreatif melalui Pemrograman Synthesizer.		Audio
Foleycrafter	Foleycrafter: Hidupkan video yang diam dengan suara yang hidup dan disinkronkan.	arxiv	Audio
Magnet	Generasi audio bertopeng menggunakan transformator non-otegresif tunggal.		Audio
Make-an-audio	Generasi teks-ke-audio dengan model difusi yang ditingkatkan cepat.	arxiv	Audio
Make-an-audio 3	Mengubah teks menjadi audio melalui transformator difusi besar berbasis aliran.	arxiv	Audio
Neuralsound	Sintesis suara modal berbasis pembelajaran dengan transfer akustik.	arxiv	Audio
Optimizerai	Suara untuk pencipta, pembuat game, artis, pembuat video.		Audio
Qwen2-audio	Qwen2-Audio Chat & Pretrained Model Bahasa Audio Besar Diusulkan oleh Alibaba Cloud.	arxiv	Audio
Lihat-2-sound	Suara lingkungan-ke-spasial zero-shot.	arxiv	Audio
Badai soundst	Generasi audio paralel yang efisien.	arxiv	Audio
Audio yang stabil	Difusi audio laten yang dikondisikan dengan waktu cepat.		Audio
Audio stabil terbuka	Stabil Audio Open 1.0 menghasilkan audio stereo panjang variabel (hingga 47s) pada 44.1kHz dari permintaan teks.		Audio
Sinkrusi	Syncfusion: Sintesis Foley video-ke-sinkronisasi multimodal.	arxiv	Audio
TANGO	Generasi Teks-ke-Audio Menggunakan Instruksi Tuned LLM dan Model Difusi Laten.		Audio
VTA-LDM	Generasi video-ke-audio dengan penyelarasan tersembunyi.	arxiv	Audio
Wavjourney	Pembuatan audio komposisi dengan model bahasa besar.	arxiv	Audio

^ Kembali ke Daftar Isi ^

Musik

Sumber	Keterangan	Kertas	Jenis
AIVA	Kecerdasan buatan menyusun musik soundtrack emosional.		Musik
Musik Amper	Teknologi Generasi Musik Kustom Didukung oleh Amper.		Musik
Boomy	Buat musik generatif. Bagikan dengan dunia.		Musik
ChatMusician	Membina kemampuan musik intrinsik menjadi LLM.		Musik
Chord2melody	AI Generasi Musik Otomatis.		Musik
Diff-bgm	Model difusi untuk generasi musik latar belakang video.	arxiv	Musik
Fluksmusik	FluxMusic: Generasi teks-ke-musik dengan transformator aliran yang diperbaiki.	arxiv	Musik
GPlableton	Draf skrip untuk memproses respons GPT dan mengirim catatan MIDI ke klip Ableton dengan Abletonosc dan Python-Osc.		Musik
Heymusic.ai	AI Generator Musik		Musik
Gambar ke musik	AI Image to Music Generator adalah alat yang menggunakan kecerdasan buatan untuk mengubah gambar menjadi musik.		Musik
Jen-1	Generasi musik universal yang dipandu teks dengan model difusi omnidirectional.		Musik
kotak juke	Model generatif untuk musik.	arxiv	Musik
ungu	Magenta adalah proyek penelitian yang mengeksplorasi peran pembelajaran mesin dalam proses menciptakan seni dan musik.		Musik
Melodi	Generasi musik saraf yang efisien		Musik
MUBERT	AI Musik Generatif.		Musik
Musenet	Jaringan saraf dalam yang dapat menghasilkan komposisi musik 4 menit dengan 10 instrumen yang berbeda, dan dapat menggabungkan gaya dari negara ke Mozart ke The Beatles.		Musik
Musicgen	Generasi musik yang sederhana dan terkendali.	arxiv	Musik
Musicldm	Meningkatkan kebaruan dalam generasi teks-ke-musik menggunakan strategi mixup beat-synchronous.	arxiv	Musik
MusikLM	Menghasilkan musik dari teks.	arxiv	Musik
Aplikasi Riffusion	Riffusion adalah aplikasi untuk generasi musik real-time dengan difusi yang stabil.		Musik
Sonauto	Sonauto adalah editor musik AI yang mengubah permintaan, lirik, atau melodi menjadi lagu -lagu lengkap dengan gaya apa pun.		Musik
Soundraw	AI Generator Musik untuk Pencipta.		Musik
AI Soundry	Alat AI generatif termasuk paket sampel teks-ke-suara dan tak terbatas.		Musik

^ Kembali ke Daftar Isi ^

Suara bernyanyi

Sumber	Keterangan	Kertas	Jenis
Diffsinger	Bernyanyi sintesis suara melalui mekanisme difusi dangkal.	arxiv	Suara bernyanyi
Pengambilan-voice-voice-conversion-webui	Kerangka kerja SVC yang mudah digunakan berdasarkan VIT.		Suara bernyanyi
So-Vits-SVC	SoftVC Vits menyanyikan konversi suara.		Suara bernyanyi
VI-SVS	Gunakan Vits dan Opencpop untuk mengembangkan sintesis suara bernyanyi; Berbeda dari pengunjung.		Suara bernyanyi

^ Kembali ke Daftar Isi ^

Pidato

Sumber	Keterangan	Kertas	Mesin game	Jenis
Aplikasi	Alat kloning suara tertinggi, dioptimalkan dengan cermat untuk kekuatan yang tak tertandingi, modularitas, dan pengalaman ramah pengguna.			Pidato
Audyo	Teks masuk. Audio out.			Pidato
Kulit pohon	Model audio generatif yang dipicu teks.			Pidato
Bert-Vits2	Backbone Vits2 dengan Bert multibahasa.			Pidato
Chattts	Chattts adalah model bicara generatif untuk dialog harian.			Pidato
Clapspeech	Mempelajari prosodi dari konteks teks dengan pra-pelatihan bahasa-audio kontras.	arxiv		Pidato
Cosyvoice	Model generasi suara besar multi-bahasa, memberikan kesimpulan, pelatihan, dan penerapan kemampuan tumpukan penuh.			Pidato
DEX-TTS	Teks ekspresif berbasis difusi-ke-speech dengan pemodelan gaya pada variabilitas waktu.	arxiv		Pidato
Emosional	Mesin TTS multi-suara dan terkontrol cepat.			Pidato
Faliki	Ubah teks menjadi video dengan suara AI.			Pidato
GLM-4-VOICE	GLM-4-Voice adalah model suara ujung ke ujung yang diluncurkan oleh Zhipu AI. GLM-4-VOICE dapat secara langsung memahami dan menghasilkan pidato Cina dan Inggris, terlibat dalam percakapan suara real-time, dan mengubah atribut seperti emosi, intonasi, kecepatan bicara, dan dialek berdasarkan instruksi pengguna.			Pidato
Glow-tts	Aliran generatif untuk teks-ke-speech melalui pencarian penyelarasan monotonik.	arxiv		Pidato
GPT-Sovits	Konversi suara beberapa shot yang kuat dan webui teks-ke-ucapan.			Pidato
Lovo	Lovo adalah generator suara & teks ke platform ucapan untuk ribuan pencipta.			Pidato
Mahatts	Model pembuatan bicara yang besar open-source.			Pidato
Matcha-tts	Arsitektur TTS cepat dengan pencocokan aliran bersyarat.	arxiv		Pidato
Melotts	Perpustakaan multi-bahasa multi-bahasa berkualitas tinggi oleh myshell.ai. Mendukung bahasa Inggris, Spanyol, Prancis, Cina, Jepang, dan Korea.			Pidato
Metavoice-1b	AI untuk kecerdasan pidato tingkat manusia.			Pidato
NARAKEET	Mudah membuat sulih suara menggunakan teks realistis untuk berbicara.			Pidato
Mini-Omni	Mini-Omni: Model bahasa dapat mendengar, berbicara sambil berpikir dalam streaming. Mini-Omni adalah model bahasa multimodel open-source yang dapat mendengar, berbicara sambil berpikir. Menampilkan input ucapan end-to-end waktu nyata dan streaming kemampuan percakapan output audio.	arxiv		Pidato
Cloning One-Shot-Voice	Satu basis suara kloning suara di UNET-TTS.			Pidato
OpenVoice	Suara instan kloning oleh myshell.			Pidato
Meluap	Menempatkan aliran di atas transduser saraf untuk TT yang lebih baik.			Pidato
Realtimetts	Realtimetts adalah perpustakaan teks-ke-speech (TTS) yang dirancang untuk aplikasi real-time.			Pidato
Sensevoice	Sensevoice adalah model fondasi wicara dengan kemampuan pemahaman ucapan berganda, termasuk pengenalan wicara otomatis (ASR), identifikasi bahasa lisan (LID), pengenalan ucapan emosi (SER), dan deteksi acara audio (AED).			Pidato
Pidato	Memberdayakan model bahasa besar dengan kemampuan percakapan lintas modal intrinsik.	arxiv		Pidato
Pidato-ke-Text-GPT3-Unity	Ini adalah repo yang saya gunakan Whisper dan chatgpt API dari Openai in Unity.		Persatuan	Pidato
Pidato yang stabil	Stabilitas model teks-ke-speech AI.			Pidato
Stabletts	Model TTS generasi berikutnya menggunakan pencocokan aliran dan DIT, terinspirasi oleh difusi stabil 3.			Pidato
Styletts 2	Menuju teks-ke-pidato tingkat manusia melalui difusi gaya dan pelatihan permusuhan dengan model bahasa ucapan besar.	arxiv		Pidato
Tortoise.cpp	Tortoise.cpp: Implementasi GGML dari TTS-TTS.			Pidato
Kura-kura-tts	Sistem TTS multi-suara yang dilatih dengan penekanan pada kualitas.			Pidato
TTS Generation WebUI	TTS Generation WebUI (Bark, MusicGen, Tortoise, RVC, Vocos, Demucs).			Pidato
Vall-e	Model bahasa codec saraf adalah teks nol-shot untuk synthesizer ucapan.	arxiv		Pidato
Vall-e x	Bicara Bahasa Asing dengan Suara Anda Sendiri: Pemodelan Bahasa Cross-Lingual Neural Codec	arxiv		Pidato
Vokode	Vocode adalah perpustakaan open-source untuk membangun aplikasi LLM berbasis suara.			Pidato
Kotak suara	Generasi ucapan universal multibahasa yang dipandu teks pada skala.	arxiv		Pidato
Voicecraft	Pengeditan pidato zero-shot dan teks-ke-pidato di alam liar.			Pidato
Berbisik	Whisper adalah model pengenalan ucapan tujuan umum.			Pidato
Whisperspeech	Sistem teks-ke-ucapan sumber terbuka yang dibangun dengan membalikkan bisikan.			Pidato
Xe-speech	Kerangka kerja pelatihan bersama dari teks-ke-ucapan dan konversi suara non-autoregressive.			Pidato
Xtts	XTTS adalah perpustakaan untuk pembuatan teks-ke-unggun tingkat lanjut.			Pidato
Anda	Menuju TTS multi-speaker zero-shot dan konversi suara nol-shot untuk semua orang.	arxiv		Pidato
ZMM-TTS	Sintesis ucapan multibahasa dan multipeaker zero-shot dikondisikan pada representasi ucapan diskrit yang di-swadaya.	arxiv		Pidato