Selamat datang di masa depan mendongeng bersama Curious George Adventure Creator! Selami dunia Curious George yang menyenangkan dan penuh petualangan dengan cara yang belum pernah ada sebelumnya. Model AI kami yang inovatif, dirancang untuk anak-anak dan penggemar monyet yang menggemaskan, menghidupkan kisah George hanya dengan gambar awal dan tema yang dipilih.
Berikut adalah demo video Cerita kami yang dihasilkan dan disuarakan oleh Aplikasi kami.
The Curious George Adventure Creator memungkinkan Anda membuat episode unik yang menampilkan monyet Afrika yang manis dan penuh rasa ingin tahu, Curious George, dan temannya yang selalu sabar, "Pria Bertopi Kuning". Petualangan George, yang sering kali diisi dengan keingintahuan yang lucu dan masalah yang tidak terduga, diwujudkan melalui teknologi AI kami yang mutakhir.
Pembuatan Episode Mudah : Cukup unggah gambar awal dan pilih tema, dan model AI kami akan menghasilkan episode Curious George yang dipersonalisasi. Saksikan George menjelajah, belajar, dan mengalami kecelakaan menyenangkan yang biasa ia alami, semuanya disesuaikan dengan masukan Anda.
Pembelajaran dan Kegembiraan : Setiap episode menekankan tema pembelajaran, pengampunan, dan rasa ingin tahu. Ini bukan hanya hiburan; ini adalah pengalaman mendidik yang dibungkus dengan kesenangan dan petualangan.
Pilihan Suara :
Seed-Story adalah Multimodal Large Language Model (MLLM) yang mampu menghasilkan cerita panjang multimodal yang terdiri dari teks naratif yang kaya dan koheren, serta gambar yang konsisten dalam karakter dan gaya, berdasarkan SEED-X.
Tahap 1: Tokenisasi & De-tokenisasi Visual
Tahap 2: Pelatihan Urutan Multimodal
Tahap 3: Adaptasi De-tokenizer
Mengingat gambar awal yang sama tetapi teks pembuka yang berbeda, SEED-Story dapat menghasilkan cerita multimodal yang berbeda. Misalnya, memulai dengan referensi teks “pria bertopi kuning” akan menghasilkan gambar yang menyertakan karakter tersebut, sedangkan menghilangkan referensi ini akan menghasilkan arah narasi yang berbeda.
Kloning repo dan instal paket dependen:
sudo apt-get update
sudo apt-get upgrade
git clone https://github.com/krishnaadithya/AIChildrensBookGen.git
cd AIChildrensBookGen
pip install --ignore-installed blinker
pip install -r requirements.txt
# AMD installation
pip install -U xformers --index-url https://download.pytorch.org/whl/rocm6.1
# NVIDIA installation
pip install xformers==0.0.23.post1
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | bash
apt-get install git-lfs
# cd AIChildrensBookGen
cd pretrained
git clone https://huggingface.co/Qwen/Qwen-VL-Chat
git clone https://huggingface.co/TencentARC/SEED-Story
mv SEED-Story/ * ./
git clone https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0
git clone https://krishnavadithya: < hf_token > @huggingface.co/meta-llama/Llama-2-7b-hf
cd ..
touch .project-root
Jalankan skrip berikut untuk memuat ulang model:
python3 src/tools/reload_qwen_vit.py
Rasakan keajaiban dunia Curious George yang belum pernah ada sebelumnya. Mulailah membuat episode Anda sendiri hari ini dan biarkan imajinasi Anda melambung!
Siap memulai petualangan bersama Curious George?
python app.py
Berikut adalah demo video Aplikasi kami.
@article{yang2024seedstory,
title={SEED-Story: Multimodal Long Story Generation with Large Language Model},
author={Shuai Yang and Yuying Ge and Yang Li and Yukang Chen and Yixiao Ge and Ying Shan and Yingcong Chen},
year={2024},
journal={arXiv preprint arXiv:2407.08683},
url={https://arxiv.org/abs/2407.08683},
}