Universitas Peking, Universitas Stanford, dan Pika Labs berkolaborasi untuk mengembangkan kerangka kerja grafik Vinsensian open source baru yang disebut RPG, yang memanfaatkan kemampuan kuat model bahasa besar multimodal (LLM) untuk berhasil mengatasi dua masalah utama dengan teknologi grafik Vinsensian. Strategi intinya meliputi penguraian teks, membagi ruang gambar, dan menghasilkan gambar sub-wilayah secara mandiri, sehingga mencapai terobosan signifikan dan menyuntikkan vitalitas baru ke dalam bidang grafis Vinsensian. Hal ini menandai kemajuan penting dalam bidang pembuatan gambar dengan kecerdasan buatan, dan diharapkan dapat lebih mendorong penerapan dan pengembangan teknologi ini di masa depan.
Universitas Peking, Stanford dan Pika Labs bersama-sama meluncurkan RPG kerangka grafik Vincent open source baru, yang berhasil memecahkan dua masalah utama grafik Vincent dengan memanfaatkan kemampuan LLM multi-modal. Kerangka kerja ini telah mencapai hasil penelitian yang luar biasa melalui strategi inti seperti menguraikan petunjuk teks, membagi ruang gambar, dan menghasilkan gambar sub-wilayah secara mandiri, membawa terobosan baru dalam bidang grafis Vinsensian.
Munculnya kerangka RPG menandai tahap baru perkembangan teknologi grafik Vinsensian. Fitur open source-nya akan mempercepat iterasi teknologi dan implementasi aplikasi, dan diharapkan memainkan peran penting dalam penciptaan seni, bantuan desain, dan bidang lainnya, sehingga memberikan kemudahan bagi lebih banyak pengembang dan pengguna. Berharap untuk melihat lebih banyak aplikasi inovatif berdasarkan kerangka RPG di masa depan.