Belakangan ini, bidang kecerdasan buatan telah mengalami kemajuan yang signifikan. Pengembangan model bahasa besar (LLM) yang berkelanjutan membawa kemungkinan baru untuk pemrosesan teks dan video. Artikel ini akan fokus pada "Model Dunia Besar" (LWM) yang baru dikembangkan di Universitas California, Berkeley, dan kemajuan terobosannya dalam pemrosesan video panjang dan teks panjang, dan membandingkannya dengan model terkemuka lainnya untuk mengeksplorasi kelebihan dan keterbatasannya. menunjukkan tren mutakhir teknologi kecerdasan buatan.
Baru-baru ini, peneliti UC Berkeley meluncurkan Large World Model (LWM), yang setara dengan Google Gemini 1.5 Pro dalam memproses video panjang dan rangkaian bahasa. LWM dilatih melalui teknologi RingAttention dan mendukung pemrosesan teks dan video ultra-panjang dengan kinerja luar biasa. Meskipun model seperti Gemini 1.5 dan Sora telah memicu diskusi hangat, model tersebut masih memiliki keterbatasan dan memerlukan penelitian dan eksplorasi lebih lanjut.
Kemunculan LWM menandai kemajuan penting dalam pemrosesan teks dan video ultra-panjang, memberikan arah baru bagi penerapan kecerdasan buatan di masa depan. Namun perkembangan teknologi tidak pernah berhenti dan memerlukan inovasi dan terobosan yang berkelanjutan agar dapat lebih memenuhi kebutuhan masyarakat. Kami menantikan munculnya model-model unggulan seperti LWM di masa depan untuk mendorong kemajuan teknologi kecerdasan buatan.