Editor Downcodes akan membawa Anda memahami teknologi Google ReCapture dan bagaimana teknologi disruptif ini akan mengubah pengeditan video! ReCapture memungkinkan pengguna biasa dengan mudah mewujudkan penyesuaian gerakan kamera tingkat profesional, mendesain ulang bahasa lensa video, dan membawa perubahan revolusioner pada pasca produksi video. Teknologi ini tidak lagi bergantung pada metode representasi perantara 4D tradisional, namun secara cerdik memanfaatkan pengetahuan gerakan model video generatif untuk mengubah pengeditan video menjadi proses konversi video-ke-video, sehingga sangat menyederhanakan proses pengoperasian dan mempertahankan karakteristik video dan kualitas gambar.
Teknologi ReCapture terbaru yang diluncurkan oleh tim riset Google menumbangkan metode pengeditan video tradisional. Inovasi ini memungkinkan pengguna awam dengan mudah menerapkan penyesuaian pergerakan kamera tingkat profesional dan mendesain ulang bahasa lensa untuk video yang sudah diambil.
Dalam pascaproduksi video tradisional, mengubah sudut kamera dari video yang diambil selalu menjadi masalah teknis. Ketika solusi yang ada menangani berbagai jenis konten video, seringkali sulit untuk mempertahankan efek pergerakan kamera yang kompleks dan detail gambar pada saat yang bersamaan. ReCapture mengambil pendekatan yang berbeda dan tidak menggunakan metode representasi perantara 4D tradisional. Sebaliknya, ReCapture secara cerdik menggunakan pengetahuan gerakan yang disimpan dalam model video generatif dan mendefinisikan ulang tugas tersebut sebagai proses konversi video-ke-video melalui Difusi Video Stabil.
Sistem ini menggunakan alur kerja dua tahap. Tahap pertama menghasilkan video jangkar yang merupakan versi keluaran awal dengan posisi kamera baru. Tahap ini dapat dicapai dengan membuat video multi-sudut melalui model difusi seperti CAT3D, atau dengan estimasi kedalaman frame-by-frame dan rendering point cloud. Meskipun versi ini mungkin memiliki beberapa ketidakkonsistenan waktu dan kekurangan visual, versi ini meletakkan dasar untuk Fase Dua.
Tahap kedua menerapkan penyempurnaan video bertopeng, memanfaatkan model video generatif yang dilatih pada rekaman yang ada untuk menciptakan efek gerakan dan perubahan waktu yang realistis. Sistem ini memperkenalkan lapisan LoRA (Adaptasi Peringkat Rendah) temporal untuk mengoptimalkan model sehingga dapat memahami dan mereplikasi karakteristik dinamis spesifik dari video jangkar tanpa melatih ulang seluruh model. Pada saat yang sama, lapisan spasial LoRA memastikan detail gambar dan konten konsisten dengan pergerakan kamera baru. Hal ini memungkinkan model video generatif menyelesaikan operasi seperti memperbesar, menggeser, dan memiringkan sambil mempertahankan karakteristik gerakan video asli.
Meskipun ReCapture telah membuat kemajuan penting dalam pemrosesan video yang ramah pengguna, ReCapture masih dalam tahap penelitian dan masih jauh dari penerapan komersial. Perlu dicatat bahwa meskipun Google memiliki banyak proyek video AI, namun belum memasarkannya, proyek Veo mungkin yang paling dekat dengan penggunaan komersial. Demikian pula, model Movie-Gen yang baru diluncurkan Meta dan Sora OpenAI yang dirilis pada awal tahun belum dikomersialkan. Saat ini, pasar video AI sebagian besar dipimpin oleh startup seperti Runway, yang meluncurkan model Gen-3Alpha terbarunya pada musim panas lalu.
Munculnya teknologi ReCapture menandai arah pengembangan masa depan di bidang pengeditan video. Meskipun masih dalam tahap penelitian, fungsinya yang kuat dan metode pengoperasian yang mudah tidak diragukan lagi akan membawa lebih banyak kemungkinan dalam pembuatan video. Kami menantikan kematangan dini dan penerapan komersial teknologi ini di masa depan, menghadirkan pengalaman pengeditan video yang lebih nyaman dan efisien bagi sebagian besar pengguna.