Peluncuran besar-besaran Gemini 2.0 oleh Google menandai langkah penting bagi kecerdasan buatan untuk memasuki era agen. Peningkatan ini tidak hanya meningkatkan kinerja secara signifikan, namun juga mencapai terobosan dalam kemampuan multimodal dan penggunaan alat asli. Gemini 2.0 mendukung berbagai bentuk masukan seperti teks, gambar, video, audio, dll., dan mendukung fungsi keluaran multi-modal seperti pembuatan gambar asli dan text-to-speech untuk pertama kalinya, yang bertujuan untuk menjadikan informasi lebih berguna. Google berencana untuk segera mengintegrasikan Gemini 2.0 ke dalam ekosistem produknya, seperti Google Penelusuran dan fitur "Penelitian Mendalam" yang baru diluncurkan, untuk lebih meningkatkan pengalaman pengguna.
Google hari ini mengumumkan peluncuran model kecerdasan buatan generasi terbaru Gemini 2.0, model AI perusahaan yang paling kuat hingga saat ini. Peningkatan besar-besaran ini tidak hanya meningkatkan kinerja secara signifikan, namun juga menandai langkah penting bagi kecerdasan buatan untuk memasuki era agen.
Menurut Sundar Pichai, CEO Google dan Alphabet, Gemini 2.0 telah mencapai terobosan dalam kemampuan multimodal dan penggunaan alat asli. Model baru ini tidak hanya dapat memahami dan memproses berbagai bentuk masukan seperti teks, gambar, video, dan audio, namun juga mendukung fungsi keluaran multi-modal seperti pembuatan gambar asli dan text-to-speech untuk pertama kalinya.
“Jika Gemini 1.0 adalah tentang mengatur dan memahami informasi, maka Gemini 2.0 adalah tentang menjadikan informasi lebih berguna,” kata Pichai. Saat ini, model tersebut terbuka untuk pengembang dan penguji tepercaya.
Inovasi teknologi dan peningkatan kinerjaDemis Hassabis, CEO Google DeepMind, mengungkapkan bahwa rilisan gelombang pertama adalah versi eksperimental dari Gemini 2.0 Flash. Versi ini secara signifikan meningkatkan kinerja dengan tetap mempertahankan latensi rendah. Khususnya, Flash 2.0 bahkan mengungguli 1.5 Pro dalam benchmark utama, dan dua kali lebih responsif.
Model baru ini berjalan pada platform perangkat keras TPU Trillium generasi keenam Google, yang juga merupakan infrastruktur yang mendukung 100% pelatihan dan inferensi Gemini2.0. Saat ini, platform ini terbuka untuk pelanggan.
Aplikasi praktis dan integrasi produkGoogle berencana untuk segera mengintegrasikan Gemini 2.0 ke dalam ekosistem produknya. Mulai saat ini, pengguna Gemini di seluruh dunia dapat memilih untuk menggunakan versi eksperimental 2.0 Flash melalui versi web, dan versi aplikasi seluler juga akan segera diluncurkan. Selain itu, fitur ikhtisar AI Google Penelusuran juga akan mengintegrasikan kemampuan penalaran tingkat lanjut 2.0 untuk memecahkan topik yang lebih kompleks dan masalah multi-langkah.
Perlu dicatat bahwa Google juga telah meluncurkan fitur baru yang disebut "Penelitian Mendalam", yang akan tersedia di Gemini Advanced dan dapat bertindak sebagai asisten peneliti untuk mengeksplorasi topik yang kompleks dan secara otomatis menghasilkan laporan.
Jelajahi masa depan agen AIDalam rilis ini, Google juga mendemonstrasikan beberapa proyek prototipe penelitian yang dibangun di atas Gemini 2.0:
Project Astra: Ini adalah prototipe asisten AI universal dengan kemampuan percakapan multi-bahasa, kemampuan menggunakan alat seperti pencarian Google, Lens, dan Maps, serta fungsi memori percakapan hingga 10 menit. Project Mariner: Ini adalah prototipe interaksi browser yang dapat memahami dan bernalar tentang berbagai jenis informasi di web dan membantu pengguna dalam menyelesaikan tugas melalui ekstensi Chrome. Pada benchmark WebVoyager, ini mencapai 83,5% hasil terbaik. Jules: Ini adalah agen kode AI untuk pengembang yang dapat diintegrasikan langsung ke alur kerja GitHub untuk membantu pemecahan masalah dan pelaksanaan tugas. Keselamatan dan Pembangunan yang Bertanggung JawabSaat mendorong inovasi ini, Google memberikan penekanan khusus pada pentingnya keamanan dan pengembangan yang bertanggung jawab. Perusahaan telah mengambil beberapa langkah untuk memastikan keamanan penggunaan agen AI:
Bekerja sama dengan Komite Tanggung Jawab dan Keselamatan (RSC) untuk mengidentifikasi dan memahami potensi risiko Meningkatkan metode tim merah yang dibantu AI untuk meningkatkan kemampuan penilaian dan mitigasi risiko Membangun mekanisme penilaian dan pelatihan keamanan untuk input dan output multi-modal Tambahkan perlindungan terhadap perintah jahat di Proyek Pandangan masa depan Mekanisme MarinerPeluncuran Gemini 2.0 dianggap sebagai tonggak penting dalam pengembangan AI. Dengan menggabungkan kemampuan multimoda tingkat lanjut dengan kemampuan agen, Google menunjukkan ambisinya dalam memajukan teknologi AI. Ketika fitur-fitur baru ini diintegrasikan secara bertahap ke dalam berbagai produk, pengguna akan dapat merasakan layanan asisten AI yang lebih cerdas dan praktis.
Namun Google juga mengakui bahwa teknologi agen AI masih dalam tahap awal dan perlu terus mengumpulkan masukan melalui kerja sama dengan penguji tepercaya untuk terus meningkatkan dan menyempurnakan teknologi ini. Perusahaan berkomitmen untuk terus memajukan pengembangan teknologi AI secara bertanggung jawab, memastikan standar keselamatan dan etika sambil menjajaki kemungkinan-kemungkinan baru.
Untuk informasi lebih lanjut, silakan lihat: https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#ai-game-agents
Secara keseluruhan, peluncuran Gemini 2.0 menunjukkan kekuatan Google yang kuat di bidang kecerdasan buatan dan pandangan ke depan untuk pengembangan di masa depan. Hal ini juga menunjukkan bahwa teknologi kecerdasan buatan akan semakin menembus kehidupan masyarakat dan menghadirkan layanan yang lebih nyaman dan cerdas bagi masyarakat. Namun pada saat yang sama, permasalahan keselamatan dan etika masih memerlukan perhatian dan penyelesaian yang berkelanjutan.