Kapan aplikasi super akan muncul? Ini mungkin kekhawatiran paling umum di industri AI selama setahun terakhir.
Sangat mudah bagi orang untuk membandingkan kecerdasan buatan dengan Internet PC atau Internet seluler. Beberapa tahun setelah kemunculan keduanya, mereka memiliki aplikasi super yang populer. Namun kecerdasan buatan merupakan gelombang teknologi setingkat revolusi industri. Waktu munculnya aplikasi super kecerdasan buatan lebih sebanding dengan waktu munculnya aplikasi super setelah munculnya mesin uap dan listrik.
Pada tahun 1776, mesin uap pertama yang memiliki nilai praktis diproduksi dan menjadi penggerak utama universal, membawa masyarakat manusia ke dalam "zaman uap". Baru pada tahun 1800-an mesin uap banyak digunakan di perkeretaapian dan pelayaran sektor. Hukum kedua termodinamika muncul hampir 100 tahun kemudian; revolusi listrik juga merupakan proses evolusi. Penemuan tenaga listrik menandai klimaks revolusi industri kedua. Pembangkit listrik, lampu listrik, jalur perakitan, dll. semuanya muncul setelah listrik . Format bisnis baru yang berkembang secara bertahap selama beberapa dekade.
Oleh karena itu, aplikasi super di era kecerdasan buatan pasti akan muncul, namun waktunya belum tiba. Pada tahun lalu, industri AI telah mengejar apa yang disebut "aplikasi super", yang tampaknya sangat ingin sukses dengan cepat.
Sebagai teknologi dasar, model berukuran besar tidak secara langsung menghasilkan nilai praktis. Berbagai aplikasi yang dibangun berdasarkan model dasar besar menjadi makna dari keberadaan model tersebut. Bagi para pengembang dan pengusaha aplikasi AI, strategi terbaiknya tentu saja tidak terpaku pada AGI atau "aplikasi super", namun mengambil langkah kecil dan terus melakukan iterasi untuk membuat aplikasi yang sangat berguna.
Baru-baru ini, pada Konferensi Dunia Baidu 2024, Baidu mengumumkan data terbaru untuk Wenxin Big Model-nya: setengah tahun yang lalu, panggilan API harian Wenxin Big Model adalah 200 juta, dan sekarang melebihi 1,5 miliar, meningkat 7,5 kali lipat pada tahun 2024. hanya enam bulan. Hal ini bukan hanya sebuah mikrokosmos dari ledakan aplikasi AI di Tiongkok, namun juga menunjukkan bahwa model-model besar benar-benar menghasilkan nilai praktis untuk penerapannya.
Untuk waktu yang lama, sulit untuk menjual model domestik berukuran besar ke industri lain. Orang dalam industri pernah mengatakan kepada 36Kr, “Baik itu perangkat keras pintar atau agen AI, permintaan di industri ini sangat kuat, namun hanya sedikit orang yang benar-benar bersedia. . Bayar tagihannya karena generasi model yang besar sangat buruk dan ada ilusi di mana-mana”. Dibatasi oleh pengembangan kemampuan multi-modal, pengalaman pengguna awal dari kecerdasan buatan generatif lebih mirip dengan bot percakapan sederhana. Awalnya, pengguna memerlukan pengguna awal, namun karena pengalaman yang biasa-biasa saja, retensinya buruk.
Pada tahun lalu, perubahan terbesar pada model besar adalah “ilusi” pada dasarnya telah dihilangkan dan model dapat digunakan. Model besar pada dasarnya adalah model probabilistik. Dalam pembuatan teks, teks berikutnya yang paling mungkin dibuat secara otomatis, yang menyebabkan AI sering mengalami "halusinasi", yang disebut "omong kosong serius".
Jika Anda ingin mengembangkan aplikasi berdasarkan model besar, Anda harus menghilangkan "ilusi". Industri AI umumnya menggunakan teknologi peningkatan pengambilan (RAG, Retrieval-augmented Generation) untuk menghilangkan ilusi teks yang dihasilkan oleh model besar, sehingga model besar memiliki nilai praktis. Agar praktis, teknologi multimodal juga memerlukan akurasi dan pengendalian untuk memperluas ruang penerapan AI.
Baidu merilis iRAG (RAG berbasis gambar) baru di konferensi dunia ini - teknologi berbasis pengambilan gambar yang ditingkatkan. Pada awal tahun ini, Baidu memutuskan untuk memecahkan masalah generasi multi-modal "ilusi", sehingga gambar Vincent juga dapat menghilangkan ilusi, sehingga mendarat di bidang karya film dan televisi, karya komik, buku komik, poster. produksi dan bidang lainnya.
Misalnya, industri otomotif sangat bergantung pada pemasaran dan seringkali membutuhkan sejumlah besar fotografi berkualitas tinggi untuk menghasilkan gambar yang sempurna, diperlukan banyak sumber daya manusia, finansial, dan material. Dengan menggunakan teknologi iRAG, perusahaan mobil dapat memperoleh foto dengan performa visual luar biasa dengan biaya sangat rendah dan waktu lebih cepat. Bahkan mungkin lebih menakjubkan secara visual.
Saat ini, jalur teknis kecerdasan buatan generatif pada dasarnya dibagi menjadi dua sekolah. Yang pertama adalah sekolah AGI, yang bermimpi mencapai kecerdasan buatan umum dalam beberapa tahun melalui model dasar yang besar; dari kebutuhan dan penggunaan aplikasi. Terapkan model umpan balik untuk berinovasi.
Berdasarkan penelitian berkelanjutan dan pengembangan model dasar berskala besar, Baidu lebih menekankan pada pengembangan berbasis aplikasi. Dapat dipahami bahwa iRAG digunakan karena aplikasi perlu menghasilkan gambar yang akurat. Misalnya, logo perusahaan tidak dapat diubah bentuknya atau terdistorsi warnanya, sehingga memerlukan kemampuan multi-modal yang tepat. Setelah hampir setahun bekerja keras, teknologi ini menjadi praktis. Kemajuan penerapan juga dapat menjadi masukan bagi penelitian dan pengembangan model itu sendiri.
Setelah dua tahun, AI generatif berada dalam periode kritis dalam peralihan arah. 36Kr sebelumnya mengungkapkan bahwa dua startup AI dalam negeri telah menangguhkan pra-pelatihan model-model besar. Dalam dua hari terakhir, perdebatan industri mengenai apakah UU Penskalaan telah mencapai "pengembalian investasi yang semakin berkurang" semakin meningkat.
Faktanya, dalam skala global, perubahan telah dimulai. Raksasa teknologi global seperti OpenAI, Microsoft, dan Google berturut-turut mengundurkan diri dan menerapkan agen cerdas. Pada pertengahan September, peneliti OpenAI Noam Brown mengumumkan di media sosial bahwa ia merekrut insinyur pembelajaran mesin untuk tim peneliti multi-agen baru. CEO dan Ketua Microsoft Nadella secara pribadi mengumumkan kemajuan baru dari AI miliknya, merilis 10 agen intelijen bisnis baru sekaligus, dan membentuk grup untuk debut. Hampir di saat yang bersamaan, beredar kabar bahwa Google juga akan merilis agen cerdas. Tak lama kemudian, Google "secara tidak sengaja" membocorkan "versi pratinjau internal" hasil pengembangan AI terbaru Jarvis, yaitu kecerdasan buatan tipe agen yang dapat melakukannya. menelusuri Internet dan mencari informasi intelijen secara mandiri.
Baidu memimpin tren agen cerdas di Tiongkok. Pada acara Konferensi Dunia Baidu kali ini, agen cerdas menjadi protagonis. Baidu berfokus pada empat jenis agen: tipe perusahaan, tipe peran, tipe alat, dan tipe industri.
Misalnya, agen seperti alat "Kanvas Gratis": berdasarkan akumulasi jangka panjang bisnis perpustakaan Baidu di tahun-tahun awal, dan ditumpangkan pada teknologi kecerdasan buatan generatif, telah mencapai lompatan besar dalam penciptaan.
Pada tahun-tahun awal, kebutuhan masyarakat dalam memanfaatkan perpustakaan adalah untuk mencari dokumen yang sudah jadi. Namun, ketika teknologi kecerdasan buatan generatif muncul, Baidu menemukan bahwa kebutuhan paling mendasar masyarakat bukanlah menemukan dokumen yang sudah jadi, tetapi membuat konten yang lebih sesuai untuk mereka.
Untuk memenuhi kebutuhan tersebut, Baidu mulai memikirkan bagaimana memungkinkan orang untuk berkreasi lebih baik berdasarkan dokumen yang sudah jadi, atau tanpa dasar material, perpustakaan Baidu yang paling awal dibangun kembali. Belakangan, Baidu merilis produk independen, Orange Pian, yang dapat menghasilkan artikel panjang dengan satu klik. Kelahiran Free Canvas juga didasarkan pada logika ini, memungkinkan orang untuk lebih mudah "mengkomunikasikan ide-ide Anda". untuk Mengekspresikan pikiran batin Anda dengan lebih mudah dan akurat.
Robin Li, pendiri Baidu, percaya bahwa “agen adalah bentuk aplikasi AI yang paling umum dan akan mencapai titik ledakannya.” Analogi pembuatan agen adalah membangun situs web di era PC, atau membangun media mandiri akun di era seluler. Perbedaannya adalah agen lebih mirip manusia, lebih cerdas, dan lebih mirip penjualan, layanan pelanggan, dan asisten Anda. Agen dapat menjadi pembawa konten, informasi, dan layanan baru di era AI-native.
CEO OpenAI Sam Altman juga mengungkapkan kemungkinan beralih ke pengembang agen AI ketika menjawab pertanyaan di Reddit bulan lalu. “Kita akan memiliki model yang lebih baik dan lebih baik lagi, namun menurut saya terobosan besar berikutnya adalah agen AI.” Jen-Hsun Huang dari NVIDIA juga mengatakan bahwa NVIDIA akan memiliki 100 juta agen cerdas di masa depan.
Ciri-ciri agen cerdas adalah ambang batasnya cukup rendah dan batas atas cukup tinggi, dan dapat tumbuh menjadi perusahaan yang sangat kuat. Sama seperti Google dan Meta, yang didirikan oleh mahasiswa beberapa tahun lalu, mereka telah berkembang menjadi raksasa teknologi paling kuat di dunia. Sampai batas tertentu, tidak membangun agen cerdas saat ini sama seperti tidak membangun situs web dua puluh tahun lalu atau APP sepuluh tahun lalu.
Hanya sedikit perusahaan Tiongkok yang memainkan peran penting dalam sumber daya manusia, sumber daya, dan pusat teknologi dalam pengembangan kecerdasan buatan global seperti Baidu. Dibalik hal tersebut, hal tersebut tidak terlepas dari keyakinan dan kegigihan sang pendiri terhadap AI. Dalam industri, Robin Li memiliki pepatah klasik, "Ketika saya memiliki 1 yuan, saya akan berinvestasi dalam teknologi; ketika saya memiliki 100 juta, saya akan berinvestasi dalam teknologi; ketika saya memiliki 10 miliar, saya akan tetap berinvestasi dalam teknologi." .
Karya AI Baidu dapat ditelusuri kembali ke lelang terkenal lebih dari sepuluh tahun yang lalu. Suatu hari di bulan Desember 2012, sebuah lelang rahasia diadakan di kaki gunung ski di selatan Danau Tahoe di Nevada, AS. Aset yang dilelang sebenarnya adalah "tiga orang" - Profesor Geoffrey E. Hinton, "ayah baptis AI" dan dua muridnya.
Perwakilan dari Baidu, Google, Microsoft, dan DeepMind sering kali menaikkan tawaran mereka, dan tawaran tersebut melonjak hingga US$44 juta. Pada titik ini, hanya Baidu dan Google yang tersisa di antara peserta. Meskipun Baidu berpartisipasi dalam pelelangan tanpa batas atas, namun pada akhirnya tidak berhasil.
Hal ini juga membuat Robin Li menyadari bahwa ia harus mengembangkan pembelajaran mendalam, mengemudi otonom, dan teknologi lainnya sendiri. Setelah itu, ia mendirikan Baidu America Research Institute dan mulai giat merekrut talenta global , Dario Amodei, dll. Talenta terbaik dari seluruh dunia bergabung.
Dalam sepuluh tahun berikutnya, Baidu memulai periode penelitian mandiri menyeluruh dalam teknologi kecerdasan buatan, mulai dari chip, kerangka kerja, model hingga lapisan aplikasi, mengalahkan semuanya satu per satu. Baidu berturut-turut telah merilis platform terbuka mengemudi otonom Apollo, kerangka pembelajaran mendalam PaddlePaddle menjadi sumber terbuka, dan bahkan merilis model besar Wenxin versi 1.0 pada awal tahun 2019.
Namun, hingga lahirnya ChatGPT, penerapan teknologi AI belum mencapai titik kritis. Hal ini dianggap oleh industri sebagai jurang maut, dan penerapan praktisnya masih jauh.
Kegigihan selalu membuahkan hasil. Pembalikan terjadi pada Maret 2023. Berdasarkan model besar Wenxin versi 3.0, Baidu adalah perusahaan pertama di dunia yang merilis produk yang menjadi tolok ukur ChatGPT, Wenxin Yiyan. Pada titik ini, investasi diam-diam selama sepuluh tahun akhirnya membuahkan hasil.
Dimulai pada paruh kedua tahun 2023, sambil memastikan bahwa model dasar terus memimpin, Baidu tiba-tiba menyadari bahwa persaingan homogen model-model besar telah menyebabkan pemborosan sumber daya dalam jumlah besar. Robin Li telah secara terbuka menyerukan berkali-kali untuk "memutar aplikasi, bukan." model." , dan meminta di dalam perusahaan untuk menjadi perusahaan pertama yang merekonstruksi semua produk menggunakan model besar. Pada Konferensi Dunia 2023, Baidu menunjukkan kepada dunia luar hasil rekonstruksi aplikasi penting seperti pencarian, peta, dan disk jaringan. Pada Konferensi Dunia tahun ini, tema Baidu langsung ditetapkan sebagai "Aplikasi Akan Datang", yang memungkinkan dunia luar untuk melakukannya. lihat model skala besar di Nilai besar yang diciptakan di bidang badan cerdas, aplikasi industri, dan bidang lainnya.
Melihat ke masa lalu, tidak sulit untuk melihat bahwa Baidu telah membuat pilihan yang tepat di setiap titik penting dalam pengembangan kecerdasan buatan global dalam dekade terakhir. Kedepannya, Robin Li berharap AI benar-benar bisa dimanfaatkan oleh setiap orang awam, sehingga setiap orang bisa memiliki kemampuan sebagai seorang programmer.
Pada Konferensi Dunia Baidu, Robin Li juga merilis One More Thing - Miaida, sebuah perangkat lunak tanpa pemrograman kode, kolaborasi multi-agen, dan pemanggilan multi-alat.
Miaida sangat berbeda dari alat bantu pembuatan kode sebelumnya karena tidak mengharuskan pengguna untuk memahami kodenya. Sebaliknya, alat AI sebelumnya, sebagai alat produktivitas, lebih ditujukan untuk memperkuat kemampuan para elit di puncak piramida. Misalnya, di Silicon Valley, pembuatan kode tambahan sangat penting karena terdapat kekurangan insinyur di Amerika Serikat dan upah per jam para insinyur juga sangat mahal. Alat bantu Ini dapat meningkatkan efisiensi dan membuat mereka yang berada di puncak piramida menjadi lebih kuat.
Namun AI harus menjadi sesuatu yang dapat dimanfaatkan oleh semua orang, dibandingkan menjadi paten yang hanya digunakan oleh segelintir orang.
Seiring dengan peningkatan kemampuan model dan agen dasar, Baidu mengintegrasikan kemampuan teknis ini untuk memungkinkan orang biasa, yang tidak dapat memahami sebaris kode pun, memiliki kemampuan pemrogram.
Bayangkan saja, ketika ratusan juta atau lebih dari satu miliar orang memiliki kemampuan ini, maka hal tersebut akan sejalan dengan ruang pasar yang sangat besar, terutama ledakan kreativitas, yang tidak tertandingi oleh teknologi seperti alat bantu pembuat kode. Baidu berharap setiap orang biasa dapat memiliki kemampuan seperti yang ada di puncak piramida, dan maknanya secara alami lebih mendalam.
Robin Li mengatakan selama konferensi: "Baidu tidak akan meluncurkan 'aplikasi super', namun akan terus membantu lebih banyak orang dan lebih banyak perusahaan menciptakan jutaan aplikasi 'sangat berguna'."
Bayangkan saja di era AI, semakin banyak orang dapat belajar menciptakan produk dan layanan baru, dan menggunakan pemrograman bahasa alami, sebuah tindakan kreatif dan ambang batas rendah, untuk mewujudkan beberapa ide liar dan membuat produk berharga yang tak terhitung jumlahnya. inilah inklusivitas teknologi yang sebenarnya.