Apakah era aplikasi AI benar-benar telah tiba?
Tema Konferensi Dunia Baidu tahun ini adalah "Aplikasi akan datang" - pada awal November, rata-rata panggilan harian model besar Baidu Wenxin telah melampaui 1,5 miliar, meningkat sekitar 30 kali lipat dibandingkan dengan 50 juta kali pertama kali diungkapkan dalam setahun. yang lalu. Robin Li berkata, “Kurva pertumbuhan yang curam ini mencerminkan ledakan penerapan model skala besar di Tiongkok dalam dua tahun terakhir.”
Sebagai bentuk penerapan AI yang paling umum, agen cerdas akan mencapai titik puncaknya. Robin Li menekankan, "Ini akan menjadi pembawa konten, informasi, dan layanan baru di era asli AI."
Hal ini karena, “Di satu sisi, ambang batas untuk membuat suatu agen cukup rendah; di sisi lain, batas atas suatu agen cukup tinggi untuk membuat aplikasi yang sangat kuat. Kolaborasi beberapa agen juga dapat memecahkan masalah yang lebih kompleks ." pertanyaan."
Robin Li mendemonstrasikan 4 jenis agen yang berbeda pada pertemuan tersebut, termasuk agen perusahaan, agen peran, agen alat dan agen industri. Diantaranya, intelijen resmi perusahaan kemungkinan akan menggantikan situs resmi dan menjadi antarmuka paling langsung dengan konsumen.
"Agen mirip perusahaan setara dengan situs web resmi perusahaan di era AI. Agen mirip perusahaan memiliki semua kemampuan yang dimiliki situs web resmi tradisional, seperti perkenalan perusahaan, gambar produk dan tampilan parameter, lokasi toko offline, dll. Tapi situs web tradisional tidak memiliki kemampuan untuk secara proaktif. Rekomendasi, respons tepat waktu, dan kemampuan layanan satu lawan satu juga tersedia di agen cerdas perusahaan.”
Robin Li juga merilis alat bebas kode "Miaida" - perangkat lunak yang terdiri dari model dan agen besar yang dapat mewujudkan ide apa pun tanpa menulis kode, termasuk pemrograman bebas kode, kolaborasi multi-agen, dan panggilan skala besar dari berbagai alat ini dan kemampuan lainnya adalah "alat kolaborasi multi-agen paling kompleks dalam sejarah manusia sejauh ini."
Dengan bantuan "Miaoda", pengguna dapat menyelesaikan pembangunan seluruh sistem melalui interaksi bahasa alami, dan juga dapat melakukan berbagai aplikasi dalam skenario apa pun. Dengan peningkatan kemampuan model dasar dan evolusi kemampuan teknis Miaoda sendiri, lebih banyak lagi yang bisa dilakukan di masa depan, hal-hal yang lebih kompleks, "Artinya Anda tidak perlu merekrut manajer proyek, desainer, pengembang, penguji, dll., Anda dapat mengarahkan banyak agen untuk menyelesaikan tugas secara kolaboratif." tim.
Dalam kata-kata Robin Li, dengan Miaoda, kita akan mengantarkan “era di mana Anda dapat menghasilkan uang hanya dengan mengandalkan ide.”
Setelah bisnis sisi-C Baidu Netdisk direklasifikasi ke Mobile Ecosystem Group (MEG) pada bulan September dan diambil alih oleh Wang Ying, Wakil Presiden Baidu dan Kepala Perpustakaan Baidu & Baidu Netdisk, pada konferensi dunia ini, Baidu Disk jaringan dan perpustakaan telah diintegrasikan lebih lanjut.
Wang Ying menyampaikan beberapa perubahan baru Baidu dalam produksi dan konsumsi konten di konferensi tersebut. Ia menyebutkan, pembuatan dan konsumsi konten saat ini menghadapi banyak tantangan, seperti alat yang rumit, siklus produksi yang panjang, dan efisiensi konsumsi yang rendah. Untuk mencapai tujuan ini, Baidu Wenku dan Netdisk telah memperkenalkan teknologi AI untuk mendobrak batasan alat dan batasan modal serta mencapai pengalaman konten yang lebih bebas dan efisien.
Generasi PPT cerdas Baidu Wenku, pembuatan kertas AI, produksi buku bergambar AI, kemampuan pencarian AI, serta pembuatan novel dan komik AI telah meningkatkan efisiensi dan kualitas produksi konten secara signifikan, pada saat yang sama, dalam hal konsumsi konten, Baidu Netdisk telah diluncurkan Alat sederhana seperti pemindaian, dikte sederhana, dan peringkasan video AI sangat memudahkan pengguna dalam memproses dan memahami informasi.
Khususnya, dalam skenario kantor, Baidu Wenku menyediakan fungsi PPT cerdas dan penelitian serta pelaporan cerdas, sedangkan Baidu Netdisk memiliki fungsi seperti catatan mendengarkan sederhana; dalam skenario pembelajaran, pengguna dapat menggunakan buku gambar cerdas dan pencarian foto Baidu Wenku Dalam hal fungsi pertanyaan, Baidu Netdisk menyediakan alat pembelajaran tambahan seperti interpretasi video dan kosakata Panpan dalam hal hiburan, Baidu Wenku menyediakan novel pintar dan komik pintar, dan Baidu Netdisk memiliki fungsi seperti pengeditan foto AI. Integrasi Baidu Wenku dan Netdisk memperluas skenario aplikasi pengguna, mewujudkan kecerdasan dan diversifikasi konten, dan semakin meningkatkan pengalaman pengguna.
Fungsi kanvas gratis|Sumber gambar: Baidu
Selain itu, Baidu Wenku dan Netdisk bersama-sama meluncurkan sistem operasi konten baru, Canvas Gratis. Sistem ini dapat membantu pengguna menyelesaikan semua tugas mulai dari mencari informasi, mengedit, hingga menghasilkan dan berbagi. Sistem ini tidak hanya mendukung input dan output format penuh dalam berbagai modalitas, tetapi juga memungkinkan pemanfaatan konten tingkat elemen, memperkaya tingkat pembuatan dan berbagi kebebasan.
Dalam kata-kata Robin Li, "Kanvas gratis adalah papan tulis universal yang diberkati oleh model besar multimodal Wenxin." Inovasi-inovasi ini tidak hanya menunjukkan potensi besar teknologi AI di bidang konten, namun juga membuka peluang lebih besar bagi produksi dan konsumsi konten di masa depan.
Pada konferensi tersebut, Shen Dou, wakil presiden eksekutif Baidu Group dan presiden Baidu Intelligent Cloud Business Group, berbagi kemajuan terbaru Baidu Intelligent Cloud dalam model besar dan aplikasi asli AI. Shen Dou mengatakan bahwa teknologi model besar bergerak dari perubahan teknologi ke perubahan industri, mendefinisikan ulang cara orang berinteraksi dengan dunia digital dan dunia fisik, dan menjadi elemen kunci bagi perusahaan untuk meningkatkan daya saing mereka.
Shen Dou berfokus pada platform Qianfan, yang merupakan platform untuk penyempurnaan model besar dan pengembangan aplikasi. Platform ini menyediakan rantai alat yang kaya dan secara signifikan menurunkan ambang batas untuk pengembangan aplikasi asli AI. Platform Qianfan tidak hanya memenuhi persyaratan aplikasi tingkat perusahaan yang sangat dapat disesuaikan, berskala besar, ketersediaan tinggi, dan keamanan tinggi, tetapi juga merilis agen alur kerja. Inovasi ini memanfaatkan pemahaman maksud dan kemampuan generalisasi model besar untuk mengubah alur kerja yang kompleks menjadi agen yang fleksibel, sehingga meningkatkan efisiensi perusahaan secara signifikan. Misalnya, China Pacific Insurance menggunakan platform Qianfan untuk menghasilkan agen "penjualan medali emas", yang secara signifikan meningkatkan efisiensi layanan dan pengalaman pengguna dalam pembaruan asuransi mobil.
Baidu Smart Cloud Qianfan|Sumber gambar: Baidu
Selain itu, platform Baige menyediakan layanan komputasi terkait model besar yang efisien, mulai dari pembuatan cluster hingga pelatihan model dan inferensi, memastikan kinerja yang stabil dan sangat cepat. Platform ini memecahkan permasalahan utama dalam penerapan klaster berskala besar, mendukung pengoperasian yang efisien, dan memenuhi kebutuhan daya komputasi berbagai pelanggan.
Shen Dou juga mendemonstrasikan kasus penerapan platform Qianfan di berbagai industri, termasuk pengobatan diagnosis umum yang meningkatkan akurasi pembuatan rekam medis melalui penyempurnaan model dan menghemat waktu dokter. State Grid sedang menjajaki penerapan AI di industri tenaga listrik berbasis skala besar Wenxin model dan telah mencapai hasil yang luar biasa. Selain itu, peningkatan platform XiLing 4.0 memungkinkannya menghasilkan gambar manusia digital 3D dan menghasilkan video profesional, sehingga mengurangi biaya produksi video pendek secara signifikan.
Baidu Intelligent Cloud telah membangun infrastruktur AI baru melalui platform Qianfan dan Baige, mempromosikan penerapan teknologi model besar di berbagai industri untuk meningkatkan tingkat kecerdasan dan efisiensi perusahaan.
Selain aplikasi, Baidu juga merilis hardware kali ini. Pada pertemuan tersebut, Li Ying, wakil presiden Baidu Group dan CEO Xiaodu Technology, merilis "kacamata AI asli pertama yang dilengkapi dengan model besar Tiongkok" - kacamata Xiaodu AI.
Kacamata Xiaodu AI|Sumber gambar: Baidu
Li Ying mengatakan bahwa sebagai perangkat perspektif orang pertama bagi manusia, kemampuan kacamata AI untuk menangkap penglihatan, suara, lokasi, dan informasi lainnya akan memberikan perluasan yang belum pernah terjadi sebelumnya pada indera manusia, dan juga akan menjadi pintu masuk yang lebih efisien dan nyaman ke komputer manusia. interaksi.
Berdasarkan model besar Wenxin dan sistem operasi asli DuerOS AI, Xiaodu AI dapat merealisasikan fungsi-fungsi seperti pengambilan gambar perspektif orang pertama, mengajukan pertanyaan sambil berjalan, pengenalan kalori, ensiklopedia pengenalan objek, terjemahan audio-visual, dan memo cerdas.
Dengan menggabungkan perangkat dan cloud dengan model besar, kacamata Xiaodu AI dapat digunakan secara mandiri atau dipasangkan dengan APP. Kacamata ini memiliki one-liner berbahasa Mandarin dan dapat menjawab pertanyaan pengguna secara real time.
Dari segi perangkat keras, kacamata Xiaodu AI dilengkapi dengan rangkaian empat mikrofon untuk mengenali suara, desain speaker anti bocor terbuka, lensa sudut ultra lebar 16 megapiksel, dan algoritma anti-guncangan AI; mengisi daya dalam 30 menit, mencapai 56 jam siaga, dan lebih dari 5 jam penggunaan terus menerus. Dengar; seluruh mesin berbobot hanya 45 gram, lebih rendah dari rata-rata industri sebesar 49 gram.
Kacamata Xiaodu AI diperkirakan akan mulai dijual pada paruh pertama tahun depan. Harganya belum diumumkan, namun staf stan mengatakan harganya mungkin sekitar 2.000 yuan.
Robin Li menyebutkan pada pertemuan tersebut bahwa industri AI telah mengalami perubahan signifikan dalam 24 bulan terakhir, yang paling menonjol adalah model besar pada dasarnya telah menghilangkan fenomena halusinasi. Perubahan ini menjadikan AI dari yang awalnya "omong kosong" menjadi dapat digunakan dan dipercaya. Model besar pada dasarnya adalah model probabilistik, dan konten yang dihasilkannya memiliki tingkat ketidakpastian tertentu. Namun, dengan menggunakan teknologi RAG, model berukuran besar dapat memanfaatkan informasi yang diambil untuk memandu pembuatan teks atau jawaban, sehingga secara signifikan meningkatkan kualitas dan keakuratan konten.
Untuk mengatasi masalah halusinasi dalam pembuatan gambar, Baidu mengembangkan teknologi pada awal tahun ini - iRAG (Image based RAG), yang merupakan teknologi grafik Vincent yang disempurnakan dengan pengambilan. Sebelumnya, gambar yang dihasilkan oleh sistem grafik Vinsensian yang seluruhnya didasarkan pada model bahasa besar sering kali berkualitas buruk dan bahkan tidak logis. Teknologi iRAG Baidu menggabungkan sumber daya gambar tingkat miliaran Baidu Search dan kemampuan model dasar yang kuat untuk menghasilkan berbagai gambar ultra-realistis. Efek keseluruhannya jauh melebihi sistem Vincentian asli dan menghilangkan jejak pembuatan mesin.
Seiring dengan meningkatnya kegunaan gambar yang dihasilkan AI, ruang penerapannya pun semakin diperluas. Misalnya, dalam skenario promosi merek, di masa lalu mungkin diperlukan biaya ratusan ribu yuan untuk memproduksi satu set poster, namun sekarang biaya pembuatannya hampir nol. Singkatnya, nilai komersial iRAG tercermin dalam aspek tanpa ilusi, ultra-realisme, biaya rendah, dan ketersediaan instan.
Robin Li di konferensi |. Sumber gambar: Baidu
Ketika kemampuan model dasar sudah matang, masa kejayaan penerapan AI akan datang. Jadi, dari mana asal aplikasi AI dan ke mana arahnya? Ada dua arah utama: satu adalah agen cerdas, dan yang lainnya adalah aplikasi industri.
Di masa depan, mungkin ketika masa kejayaan penerapan AI benar-benar tiba, AI dapat benar-benar mewujudkan misinya yaitu “peluang tingkat revolusi industri” dan membawa perluasan produktivitas tanpa batas ke dalam ekonomi sosial.