Pada tanggal 5 September, Shun Xiangyang, ketua Dewan Pengawas Universitas Sains dan Teknologi Hong Kong dan akademisi asing dari National Academy of Engineering, berbagi delapan pemikirannya tentang penerapan industri model skala besar pada Inklusi 2024 ·Konferensi Bund. Ia percaya bahwa hadirnya era Agen AI tidak akan menjadi model ajaib dan kuat yang tiba-tiba menggantikan semua alur kerja. Ini melibatkan integrasi berkelanjutan antara teknologi, teknik, dan pasar, dan pada akhirnya menghadirkan layanan kepada manusia yang melebihi ekspektasi.
Pemikiran 1: Kekuatan komputasi adalah ambang batasnya “Saat ini, ketika melakukan model besar dan pembelajaran mendalam, hal pertama dan terpenting adalah memiliki kekuatan komputasi.” Dia menunjukkan bahwa sejak tahun 2010, daya komputasi yang dibutuhkan untuk model besar telah meningkat sebesar 6 atau 7 kali lipat. Ini telah stabil dalam beberapa tahun terakhir dan telah tumbuh sekitar 4 kali lipat setiap tahun. Modelnya semakin besar, jumlah parameternya semakin besar, dan permintaan daya komputasi juga tumbuh dalam arah yang datar seiring dengan meningkatnya parameter. Menurutnya, perkembangan seluruh industri chip komputer telah berubah dari yang semula "Hukum Moore" menjadi "Hukum Huang". Hukum Moore menyatakan bahwa daya komputasi meningkat dua kali lipat setiap 18 bulan. Kini diperkirakan bahwa GPU akan mendorong kekuatan komputasi AI meningkat dua kali lipat dari tahun ke tahun. “Menyakitkan perasaan kalau bicara kartu, tapi tidak ada emosi kalau tidak punya kartu. Dulu ada pepatah yang mengatakan kemiskinan membatasi imajinasi, tapi sekarang kemiskinan bisa memutarbalikkan imajinasi, karena jika tidak ada kartu, proyek-proyek itu bisa dibayangkan mungkin berbeda." Shen Xiangyang menghela nafas dengan emosi. jalan. Pemikiran 2: Data tentang data Informasi publik menunjukkan bahwa data pelatihan GPT3 telah mencapai token (throughput) sebesar 2 T, dan GPT4 telah mencapai sekitar 12 T. Menurut prediksi Shun Xiangyang, data pelatihan GPT5 bisa mencapai 200 T. Data saat ini di Internet masih jauh dari memenuhi kebutuhan pelatihan model di masa depan, dan kita perlu memikirkan cara untuk mengumpulkan lebih banyak data. Di bidang kecerdasan buatan, data dianggap sebagai "bahan bakar" model, dan model perlu mempelajari dan mengekstrak informasi berguna dari data tersebut. Oleh karena itu, kuantitas, kualitas, dan keragaman data akan secara langsung mempengaruhi keakuratan dan performa model. Shen Xiangyang mengatakan bahwa di masa lalu, sebagai akumulasi inti Internet, sebagian besar data digunakan oleh Google untuk membuat mesin pencari. "Data yang dikumpulkan oleh Internet selama 40 tahun terakhir tampaknya hanya untuk momen AI." Pemikiran 3: Bab selanjutnya dari model besar Apa selanjutnya? Shen Xiangyang percaya bahwa jalur pengembangan industri model besar di masa depan sangat jelas, dan akan beralih dari model bahasa besar sebelumnya ke model multi-modal dan menuju model dunia di masa depan. Secara teknis, kita harus mengambil jalur pemersatu pemahaman dan generasi. “Masa depan pasti akan bergerak ke arah perwujudan kecerdasan dan robot. Salah satu bentuk khususnya adalah mengemudi otonom.” Faktanya, tidak ada definisi standar tentang model dunia di industri. Model sora yang diluncurkan oleh OpenAI telah memicu diskusi mengenai "model dunia" di industri. OpenAI menganggapnya sebagai dasar model yang dapat memahami dan mensimulasikan dunia nyata, dan percaya bahwa kemampuannya merupakan tonggak penting dalam mencapai AGI (kecerdasan umum buatan). Namun, Shun Xiangyang percaya bahwa "Meskipun model Sora sangat bagus, namun tidak sekuat itu. Sifat fisik di dalamnya tidak dapat dijamin, dan tidak dapat menjadi model dunia." Pemikiran 4: Model besar menjangkau ribuan industri Model besar dapat dibagi menjadi model besar umum, model besar industri, model besar perusahaan, dan model besar pribadi. Shen Xiangyang menunjukkan bahwa model besar untuk tujuan umum adalah dasar dari AI, dan pelatihan model besar untuk tujuan umum memerlukan setidaknya 10.000 kalori; model besar industri adalah dasar untuk aplikasi domain dan memerlukan pelatihan tingkat kilokalori pada model besar perusahaan penemuan kembali nilai data perusahaan, membutuhkan ratusan kalori pelatihan. Model besar ini memiliki persyaratan daya komputasi yang sangat tinggi. "Hal yang paling menarik adalah model pribadi berskala besar. Misalnya, Lenovo dan Microsoft mempromosikan AIPC dan Apple Intelligence semuanya berkembang ke arah kecerdasan pribadi." Hingga akhir Juli tahun ini, Tiongkok telah mendaftarkan 197 model besar, dimana 30% merupakan model umum besar dan 70% merupakan model industri besar. “Dapat dilihat bahwa model-model besar di industri merupakan mayoritas, dan pasti akan ada lebih banyak lagi di masa depan.” Pemikiran 5: agen ai—dari visi hingga implementasi Pada bulan Mei 2024, pendiri Microsoft Bill Gates secara terbuka menyatakan bahwa Agen AI tidak hanya akan mengubah cara setiap orang berinteraksi dengan komputer, namun juga akan menumbangkan industri perangkat lunak dan membawa revolusi komputasi terbesar sejak mengetik perintah hingga mengklik ikon. Shun Xiangyang setuju dengan pandangan ini. Ia percaya bahwa di era kecerdasan buatan, aplikasi super yang benar-benar menakjubkan adalah AI Agent. Dalam proses Agen AI mulai dari visi hingga implementasi, penting untuk selalu fokus pada kebutuhan, memahami secara mendalam kemampuan model, dan membangun alur kerja dengan partisipasi AI yang mendalam. “Jika Anda bekerja di sebuah perusahaan saat ini, keseluruhan alur kerjanya sangat kompleks. Meskipun ChatGPT sangat kuat, namun masih jauh dari mencapai level Agen. Ini hanya mencapai satu terobosan. Untuk benar-benar maju, ChatGPT harus diintegrasikan ke dalam seluruh alur kerja." katanya. Pemikiran 6: Perhatikan tata kelola AI Tata kelola AI sangat penting. Tema Konferensi Kecerdasan Buatan Dunia (WAIC) tahun ini adalah tentang tata kelola AI. Berbagai negara mempunyai pandangan berbeda mengenai hal ini. Perkembangan AI mempunyai dampak yang kuat terhadap masyarakat, perusahaan, pengawasan pemerintah, pembangunan sosial dan aspek lainnya, serta telah memicu kekhawatiran masyarakat mengenai tata kelola keamanannya. “Saya kira poin penting berikutnya dalam pengembangan kecerdasan buatan. Dari sudut pandang berbagai negara di dunia, perlu dibangun kecerdasan buatan yang berdaulat, dan di balik kecerdasan buatan yang berdaulat harus ada cloud yang berdaulat untuk mendukung pembangunan yang berdaulat. kecerdasan buatan." Shen Xiangyang mengungkapkan. Pemikiran 7: Pikirkan kembali hubungan manusia-mesin “Seberapa besar dampak GPT terhadap guncangan interaksi manusia-komputer, dan seberapa besar perkembangan kecerdasan mesin?” Shen Xiangyang percaya bahwa hubungan antara manusia dan mesin harus dipikirkan ulang. Dia menunjukkan bahwa AI memberi manusia konteks baru untuk bersimbiosis dengan teknologi, dan cara baru interaksi manusia-komputer menunjukkan integrasi dan kemajuan "AI dan IA". IA (Intelligent Augmentation) mewakili jalur pengembangan AI yang berpusat pada manusia. Fokusnya adalah pada penggunaan teknologi untuk meningkatkan kemampuan manusia, bukan menggantikan manusia, dan menekankan hubungan kolaboratif antara manusia dan AI. Kolumnis New York Times John Markoff menyebutkan bahwa dalam perkembangan komputer selama beberapa dekade terakhir, pemenang sebenarnya adalah interaksi manusia-komputer. Apa pun teknologinya, tujuan utamanya adalah membantu manusia menggunakan mesin dengan lebih baik. Shen Xiang Yang berkata, “Di era AI, aspek terpenting dari interaksi manusia-komputer adalah dialog, seperti halnya ChatGPT. Akankah ChatGPT plus Microsoft menjadi perusahaan terhebat di era AI? memberi tahu." Pemikiran 8: Hakikat kecerdasan Saat ini perkembangan GPT sedang booming, namun kenyataannya pemahaman masyarakat terhadap kecerdasan masih sangat terbatas. Tidak seperti fisika, segala sesuatu mulai dari langit berbintang yang luas hingga kuanta kecil dapat dijelaskan dengan teori terpadu; banyak hal dalam pembelajaran mendalam saat ini tidak dapat dijelaskan dan tidak memiliki kekuatan. “Inti dari kecerdasan adalah pertarungan berabad-abad antara jaringan saraf dan sistem simbol.” Shen Xiangyang berkata, “Saat ini, meskipun pengembangan kecerdasan buatan masih dalam tahap yang relatif awal, sudah banyak penerapannya di industri, yang mana layak untuk saya, saya bertekad untuk melakukannya dan saya yakin tentang masa depan.