Apa solusi untuk teka-teki AI senilai $600 miliar? Para eksekutif startup mendiskusikan biaya model besar dan komersialisasi
Penulis:Eve Cole
Waktu Pembaruan:2024-11-16 11:42:01
Berita Beijing Shell Finance News (Reporter Bai Jinlei dan Chen Weicheng) Dari tanggal 25 hingga 26 Oktober, Konferensi Internet Real-Time ke-10 RTE2024, yang disponsori bersama oleh Komunitas Pengembang RTE dan Shengwang, diadakan di Beijing. Pada pertemuan tersebut, Jia Yangqing, pendiri dan CEO Lepton AI, Wei Wei, mitra MiniMax, Guoyang Zeng, salah satu pendiri dan chief technology officer Wall-Facing Intelligence, dan Wang Tiezhen, insinyur Hugging Face, membahas "AI senilai $600 miliar masalah: mulai dari dasar" Forum meja bundar "Dari Fasilitas hingga Komersialisasi" menarik perhatian industri. "Masalah AI senilai $600 Miliar" bermula dari sebuah artikel oleh David Cahn, partner di Sequoia Capital. Dia percaya bahwa kesenjangan antara investasi besar dalam infrastruktur AI (kecerdasan buatan) dan pendapatan aktual terlalu besar AI mungkin merupakan gelombang teknologi transformatif berikutnya, dan penurunan harga komputasi GPU (unit pemrosesan grafis) sebenarnya akan berdampak baik bagi inovasi jangka panjang dan startup, sementara investor akan dirugikan. RTE2024 Konferensi Internet Waktu Nyata ke-10. Gambar |. Foto disediakan oleh orang yang diwawancarai Mengenai pembangunan infrastruktur AI, Jia Yangqing berbagi dua pandangan inti: Model dengan ukuran yang sama akan menjadi lebih mampu, terutama melalui teknologi seperti distilasi dan kompresi memiliki kemampuan yang mirip dengan model LLama 70B sebelumnya; kecuali untuk beberapa perusahaan terkemuka, semakin banyak perusahaan yang akan mengadopsi "open source + fine tuning" untuk membuat model generasi berikutnya, sehingga penerapan arsitektur open source akan menjadi semakin umum. . “Kelebihan model open source adalah ekologi dan komunitasnya. Dari perspektif penerapan praktis, banyak orang dapat menemukan model open source dan menyempurnakannya, namun itu tidak cukup untuk menyelesaikan semua masalah dengan model open source. " Wang Tiezhen berkata, "Kita akan lihat di masa depan Dengan semakin banyaknya pekerjaan Infra (infrastruktur) dan Realtime (pemrosesan real-time), setiap orang tidak hanya perlu memperhatikan model open source itu sendiri, tetapi juga memperhatikan model sumber terbukanya. infrastruktur dan data loop tertutup dari model open source, sehingga model open source dapat berjalan lebih baik dan lebih cepat Kita membutuhkan TTS (Text to Speech), dan kita juga membutuhkan model yang besar. Jika kita dapat menggabungkannya dengan cara tertentu dan menempatkannya lebih dekat ke pengguna, kita dapat menghasilkan hasil yang sangat baik dan pengembangan model besar. Zeng Guoyang menyampaikan, “Dengan kemajuan teknologi, daya komputasi pasti akan menjadi semakin murah, dan skala model dengan kemampuan yang sama akan semakin kecil, namun optimalisasi biaya daya komputasi pada akhirnya akan menghasilkan pelatihan model yang lebih kuat. . Untuk benar-benar mencapai AGI (Kecerdasan buatan umum), kami hanya dapat merasakan bahwa model ini menjadi semakin kuat, dan sulit untuk merasakan perubahan biaya.” Dia juga menyebutkan bahwa karena kecerdasan yang dihadapi adalah model end-to-end , dia sangat memperhatikan bagaimana melakukannya. Untuk membuat model berjalan lebih cepat pada akhirnya, selama proses penerapan sebenarnya, mereka akan menggunakan berbagai metode kompresi kuantisasi dan bahkan sparsifikasi untuk mengoptimalkan overhead penerapan sebenarnya. Jia Yangqing juga menekankan bahwa biaya bukanlah sebuah pertimbangan. Ia menilai biaya penalaran akan turun hingga sepersepuluh dari biaya saat ini dalam setahun. Saat membangun aplikasi, pengusaha dapat melakukan akuntansi biaya berdasarkan biaya pembuatan aplikasi saat ini, yaitu sepersepuluh dari biaya saat ini. untuk melihat apakah hal itu dapat dilakukan, termasuk model, perangkat keras dan Setelah diterapkan dalam jumlah banyak, biaya juga dapat ditekan. Laporan terbaru menunjukkan bahwa OpenAI membubarkan tim “Kesiapan AGI” yang berfokus pada penelitian keamanan AI. Bagaimana para pendiri perusahaan AI memandang masalah keselamatan dan etika AI? Misalnya, Jia Yangqing mengatakan bahwa pesawat saat ini memiliki banyak persyaratan keselamatan, tetapi pembuatan roket diberikan lebih banyak fleksibilitas. Oleh karena itu, dia berspekulasi bahwa OpenAI mungkin untuk pengembangan awal yang lebih baik, atau mungkin keamanan AI tidak keluar dari kategori keamanan tradisional. Keamanan data tradisional dan keamanan cloud merupakan jaminan yang cukup. Wang Tiezhen mengatakan bahwa masih terlalu dini untuk mengkhawatirkan AI akan menggantikan manusia, namun AI telah memberikan dampak negatif pada beberapa industri, seperti dampak video palsu dan nyata, termasuk dampak terhadap psikologi remaja, dan masih banyak lagi. banyak peluang berwirausaha disini. Pada acara tersebut, Shengwang mengumumkan bahwa mereka dan MiniMax sedang menyempurnakan Realtime API (antarmuka pemrograman aplikasi pemrosesan real-time) pertama di Tiongkok. Jadi, bagaimana kita memandang potensi penerapan praktis model multimodal audio dan video? Wei Wei mengatakan dengan munculnya multi-modalitas, batasan kecerdasan buatan generatif akan terus meluas dan mempercepat transformasi industri ini. Dari proses produk dan layanan pengguna, Wei Wei menemukan bahwa model seperti teks, suara, musik, dan video dapat membantu pembuat konten di bidang seni, film, televisi, musik, dan bidang lainnya meningkatkan efisiensi mereka, dan memberi mereka ide dan metode baru. . Wang Tiezhen juga percaya bahwa jika efek pembuatan video dapat melebihi efek level film dan tidak perlu dibuat berkali-kali, meskipun harganya mahal, beberapa orang akan bersedia mencobanya.