¿Cuál es la solución al enigma de los 600.000 millones de dólares de la IA? Los ejecutivos de startups discuten los costos y la comercialización de los grandes modelos

Autor：Eve Cole Fecha de actualización：2024-11-16 11:42:01

Beijing News Shell Finance News (Reportero Bai Jinlei y Chen Weicheng) Del 25 al 26 de octubre, se celebró en Beijing la décima conferencia de Internet en tiempo real RTE2024, copatrocinada por la comunidad de desarrolladores de RTE y Shengwang. En la reunión, Jia Yangqing, fundador y director ejecutivo de Lepton AI, Wei Wei, socio de MiniMax, Guoyang Zeng, cofundador y director de tecnología de Wall-Facing Intelligence, y Wang Tiezhen, ingeniero de Hugging Face, discutieron "los $ 600 de AI". problema de los mil millones: empezando por lo básico" La mesa redonda "De las instalaciones a la comercialización" atrajo la atención de la industria. El "problema de los 600 mil millones de dólares de la IA" surgió de un artículo de David Cahn, socio de Sequoia Capital. Creía que la brecha entre las grandes inversiones en infraestructura de IA (inteligencia artificial) y los ingresos reales es demasiado grande. El punto de una burbuja; la IA puede ser la próxima ola tecnológica transformadora, y la caída de los precios de las GPU (unidades de procesamiento de gráficos) en realidad será buena para la innovación y las nuevas empresas a largo plazo, mientras que los inversores se verán afectados.

RTE2024 La décima conferencia de Internet en tiempo real. Imagen | Foto proporcionada por el entrevistado Con respecto a la construcción de infraestructura de IA, Jia Yangqing compartió dos puntos de vista principales: Los modelos del mismo tamaño serán cada vez más capaces, especialmente a través de tecnologías como la destilación y la compresión. El modelo actual LLama 3.2 3B incluso puede. tiene capacidades similares al modelo LLama 70B anterior, excepto por algunas empresas líderes, cada vez más empresas adoptarán "código abierto + ajuste fino" para fabricar modelos de próxima generación, por lo que la aplicación de la arquitectura de código abierto será cada vez más común; . "La ventaja del modelo de código abierto es la ecología y la comunidad. Desde la perspectiva de la aplicación práctica, muchas personas pueden encontrar un modelo de código abierto y ajustarlo, pero no es suficiente resolver todos los problemas con el modelo de código abierto. " Wang Tiezhen dijo: "Veremos en el futuro que con más y más trabajo de infraestructura (infraestructura) y tiempo real (procesamiento en tiempo real), todos deben no solo prestar atención al modelo de código abierto en sí, sino también a la El circuito cerrado de infraestructura y datos del modelo de código abierto, para que el modelo de código abierto pueda funcionar mejor y más rápido, requiere TTS (Text to Speech) y modelos grandes de alguna manera y se pueden colocar más cerca del borde. , puede producir muy buenos resultados. " ¿Cómo deberíamos ver el entrenamiento de modelos grandes? ¿Y el costo del razonamiento? Zeng Guoyang compartió: “Con el avance de la tecnología, la potencia informática definitivamente será cada vez más barata, y la escala de modelos con las mismas capacidades será cada vez más pequeña, pero la optimización del costo de la potencia informática eventualmente se traducirá en la capacitación de modelos más potentes. "Para alcanzar verdaderamente el nivel AGI (inteligencia artificial general), solo podemos sentir que el modelo se está volviendo cada vez más poderoso, y es difícil sentir el cambio en el costo. También mencionó que la inteligencia frente a la pared es un fin". Modelo de extremo a extremo, está muy preocupado por cómo hacerlo. Para que el modelo se ejecute más rápido al final, durante el proceso de implementación real, utilizarán varios métodos de compresión de cuantificación e incluso dispersión para optimizar la sobrecarga de implementación real. Jia Yangqing también señaló que el costo no es una consideración. Consideró que el costo del razonamiento se reducirá a una décima parte del costo actual dentro de un año. Al crear aplicaciones, los empresarios pueden realizar la contabilidad de costos basándose en el costo actual de realizar una aplicación, que es una décima parte del costo actual. Para ver si se puede hacer, incluidos modelos, hardware y después de aplicarse en grandes cantidades, el costo también se puede reducir. Informes recientes indican que OpenAI está disolviendo su equipo de “AGI Readiness” que se centraba en la investigación de seguridad de la IA. ¿Cómo ven los fundadores de las empresas de IA actuales las cuestiones éticas y de seguridad de la IA? Por ejemplo, Jia Yangqing dijo que los aviones actuales tienen muchos requisitos de seguridad, pero que se da más flexibilidad a la fabricación de cohetes. Por lo tanto, especuló que OpenAI puede ser para un mejor desarrollo inicial, o puede ser que la seguridad de la IA no salte de la categoría de seguridad tradicional. La seguridad de datos tradicional y la seguridad en la nube son garantías suficientes. Wang Tiezhen dijo que es relativamente pronto para preocuparse de que la IA reemplace a los humanos, pero la IA ya ha tenido un impacto negativo en algunas industrias, como el impacto de los videos falsos y reales, incluido el impacto en la psicología de los adolescentes, y hay Hay muchas oportunidades para el emprendimiento aquí. En el evento, Shengwang anunció que él y MiniMax están puliendo la primera API en tiempo real (interfaz de programación de aplicaciones de procesamiento en tiempo real) de China. Entonces, ¿cómo deberíamos ver el potencial de aplicación práctica de los modelos multimodales de audio y vídeo? Wei Wei dijo que con el surgimiento de la multimodalidad, los límites de la inteligencia artificial generativa continuarán expandiéndose y acelerando la transformación de esta industria. A partir del proceso de producto y servicio al usuario, Wei Wei descubrió que modelos como texto, voz, música y video pueden ayudar a los creadores de arte, cine, televisión, música y otros campos a mejorar en gran medida su eficiencia y brindarles nuevas ideas y métodos. . Wang Tiezhen también cree que si los efectos de la generación de video pueden exceder los efectos a nivel de película y no es necesario generarlos varias veces, incluso si el precio es alto, algunas personas estarán dispuestas a probarlo.