Em 5 de setembro, Shun Xiangyang, presidente do Conselho de Curadores da Universidade de Ciência e Tecnologia de Hong Kong e acadêmico estrangeiro da Academia Nacional de Engenharia, compartilhou suas oito idéias sobre a implementação da indústria modelo em grande escala na Inclusão de 2024 ·Conferência Bund. Ele acredita que a chegada da era do AI Agent não será um modelo mágico e poderoso que substituirá repentinamente todos os fluxos de trabalho. Envolve a integração contínua de tecnologia, engenharia e mercado e, finalmente, apresenta serviços aos humanos que superam as expectativas.
Pensamento 1: O poder da computação é o limite “Hoje, ao fazer modelos grandes e aprendizado profundo, a primeira e mais importante coisa é ter poder computacional”, disse Shen Xiangyang. Ele destacou que, desde 2010, o poder computacional necessário para modelos grandes aumentou 6 ou 7 vezes. Estabilizou-se nos últimos anos e cresceu aproximadamente 4 vezes por ano. O modelo está ficando cada vez maior, o número de parâmetros está ficando cada vez maior e a demanda por poder de computação também está crescendo em uma direção plana à medida que os parâmetros aumentam. Em sua opinião, o desenvolvimento de toda a indústria de chips de computador mudou da “Lei de Moore” original para a “Lei de Huang”. A Lei de Moore costumava afirmar que o poder da computação dobrava a cada 18 meses. Prevê-se agora que a GPU fará com que o poder de computação da IA duplique ano após ano. “Dói falar de cartas, mas não há emoção se não tivermos cartas. Costumava dizer-se que a pobreza limita a imaginação, mas agora a pobreza pode distorcer a imaginação, porque se não houver cartas, os projectos que pode ser imaginado pode ser diferente." Shen Xiangyang suspirou emocionado. estrada. Pensamento 2: Dados sobre dados Informações públicas mostram que os dados de treinamento do GPT3 atingiram um token (taxa de transferência) de 2 T, e os do GPT4 atingiram cerca de 12 T. De acordo com a previsão de Shun Xiangyang, os dados de treinamento do GPT5 podem chegar a 200 T. Os dados actuais na Internet estão longe de satisfazer as necessidades de formação de modelos futuros, e precisamos de pensar em formas de extrair mais dados. No campo da inteligência artificial, os dados são considerados o "combustível" do modelo, e o modelo precisa aprender e extrair informações úteis desses dados. Portanto, a quantidade, qualidade e diversidade dos dados afetarão diretamente a precisão e o desempenho do modelo. Shen Xiangyang disse que no passado, como o principal acúmulo da Internet, a maior parte dos dados era usada pelo Google para criar mecanismos de busca. No futuro, esses dados seriam usados para treinar grandes modelos. “Os dados acumulados pela Internet nos últimos 40 anos parecem ser apenas para esse momento de IA.” Pensamento 3: O próximo capítulo do grande modelo O que vem a seguir? Shen Xiangyang acredita que o caminho de desenvolvimento futuro da grande indústria de modelos é muito claro e passará do modelo anterior de grande linguagem para o modelo multimodal e para o modelo mundial no futuro. Tecnicamente falando, devemos seguir o caminho da unificação da compreensão e da geração. "O futuro definitivamente se moverá na direção da inteligência incorporada e dos robôs. Uma das formas especiais é a direção autônoma", disse Shen Xiangyang. Na verdade, não existe uma definição padrão de modelo mundial na indústria. O modelo sora lançado pela OpenAI desencadeou discussões sobre o “modelo mundial” na indústria. A OpenAI considera-o a base para modelos que podem compreender e simular o mundo real e acredita que as suas capacidades são um marco importante na obtenção de AGI (inteligência artificial geral). No entanto, Shun Xiangyang acredita que "Embora o modelo Sora seja muito bom, não é tão poderoso. As propriedades físicas nele não podem ser garantidas e não pode ser um modelo mundial." Pensamento 4: Grandes modelos abrangem milhares de indústrias Os grandes modelos podem ser divididos em grandes modelos gerais, grandes modelos da indústria, grandes modelos empresariais e grandes modelos pessoais. Shen Xiangyang destacou que os grandes modelos de uso geral são a base da IA, e o treinamento de um grande modelo de uso geral requer pelo menos 10.000 calorias. Os grandes modelos da indústria são a base para aplicações de domínio e exigem treinamento em nível de quilocalorias; a redescoberta do valor dos dados empresariais requer centenas de calorias de treinamento. Esses modelos grandes têm requisitos extremamente elevados de poder de computação. "A coisa mais emocionante é o modelo pessoal em grande escala. Por exemplo, a Lenovo e a Microsoft estão promovendo AIPC e a Apple Intelligence da Apple está se desenvolvendo na direção da inteligência pessoal", disse Shen Xiangyang. No final de julho deste ano, a China registrou 197 modelos grandes, dos quais 30% são modelos grandes em geral e 70% são modelos grandes da indústria. “Pode-se ver que os grandes modelos da indústria representam a grande maioria, e definitivamente haverá cada vez mais no futuro”, disse Shen Xiangyang. Pensamento 5: agente de IA – da visão à implementação Em maio de 2024, o fundador da Microsoft, Bill Gates, declarou publicamente que o AI Agent não só mudará a maneira como todos interagem com os computadores, mas também subverterá a indústria de software e provocará a maior revolução computacional desde a digitação de comandos até o clique em ícones. Shun Xiangyang concordou com esta opinião. Ele acredita que na era da inteligência artificial, o superaplicativo verdadeiramente incrível é o AI Agent. No processo do Agente de IA, desde a visão até a implementação, é necessário sempre focar nas necessidades, compreender profundamente as capacidades do modelo e construir um fluxo de trabalho com profunda participação da IA. "Se você trabalha em uma empresa hoje, todo o fluxo de trabalho é muito complexo. Embora o ChatGPT seja muito poderoso, está longe de atingir o nível de Agente. Ele alcança apenas um único avanço. Para realmente avançar, ele deve estar integrado ao todo o fluxo de trabalho." ele disse. Pensamento 6: Preste atenção à governança da IA A governança da IA é muito importante. O tema da Conferência Mundial de Inteligência Artificial (WAIC) deste ano é sobre a governação da IA. Vários países têm opiniões muito diferentes sobre este assunto. O desenvolvimento da IA teve um forte impacto nas pessoas, nas empresas, na supervisão governamental, no desenvolvimento social e noutros aspectos, e suscitou preocupações públicas sobre a sua governação em matéria de segurança. “Acho que o próximo ponto importante no desenvolvimento da inteligência artificial. Da perspectiva de vários países ao redor do mundo, é necessário construir inteligência artificial soberana, e por trás da inteligência artificial soberana deve haver uma nuvem soberana para apoiar o desenvolvimento de inteligência artificial soberana. inteligência artificial." Shen Xiangyang expressou. Pensamento 7: Repensar a relação homem-máquina “Quanto do impacto trazido pela GPT é o choque da interação humano-computador e quanto é o desenvolvimento da inteligência das máquinas?” Shen Xiangyang acredita que a relação entre humanos e máquinas deve ser repensada. Ele destacou que a IA proporciona aos humanos um novo contexto para a simbiose com a tecnologia, e a nova forma de interação humano-computador aponta para a integração e o progresso da "IA e IA". IA (Aumento Inteligente) representa um caminho de desenvolvimento de IA centrado no ser humano. Centra-se na utilização da tecnologia para melhorar as capacidades humanas em vez de substituir os humanos, enfatizando a relação colaborativa entre os humanos e a IA. "O colunista do New York Times, John Markoff, mencionou que no desenvolvimento de computadores nas últimas décadas, o verdadeiro vencedor foi a interação humano-computador. Não importa qual seja a tecnologia, o objetivo final deveria ser ajudar os humanos a usar melhor as máquinas. " Shen Xiang Yang disse: "Na era da IA, o aspecto mais essencial da interação humano-computador é o diálogo, assim como o ChatGPT e a Microsoft se tornarão a maior empresa da era da IA, acho que só o tempo o fará. dizer." Pensamento 8: A natureza da inteligência Hoje, o desenvolvimento do GPT está em pleno andamento, mas, na verdade, a compreensão das pessoas sobre a inteligência ainda é muito limitada. Ao contrário da física, tudo, desde o vasto céu estrelado até aos minúsculos quanta, pode ser explicado por uma teoria unificada. Muitas coisas na aprendizagem profunda de hoje são inexplicáveis e não têm robustez. "A essência da inteligência é a batalha centenária entre redes neurais e sistemas de símbolos." Shen Xiangyang disse: "Hoje, embora o desenvolvimento da inteligência artificial ainda esteja em um estágio relativamente inicial, já existem muitas aplicações na indústria, que já existem. são dignos, estou determinado a fazê-lo e confiante no futuro”.