A era dos aplicativos de IA realmente chegou?
O tema da Conferência Mundial do Baidu deste ano é "As inscrições estão chegando" - no início de novembro, a média de chamadas diárias do grande modelo do Baidu Wenxin ultrapassou 1,5 bilhão, um aumento de cerca de 30 vezes em comparação com os 50 milhões de vezes divulgados pela primeira vez por ano atrás. Robin Li disse: “Esta curva de crescimento acentuada representa a explosão de aplicações de grandes modelos na China nos últimos dois anos”.
Como a forma mais comum de aplicação de IA, os agentes inteligentes estão prestes a atingir um ponto de ruptura, enfatizou Robin Li: "Ele se tornará um novo portador de conteúdo, informações e serviços na era nativa da IA".
Isto porque, “Por um lado, o limite para criar um agente é suficientemente baixo, por outro lado, o limite máximo de um agente é suficientemente alto para criar aplicações muito poderosas. A colaboração de vários agentes também pode resolver problemas mais complexos; ." pergunta."
Robin Li demonstrou quatro tipos diferentes de agentes na reunião, incluindo agentes de empresa, agentes de função, agentes de ferramentas e agentes da indústria. Entre eles, a inteligência oficial da empresa provavelmente substituirá o site oficial e se tornará a interface mais direta para os consumidores.
“Agentes semelhantes a empresas são equivalentes aos sites oficiais de empresas na era da IA. Os agentes semelhantes a empresas têm todos os recursos que os sites oficiais tradicionais possuem, como apresentações de empresas, imagens de produtos e exibições de parâmetros, localizações de lojas offline, etc. os sites tradicionais não têm a capacidade de recomendação proativa, resposta oportuna e recursos de serviço um a um também estão disponíveis no agente inteligente da empresa.
Robin Li também lançou a ferramenta sem código "Miaida" - um software composto por grandes modelos e agentes que podem realizar qualquer ideia sem escrever código, incluindo programação sem código, colaboração multiagente e chamadas em larga escala de vários Esta ferramenta e outras capacidades são “a ferramenta de colaboração multiagente mais complexa da história da humanidade até agora”.
Com a ajuda do "Miaoda", os usuários podem completar a construção de todo o sistema por meio da interação em linguagem natural, podendo também fazer diversas aplicações em qualquer cenário. Com o aprimoramento das capacidades básicas do modelo e a evolução das capacidades técnicas do próprio Miaoda, mais pode. ser feito no futuro, coisas mais complexas, "Isso significa que você não precisa recrutar gerentes de projeto, designers, desenvolvedores, testadores, etc., você pode direcionar vários agentes para concluir tarefas de forma colaborativa." equipe.
Nas palavras de Robin Li, com Miaoda inauguraremos uma “era em que você pode ganhar dinheiro apenas confiando em ideias”.
Depois que os negócios do lado C do Baidu Netdisk foram reclassificados para o Mobile Ecosystem Group (MEG) em setembro e assumidos por Wang Ying, vice-presidente do Baidu e chefe da Biblioteca Baidu e Baidu Netdisk, nesta conferência mundial, Baidu O disco de rede e a biblioteca foram ainda mais integradas.
Wang Ying compartilhou algumas das novas mudanças do Baidu na produção e consumo de conteúdo na conferência. Ela mencionou que a criação e o consumo atuais de conteúdo enfrentam muitos desafios, como ferramentas complicadas, longos ciclos de produção e baixa eficiência de consumo. Para este fim, Baidu Wenku e Netdisk introduziram a tecnologia de IA para quebrar as restrições de ferramentas e limites modais e alcançar uma experiência de conteúdo mais livre e eficiente.
A geração inteligente de PPT do Baidu Wenku, a criação de papel de IA, a produção de livros ilustrados de IA, os recursos de pesquisa de IA e a geração de romances e quadrinhos de IA melhoraram significativamente a eficiência e a qualidade da produção de conteúdo, ao mesmo tempo, em termos de consumo de conteúdo, o Baidu Netdisk foi lançado; Ferramentas simples, como digitalização, ditado simples e resumo de vídeo de IA, facilitam muito o processamento e a compreensão das informações pelos usuários.
Especificamente, em cenários de escritório, o Baidu Wenku fornece PPT inteligente e funções inteligentes de pesquisa e relatório, enquanto o Baidu Netdisk tem funções como notas de audição simples em cenários de aprendizagem, os usuários podem usar os livros de desenho inteligentes e pesquisa de fotos do Baidu Wenku em termos de função de perguntas; O Baidu Netdisk fornece ferramentas auxiliares de aprendizagem, como interpretação de vídeo e vocabulário Panpan em termos de entretenimento, o Baidu Wenku fornece romances inteligentes e quadrinhos inteligentes, e o Baidu Netdisk possui funções como edição de fotos com IA; A integração do Baidu Wenku e do Netdisk amplia os cenários de aplicação dos usuários, concretiza a inteligência e a diversificação do conteúdo e aprimora ainda mais a experiência do usuário.
Função de tela gratuita|Fonte da imagem: Baidu
Além disso, Baidu Wenku e Netdisk lançaram em conjunto um novo sistema operacional de conteúdo - Free Canvas. Este sistema pode ajudar os usuários a concluir todas as tarefas, desde a localização de informações até a edição, geração e compartilhamento. Ele não apenas suporta entrada e saída em formato completo em múltiplas modalidades, mas também permite a utilização de conteúdo em nível de elemento, enriquecendo o grau de criação e compartilhamento. liberdade.
Nas palavras de Robin Li, “A tela livre é um quadro branco universal abençoado pelo grande modelo multimodal de Wenxin”. Estas inovações não só demonstram o enorme potencial da tecnologia de IA no campo dos conteúdos, mas também anunciam mais possibilidades de produção e consumo de conteúdos no futuro.
Na conferência, Shen Dou, vice-presidente executivo do Baidu Group e presidente do Baidu Intelligent Cloud Business Group, compartilhou o progresso mais recente do Baidu Intelligent Cloud em grandes modelos e aplicativos nativos de IA. Shen Dou afirmou que a tecnologia de grandes modelos está a passar da mudança tecnológica para a mudança industrial, redefinindo a forma como as pessoas interagem com o mundo digital e o mundo físico, e tornando-se um elemento-chave para as empresas aumentarem a sua competitividade.
Shen Dou se concentrou na plataforma Qianfan, que é uma plataforma para ajuste fino de modelos grandes e desenvolvimento de aplicativos. Ela fornece uma rica cadeia de ferramentas e reduz significativamente o limite para o desenvolvimento de aplicativos nativos de IA. A plataforma Qianfan não apenas atende aos requisitos altamente personalizáveis, em grande escala, de alta disponibilidade e alta segurança de aplicativos de nível empresarial, mas também libera agentes de fluxo de trabalho. Esta inovação aproveita a compreensão da intenção e os recursos de generalização de grandes modelos para transformar fluxos de trabalho complexos em agentes flexíveis, melhorando significativamente a eficiência empresarial. Por exemplo, a China Pacific Insurance usou a plataforma Qianfan para gerar um agente de "vendas de medalhas de ouro", o que melhorou significativamente a eficiência do serviço e a experiência do usuário na renovação do seguro automóvel.
Baidu Smart Cloud Qianfan|Fonte da imagem: Baidu
Além disso, a plataforma Baige fornece serviços de computação eficientes relacionados a grandes modelos, desde a criação de clusters até o treinamento e inferência de modelos, garantindo um desempenho estável e extremamente rápido. A plataforma resolve problemas importantes na implantação de clusters em larga escala, oferece suporte à operação eficiente e atende às necessidades de potência computacional de diferentes clientes.
Shen Dou também demonstrou casos de aplicação da plataforma Qianfan em vários setores, incluindo medicina de diagnóstico geral, melhorando a precisão da geração de registros médicos por meio de modelos de ajuste fino e economizando tempo dos médicos. A State Grid está explorando aplicações de IA na indústria de energia com base no grande Wenxin; modelo e alcançou resultados notáveis. Além disso, a atualização da plataforma XiLing 4.0 permite gerar imagens humanas digitais em 3D e produzir vídeos profissionais, reduzindo significativamente o custo da produção de vídeos curtos.
O Baidu Intelligent Cloud construiu uma nova infraestrutura de IA por meio das plataformas Qianfan e Baige, promovendo a aplicação de modelos de tecnologia de grande porte em vários setores para melhorar o nível de inteligência e a eficiência das empresas.
Além dos aplicativos, o Baidu também lançou hardware desta vez. Na reunião, Li Ying, vice-presidente do Grupo Baidu e CEO da Xiaodu Technology, lançou "os primeiros óculos de IA nativos equipados com grandes modelos chineses" - óculos Xiaodu AI.
Óculos Xiaodu AI|Fonte da imagem: Baidu
Li Ying disse que, como um dispositivo de perspectiva em primeira pessoa para humanos, a capacidade dos óculos de IA de capturar visão, som, localização e outras informações trará uma extensão sem precedentes dos sentidos das pessoas e também se tornará uma entrada mais eficiente e conveniente para o homem-computador interação.
Baseado no modelo grande Wenxin e no sistema operacional nativo DuerOS AI, o Xiaodu AI pode realizar funções como fotografia em perspectiva em primeira pessoa, fazer perguntas enquanto caminha, reconhecimento de calorias, enciclopédia de reconhecimento de objetos, tradução audiovisual e memorando inteligente.
Ao combinar o dispositivo e a nuvem com modelos grandes, os óculos Xiaodu AI podem ser usados de forma independente ou emparelhados com um APP. Os óculos possuem linhas chinesas integradas e podem responder às perguntas dos usuários em tempo real.
Em termos de hardware, os óculos Xiaodu AI são equipados com um conjunto de quatro microfones para reconhecer sons, um design de alto-falante aberto à prova de vazamentos, uma lente ultra grande angular de 16 megapixels e um algoritmo anti-vibração de IA que podem ser totalmente; carregado em 30 minutos, atingindo 56 horas em standby e mais de 5 horas de uso contínuo. Ouça, a máquina inteira pesa apenas 45 gramas, o que é inferior à média da indústria de 49 gramas.
Espera-se que os óculos Xiaodu AI estejam à venda no primeiro semestre do próximo ano. O preço ainda não foi anunciado, mas a equipe do estande disse que o preço pode ficar em torno de 2.000 yuans.
Robin Li mencionou na reunião que a indústria de IA passou por mudanças significativas nos últimos 24 meses, a mais proeminente das quais é que os grandes modelos basicamente eliminaram o fenômeno das alucinações. Essa mudança faz com que a IA deixe de ser o “absurdo sério” original e se torne utilizável e confiável. O modelo grande é essencialmente um modelo probabilístico e o conteúdo que gera apresenta um certo grau de incerteza. No entanto, ao empregar a tecnologia RAG, grandes modelos são capazes de aproveitar as informações recuperadas para orientar a geração de texto ou respostas, melhorando significativamente a qualidade e a precisão do conteúdo.
Para resolver o problema das alucinações na geração de imagens, o Baidu desenvolveu uma tecnologia no início deste ano - iRAG (Image based RAG), que é uma tecnologia gráfica Vincent aprimorada para recuperação. Antes disso, as imagens geradas pelos sistemas gráficos vicentinos baseados inteiramente em grandes modelos de linguagem eram muitas vezes de baixa qualidade e até mesmo ilógicas. A tecnologia iRAG do Baidu combina os recursos de imagem de bilhões de níveis do Baidu Search e poderosos recursos de modelo básico para gerar uma variedade de imagens ultra-realistas. O efeito geral excede em muito o sistema vicentino nativo e elimina vestígios de geração de máquina.
À medida que a usabilidade das imagens geradas por IA melhorou bastante, seu espaço de aplicação também foi bastante expandido. Por exemplo, num cenário de promoção de marca, poderia ter custado centenas de milhares de yuans para produzir um conjunto de cartazes no passado, mas agora o custo de criação é quase zero. Em suma, o valor comercial do iRAG reflete-se nos aspectos de não ilusão, ultra-realismo, baixo custo e disponibilidade instantânea.
Robin Li na conferência | Fonte da imagem: Baidu
Quando as capacidades básicas do modelo amadurecerem, um período próspero de aplicações de IA chegará. Então, de onde vêm os aplicativos de IA e para onde irão? Existem duas direções principais: uma são os agentes inteligentes e a outra são as aplicações industriais.
No futuro, talvez quando o período próspero das aplicações de IA realmente chegar, a IA possa realmente cumprir a sua missão de “oportunidades ao nível da revolução industrial” e trazer expansão ilimitada da produtividade à economia social.