Os pedidos de patentes de inteligência artificial generativa do Baidu estão entre os 10 melhores do mundo, e as dez principais invenções tecnológicas de ponta do Baidu em 2024 são lançadas

Autor：Eve Cole Data da Última Atualização：2024-11-23 20:07:54

Em 22 de outubro de 2024, a conferência "2024 Baidu Top Ten Science and Technology Frontier Inventions" com o tema "Invenções de fronteira, liderando novas mudanças na indústria de IA" foi realizada em Pequim. Entre as dez principais invenções de ponta deste ano, os grandes modelos tornaram-se um importante ponto de partida para a inovação industrial e para desbloquear novas aplicações nativas de IA que estão a ser integradas em todos os aspectos da produção e da vida.

O diretor de tecnologia (CTO) do Baidu, Wang Haifeng, disse que as invenções de ponta não apenas apoiam o Baidu para melhorar seus próprios produtos, efeitos de negócios e eficiência, mas também reestruturam nativamente a IA dos produtos do Baidu e contribuem para o empoderamento de milhares de indústrias com inteligência artificial. O Baidu divulga as dez principais invenções. Por um lado, incentiva mais inovação e criação, elogiando essas conquistas de ponta que lideram a inovação industrial; por outro lado, incentiva a indústria a aplicar mais dessas conquistas e a acelerar o processo de industrialização; .

Cui Lingling, gerente geral do Departamento de Assuntos de Patentes do Grupo Baidu, lançou as "Dez principais invenções de fronteira tecnológica do Baidu em 2024": as invenções patenteadas de ponta do Baidu no campo da inteligência artificial, cobrindo avanços completos, desde algoritmos básicos até aplicações cenários. De acordo com o "Relatório de Análise de Tecnologia de Patentes de Inteligência Artificial de Nova Geração" divulgado pelo Centro Nacional de Pesquisa de Desenvolvimento de Segurança da Informação Industrial e pelo Centro de Propriedade Intelectual Eletrônica do Ministério da Indústria e Tecnologia da Informação em abril deste ano, a partir do final de 2023, Baidu solicitou 19.308 patentes em todo o campo da inteligência artificial e concedeu 9.260 patentes. O Baidu ficou em primeiro lugar na China por seis anos consecutivos no campo de IA de nova geração, com modelos grandes como núcleo, o Baidu solicitou 1.432 patentes e autorizou 651, tornando-se líder em inovação tecnológica e layout de patentes. De acordo com os insights do cenário de patentes de inteligência artificial generativa divulgados pela organização de banco de dados de patentes IFIclaims, os pedidos de patentes de inteligência artificial generativa do Baidu estão entre os 10 principais do mundo. É o único assunto de inovação chinês a entrar na lista, e a tecnologia patenteada cobre o texto. , imagem, voz e vídeo Na grande área básica, tornou-se uma das quatro empresas do mundo com layout abrangente nessas quatro áreas.

Em 12 de novembro, o Baidu World 2024 com o tema "As inscrições estão aqui" será realizado em Xangai. Como conferência de tecnologia de alto nível do ano, o Baidu também divulgará seus resultados mais recentes, trazendo mais uma vez avanços tecnológicos e lançamentos de produtos atraentes.

As dez principais invenções tecnológicas de ponta do Baidu em 2024 são as seguintes:

1. Tecnologia de agente baseada em grandes modelos generativos

Esta tecnologia de invenção introduz de forma inovadora um modelo de pensamento, permitindo ao agente ter múltiplas capacidades, como planejamento de tarefas, invocação de ferramentas, aprimoramento de conhecimento e evolução reflexiva. Através do design sistemático e da otimização direcional das capacidades principais, pode apoiar a construção e implantação em larga escala de agentes em diferentes cenários de aplicação a baixo custo, através da construção de capacidades de simulação em larga escala, pode acelerar a construção e distribuição de agentes; Este sistema técnico tem sido usado com sucesso em muitos cenários importantes, como Plataforma Inteligente Wenxin, Agente Inteligente Comercial, Código Rápido Wenxin, etc., o que melhorou significativamente a eficiência de pesquisa e desenvolvimento de agentes inteligentes e reduziu o limite de pesquisa e desenvolvimento. Entre eles, os agentes comerciais usam tecnologia de colaboração multimodelo de planejamento + especialista e tecnologia de simulação em grande escala para melhorar sua capacidade de refletir, evoluir e usar ferramentas, e construir capacidades de marketing de IA Wenxin Kuaicode depende de recomendação de código e sistemas de agente para integração; DevOps tradicional A combinação orgânica de cadeias de ferramentas promove a exploração e implementação aprofundadas da programação colaborativa de pares homem-máquina.

2. Tecnologia de coevolução multimodelo baseada em uma estrutura de treinamento eficiente de modelos grandes

Esta tecnologia inventiva supera uma série de problemas difíceis tanto do ponto de vista de engenharia quanto de algoritmos. Em termos de arquitetura de engenharia, avanços inovadores abrangentes incluem estratégias paralelas híbridas, eficiência de comunicação e otimização de computação e armazenamento, que melhoram significativamente o desempenho de treinamento de grandes modelos de linguagem e apoiam o treinamento eficiente e estável de toda a série de modelos de Wenxin em todo o processo. Em termos de estratégias de algoritmos, desenvolvemos tecnologia de pré-treinamento para colaboração de modelos grandes e pequenos, superando o problema técnico de difícil herança de conhecimento entre modelos, mudando o paradigma de treinamento de modelos tradicionais e reduzindo o custo de treinamento de novos modelos. Com base nesta invenção, foram construídas barreiras técnicas para modelos de vários tamanhos, o que aumentou o rendimento de treinamento do grande modelo de Wenxin em 4,1 vezes no ano passado, apoiando Wenxin Yiyan para atender com eficiência uma ampla gama de empresas com diferentes necessidades e capacitando milhares de indústrias.

3. Sistema inteligente que integra criação e compilação de conteúdo multimodal com base em grandes modelos e tecnologia de aprimoramento de recuperação de conhecimento

A tecnologia desta invenção utiliza de forma abrangente tecnologias como aprimoramento de conhecimento, análise de conteúdo de múltiplas fontes, edição integrada e léxico aprimorado de recuperação para resolver problemas como fraca qualidade de produção de artigos longos profissionais e conteúdo multimodal, incapacidade de compartilhar contêineres quando criação e edição e baixa precisão do corpo principal do léxico. A recuperação de imagens textuais aprimoradas visa processar imagens de referência de forma adaptativa por meio do julgamento inteligente das necessidades do usuário. O sistema de geração de imagens de modo misto melhora significativamente a consistência do corpo principal da imagem, compensando efetivamente as deficiências da descrição imprecisa do conteúdo de cauda longa. . Globalmente O efeito excede em muito o sistema nativo de Wenshengtu. Baidu Wenku obteve grandes conquistas na geração de relatórios de pesquisa do setor, apresentações, mapas mentais e histórias em quadrinhos em tempo real com base nas instruções do usuário e no conteúdo carregado, e oferece suporte a tarefas complexas, como edição completa, conversão multimodal e geral/ desenhos personalizados. Melhoria significativa de desempenho. Em agosto de 2024, Yuehu Data da Aurora divulgou um relatório mostrando que a participação de mercado de PPT inteligente do Baidu Wenku atingiu 80%. Nos últimos três meses, a taxa composta de crescimento da escala do usuário atingiu 23% e a taxa de crescimento excede em muito o nível da indústria. .

4. Suporta posicionamento de direção autônoma em grande escala e tecnologia de geração de mapas em nível de faixa

Esta tecnologia inventiva rompe os problemas de eficiência e custo do modelo tradicional, reduz o custo de produção de mapas em 95% e tem uma quilometragem rodoviária ao nível da faixa de mais de 3,6 milhões de quilómetros, alcançando cobertura total de mais de 41.000 áreas urbanas e rurais. cidades de todo o país. A tecnologia de posicionamento de alta precisão para direção autônoma baseada na fusão de sensores multimodais, construída posteriormente com base em dados de mapas, tem uma precisão de nível centimétrico, o que melhora muito a produção em massa e reduz o volume do pacote de mapas do qual depende o posicionamento do lado do veículo. 97,5%, e a confiabilidade atinge 99,9999%, apoiando totalmente a atual operação em grande escala de condução totalmente autônoma de Luobo Kuaipao e realizando a condução totalmente autônoma em vários cenários complexos e difíceis, como sob viadutos, estradas multicamadas e túneis.

5. Mecanismo de memória personalizado para inteligência de modelos grandes

Esta tecnologia de invenção propõe de forma inovadora um conjunto abrangente de mecanismos de memória, abrangendo cinco módulos de processamento, armazenamento, gerenciamento, acionamento e utilização de memória, dando aos grandes modelos capacidades de memória personalizadas. O processamento de memória baseia-se no mecanismo do hipocampo humano para obter uma compreensão profunda e processamento preciso das informações do usuário em todos os cenários. O gerenciamento de memória suporta adições, exclusões e modificações ativas dos usuários e as adições, exclusões e modificações automáticas do sistema, garantindo real- atualizações de tempo e precisão do acionamento e utilização de memória do banco de memória. Ajudar grandes modelos a produzir respostas mais antropomórficas e personalizadas por meio da geração especulativa de memórias relevantes. Esta tecnologia de invenção tem sido amplamente utilizada em cenários como assistentes inteligentes de IA e humanos digitais.

6. Sistema de modelagem humana digital super realista, condução e geração baseado em grandes modelos

Esta tecnologia inventiva propõe um conjunto completo de soluções super-realistas de modelagem humana digital, condução e geração. Para pessoas digitais reais, desenvolvemos modelagem de retratos baseada em dados, condução cross-modal e modelos de geração de vídeo de retratos grandes para obter produção de conteúdo humano digital natural e realista. Apoiamos exclusivamente a clonagem de retratos ao vivo em cenas de ação e oclusão em grande escala, e. A primeira sala de transmissão ao vivo com controle inteligente de corpo inteiro foi implementada. Para seres humanos digitais 3D hiper-realistas, desenvolvemos tecnologias de migração modal e de colaboração multiagente baseadas no grande modelo Wenxin, alcançando uma produção em nível minucioso de imagens humanas digitais hiper-realistas e conteúdo operacional que são comparáveis a sucessos de bilheteria de filmes e televisão e Jogos 3A. A tecnologia da presente invenção tem sido amplamente utilizada em muitos produtos humanos digitais 3D e de pessoas reais, como transmissão humana digital ao vivo, produção de vídeo e corpos inteligentes.

7. Sistema generativo de recuperação comercial baseado em grandes modelos

Esta tecnologia de invenção mudou o processo tradicional de "classificação de recuperação de índice", nivelou o funil do sistema, reduziu a perda de informações e codificou informações de negócios em parâmetros de modelo, criando tarefas de aprendizagem de índice para obter "modelo como índice" e utilizar o poder de grandes modelos. Capacidades de compreensão e raciocínio, realizando "geração e recuperação", o novo paradigma melhora significativamente a eficiência da orientação do sistema em 120%. O projeto envolvido nesta invenção foi o primeiro a ser implementado na indústria, realizando aplicação industrial em larga escala. O grande modelo generativo foi combinado com cenários de pesquisa comercial para alcançar múltiplas inovações tecnológicas. A riqueza criativa aumentou 37 vezes, a qualidade criativa. aumentou em 92% e foram alcançados benefícios comerciais significativos e amplo escopo.

8. Tecnologia de volante de dados de modelo grande

Essa tecnologia inventada identifica automaticamente defeitos do modelo e sintetiza com eficiência dados de treinamento diversos e de alta qualidade, integrando informações de diversas fontes e formulários, como feedback do usuário, feedback de execução e feedback auto-supervisionado. Ao mesmo tempo, o método de aprendizagem por reforço combinado com feedback de múltiplas fontes melhora significativamente o efeito de treinamento do modelo. Esta tecnologia inovadora constrói um volante de dados que pode melhorar continuamente, rompendo efetivamente o gargalo de dados de grandes modelos, reduzindo os custos de aquisição de dados, melhorando a adaptabilidade e robustez de grandes modelos e melhorando o desempenho do modelo em diferentes cenários de tarefas. a evolução contínua de grandes modelos.

9. Tecnologia de inferência eficiente de modelo grande

A tecnologia de raciocínio eficiente proposta por esta tecnologia de invenção, a camada de modelo subjacente é baseada no Flying Paddle Framework Na direção da arquitetura de raciocínio, ela continua a inovar na direção do PrefixCaching, Lookahead, PagedAttention, separação PD, etc. e combina com eficiência várias tecnologias para melhorar significativamente o rendimento e o desempenho do modelo. Em termos de compressão de modelos grandes, a empresa adota tecnologia de quantização sem perdas de modelos grandes e ativa métodos como suavização de segmentação adaptativa e rearranjo de ligação de peso. É a primeira na indústria a obter compressão eficiente sem perdas de modelos grandes de dezenas de bilhões e centenas de. bilhões. Esta invenção suporta uma variedade de métodos de compressão de modelos grandes e aceleração de inferência e tem sido usada em negócios principais, como a plataforma de modelos grandes Baidu Intelligent Cloud Qianfan para reduzir o consumo de recursos de inferência de modelos, economizar custos de implantação de grandes modelos em mais de 50% e melhorar o desempenho e o rendimento do modelo Melhorado em 3 a 5 vezes.

10. Sistema de geração de recuperação orientado pelo feedback dos dados do usuário

O sistema de geração de recuperação proposto por esta tecnologia inventiva pode combinar sinais de feedback do comportamento do usuário para alcançar um rápido auto-reforço. Alinhar diretamente as preferências do usuário por meio de modelagem de satisfação e aprendizado por reforço e usar o feedback do usuário para desencadear uma rápida reflexão do sistema, resolvendo os problemas de baixa eficiência de feedback de especialistas e dificuldade na modelagem de preferências do usuário em aplicações de dados tradicionais. O sistema de geração de recuperação baseado nesta estrutura cobriu 18% do tráfego de pesquisa e é amplamente utilizado em texto, vídeo, imagem e outros cenários de pesquisa. As características em grande escala e recicláveis do feedback de vários usuários permitem que o sistema se adapte rapidamente às mudanças nos dados, produtos e ambiente, ajude o sistema a buscar automaticamente a otimização e acelere a evolução do sistema para um estado ideal. competitividade do mercado.