Cui Lingling, General Manager der Abteilung für Patentangelegenheiten der Baidu Group, veröffentlichte die „Baidu Top Ten Technological Frontier Inventions in 2024“: Baidus bahnbrechende patentierte Erfindungen im Bereich der künstlichen Intelligenz, die umfassende Durchbrüche von grundlegenden Algorithmen bis hin zur Anwendung abdecken Szenarien. Laut dem „New Generation Artificial Intelligence Patent Technology Analysis Report“, der im April dieses Jahres vom National Industrial Information Security Development Research Center und dem Electronic Intellectual Property Center des Ministeriums für Industrie und Informationstechnologie veröffentlicht wurde, ist Baidu ab Ende 2023 hatte 19.308 Patente im gesamten Bereich der künstlichen Intelligenz angemeldet und 9.260 Patente erteilt und belegte in China sechs Jahre in Folge den ersten Platz im Bereich der KI der neuen Generation mit großen Modellen als Kern; Baidu meldete 1.432 Patente an und genehmigte 651. Wir werden führend in der technologischen Innovation und im Patentlayout. Laut den von der Patentdatenbankorganisation IFIclaims veröffentlichten Einblicken in die Patentlandschaft für generative künstliche Intelligenz gehören Baidus Patentanmeldungen für generative künstliche Intelligenz zu den Top 10 der Welt. Es ist das einzige chinesische Innovationsthema, das in die Liste aufgenommen wurde, und die patentierte Technologie deckt Text ab Im großen Basisbereich hat es sich zu einem der vier Unternehmen weltweit mit umfassendem Layout in diesen vier Bereichen entwickelt.
Am 12. November findet in Shanghai die Baidu World 2024 mit dem Thema „Applications Are Here“ statt. Als hochkarätige Technologiekonferenz des Jahres wird Baidu auch seine neuesten Ergebnisse veröffentlichen und erneut auffällige technologische Durchbrüche und Produkteinführungen bringen.
Baidus zehn bahnbrechendste technologische Erfindungen im Jahr 2024 lauten wie folgt:
1. Agententechnologie basierend auf generativen großen Modellen
Diese Erfindungstechnologie führt auf innovative Weise ein Denkmodell ein, das es dem Agenten ermöglicht, über mehrere Fähigkeiten wie Aufgabenplanung, Werkzeugaufruf, Wissenserweiterung und reflexive Weiterentwicklung zu verfügen. Durch systematisches Design und gezielte Optimierung der Kernfunktionen kann die groß angelegte Konstruktion und Bereitstellung von Agenten in verschiedenen Anwendungsszenarien zu geringen Kosten unterstützt werden. Durch den Aufbau umfangreicher Simulationsfunktionen kann die Konstruktion und Verteilung von Agenten beschleunigt werden. Dieses technische System wurde in vielen Schlüsselszenarien wie Wenxin Intelligent Platform, Merchant Intelligent Agent, Wenxin Quick Code usw. erfolgreich eingesetzt, was die Forschungs- und Entwicklungseffizienz intelligenter Agenten erheblich verbessert und die Forschungs- und Entwicklungsschwelle gesenkt hat. Unter anderem nutzen Handelsagenten Planungs- und Expertentechnologien für die Zusammenarbeit mit mehreren Modellen und umfangreiche Simulationstechnologien, um ihre Fähigkeit zu verbessern, Tools zu reflektieren, weiterzuentwickeln und zu verwenden, und bauen KI-Marketingfunktionen auf. Wenxin Kuaicode verlässt sich auf Codeempfehlungen und Agentensysteme zur Integration Traditionelles DevOps Die organische Kombination von Toolketten fördert die tiefgreifende Erforschung und Implementierung der kollaborativen Paarprogrammierung von Mensch und Maschine.
2. Multi-Modell-Co-Evolution-Technologie basierend auf einem effizienten Trainingsrahmen für große Modelle
Diese erfinderische Technologie überwindet eine Reihe schwieriger Probleme sowohl aus technischer als auch aus algorithmischer Sicht. In Bezug auf die technische Architektur umfassen umfassende innovative Durchbrüche hybride Parallelstrategien, Kommunikationseffizienz sowie Rechen- und Speicheroptimierung, die die Trainingsleistung großer Sprachmodelle erheblich verbessern und das effiziente und stabile Training der gesamten Modellreihe von Wenxin im gesamten Jahr unterstützen Verfahren. In Bezug auf Algorithmusstrategien haben wir Pre-Training-Technologien für die Zusammenarbeit großer und kleiner Modelle entwickelt, um das technische Problem der schwierigen Wissensvererbung zwischen Modellen zu überwinden, das Trainingsparadigma traditioneller Modelle zu ändern und die Kosten für das Training neuer Modelle zu senken. Basierend auf dieser Erfindung wurden technische Barrieren für Modelle unterschiedlicher Größe errichtet, wodurch der Schulungsdurchsatz des großen Wenxin-Modells im vergangenen Jahr um das 4,1-fache erhöht wurde und Wenxin Yiyan dabei unterstützt wurde, ein breites Spektrum von Unternehmen mit unterschiedlichen Anforderungen und Befugnissen effizient zu erfüllen Tausende Branchen.
3. Intelligentes System, das die Erstellung und Kompilierung multimodaler Inhalte auf der Grundlage großer Modelle und Technologie zur Wissensabfrageverbesserung integriert
Die Technologie dieser Erfindung nutzt umfassend Technologien wie Wissenserweiterung, Inhaltsanalyse aus mehreren Quellen, integrierte Bearbeitung und abrufbares Lexikon, um Probleme wie die schwache Produktionsqualität professioneller langer Artikel und multimodaler Inhalte sowie die Unfähigkeit, Container zu teilen, zu lösen Erstellung und Bearbeitung sowie schlechte Genauigkeit des Hauptteils des Lexikons. Das Abrufen verbesserter Textbilder zielt darauf ab, Referenzbilder durch intelligente Beurteilung der Benutzeranforderungen adaptiv zu verarbeiten. Das Mixed-Mode-Bilderzeugungssystem verbessert die Konsistenz des Hauptteils des Bildes erheblich und gleicht die Mängel einer ungenauen Beschreibung des Long-Tail-Inhalts effektiv aus Insgesamt übertrifft die Wirkung das native System von Wenshengtu bei weitem. Baidu Wenku hat große Erfolge bei der Erstellung von Branchenforschungsberichten, Präsentationen, Mindmaps und Comic-Büchern in Echtzeit auf der Grundlage von Benutzeranweisungen und hochgeladenen Inhalten erzielt und unterstützt komplexe Aufgaben wie Bearbeitung aus einer Hand, modalübergreifende Konvertierung und allgemeine/ personalisierte Zeichnungen. Deutliche Leistungsverbesserung. Im August 2024 veröffentlichte Yuehu Data von Aurora einen Bericht, aus dem hervorgeht, dass der Marktanteil von Baidu Wenku bei intelligenten PPTs in den letzten drei Monaten 23 % erreicht hat und die Wachstumsrate weit über dem Branchenniveau liegt .
4. Unterstützung einer groß angelegten autonomen Fahrpositionierungs- und Kartenerstellungstechnologie auf Spurebene
Diese innovative Technologie durchbricht die Effizienz- und Kostenprobleme des traditionellen Modells, reduziert die Kosten für die Kartenerstellung um 95 % und erreicht eine Straßenfahrleistung auf Spurebene von mehr als 3,6 Millionen Kilometern, wodurch eine vollständige Abdeckung von mehr als 41.000 städtischen und ländlichen Gebieten erreicht wird Städte im ganzen Land. Die hochpräzise Positionierungstechnologie für autonomes Fahren, die auf multimodaler Sensorfusion basiert und auf der Grundlage von Kartendaten weiterentwickelt wird, weist eine Genauigkeit im Zentimeterbereich auf, was die Massenproduktion erheblich verbessert und das Volumen des Kartenpakets, auf das die fahrzeugseitige Positionierung angewiesen ist, verringert 97,5 %, und die Zuverlässigkeit erreicht 99,9999 %, unterstützt voll und ganz den aktuellen Großbetrieb des vollständig autonomen Fahrens von Luobo Kuaipao und ermöglicht die Realisierung vollständig autonomen Fahrens in verschiedenen komplexen und schwierigen Szenarien wie unter Viadukten, mehrschichtigen Straßen und Tunneln.
5. Personalisierter Speichermechanismus für große Modellintelligenz
Diese Erfindungstechnologie schlägt auf innovative Weise einen umfassenden Satz von Speichermechanismen vor, der fünf Module der Speicherverarbeitung, -speicherung, -verwaltung, -auslösung und -nutzung abdeckt und großen Modellen personalisierte Speicherfunktionen verleiht. Die Speicherverarbeitung stützt sich auf den menschlichen Hippocampus-Mechanismus, um in allen Szenarien ein tiefgreifendes Verständnis und eine genaue Verarbeitung von Benutzerinformationen zu erreichen. Zeitaktualisierungen und Genauigkeit der Speicherbank; Speicherauslösung und -nutzung. Unterstützung großer Modelle bei der Erzeugung anthropomorpherer und personalisierterer Reaktionen durch die spekulative Generierung relevanter Erinnerungen. Diese Erfindungstechnologie wird häufig in Szenarien wie intelligenten KI-Assistenten und digitalen Menschen eingesetzt.
6. Super realistisches digitales menschliches Modellierungs-, Fahr- und Erzeugungssystem basierend auf großen Modellen
Diese erfinderische Technologie bietet einen kompletten Satz superrealistischer digitaler menschlicher Modellierungs-, Antriebs- und Generierungslösungen. Für echte digitale Menschen haben wir datengesteuerte Porträtmodellierung, modalübergreifendes Fahren und große Porträtvideogenerierungsmodelle entwickelt, um eine natürliche und realistische Produktion digitaler menschlicher Inhalte zu erreichen. Wir unterstützen ausschließlich das Live-Klonen von Porträts in großen Action- und Okklusionsszenen Der erste vollständig intelligent gesteuerte Live-Übertragungsraum wurde implementiert. Für hyperrealistische digitale 3D-Menschen haben wir modale Migrations- und Multiagenten-Kollaborationstechnologien basierend auf dem großen Wenxin-Modell entwickelt und so eine Produktion von hyperrealistischen digitalen menschlichen Bildern und operativen Inhalten auf Minutenebene erreicht, die mit Film- und Fernsehblockbustern vergleichbar sind 3A-Spiele. Die Technologie der vorliegenden Erfindung wurde in vielen realen und digitalen 3D-Menschenprodukten wie digitalen menschlichen Live-Übertragungen, Videoproduktionen und intelligenten Körpern weit verbreitet eingesetzt.
7. Generatives kommerzielles Retrievalsystem basierend auf großen Modellen
Diese Erfindungstechnologie hat den traditionellen „Index-Recall-Sort“-Prozess verändert, den Systemtrichter abgeflacht, Informationsverluste reduziert und Geschäftsinformationen in Modellparameter kodiert, indem Index-Lernaufgaben erstellt wurden, um „Modell als Index“ zu erreichen und die Leistungsfähigkeit großer Datenmengen zu nutzen Das neue Paradigma verbessert die Effizienz der Systemorientierung um 120 %, indem es die Fähigkeiten von Modellen versteht und argumentiert. Das an dieser Erfindung beteiligte Projekt war das erste, das in der Branche umgesetzt wurde. Das generative große Modell wurde mit kommerziellen Suchszenarien kombiniert, um den kreativen Reichtum um das 37-fache zu steigern um 92 % gesteigert und es wurden erhebliche geschäftliche Vorteile und ein breiter technischer Einfluss erzielt.
8. Schwungradtechnologie für große Modelldaten
Diese erfundene Technologie identifiziert automatisch Modellfehler und synthetisiert effizient hochwertige, vielfältige Trainingsdaten durch die Integration von Informationen aus mehreren Quellen und Formen wie Benutzerfeedback, Ausführungsfeedback und selbstüberwachtes Feedback. Gleichzeitig verbessert die Reinforcement-Learning-Methode in Kombination mit Feedback aus mehreren Quellen den Modelltrainingseffekt erheblich. Diese innovative Technologie baut ein Datenschwungrad auf, das sich kontinuierlich verbessern kann, den Datenengpass großer Modelle effektiv durchbricht, die Datenerfassungskosten senkt, die Anpassungsfähigkeit und Robustheit großer Modelle verbessert und die Leistung des Modells in verschiedenen Aufgabenszenarien beschleunigt die kontinuierliche Weiterentwicklung großer Modelle.
9. Effiziente Inferenztechnologie für große Modelle
Die von dieser Erfindung vorgeschlagene effiziente Argumentationstechnologie, die zugrunde liegende Modellschicht, basiert auf dem Flying Paddle Framework. In Richtung der Argumentationsarchitektur werden weiterhin Innovationen in Richtung Mainstream-Präfixcaching, Lookahead, PagedAttention, PD-Trennung usw. durchgeführt. und kombiniert effizient verschiedene Technologien, um den Modelldurchsatz und die Leistung erheblich zu verbessern. Im Hinblick auf die Komprimierung großer Modelle setzt das Unternehmen auf eine verlustfreie Quantisierungstechnologie für große Modelle und aktiviert Methoden wie die adaptive Segmentierungsglättung und die Neuordnung der Gewichtsverknüpfung. Es ist das erste Unternehmen in der Branche, das eine effiziente verlustfreie Komprimierung großer Modelle im zweistelligen Milliardenbereich erreicht Milliarden. Diese Erfindung unterstützt eine Vielzahl von Komprimierungs- und Inferenzbeschleunigungsmethoden für große Modelle und wurde in Kerngeschäften wie der Baidu Intelligent Cloud Qianfan-Plattform für große Modelle verwendet, um den Ressourcenverbrauch von Modellinferenzen zu reduzieren, die Kosten für die Bereitstellung großer Modelle um mehr als 50 % zu senken Verbesserung der Modellleistung und des Modelldurchsatzes um das 3- bis 5-fache.
10. Abrufgenerierungssystem basierend auf Benutzerdaten-Feedback
Das durch diese erfinderische Technologie vorgeschlagene Abrufgenerierungssystem kann Feedbacksignale zum Benutzerverhalten kombinieren, um eine schnelle Selbstverstärkung zu erreichen. Direkte Ausrichtung der Benutzerpräferenzen durch Zufriedenheitsmodellierung und Verstärkungslernen sowie Nutzung des Benutzerfeedbacks zur Auslösung einer schnellen Systemreflexion, wodurch die Probleme der geringen Effizienz des Expertenfeedbacks und der Schwierigkeit bei der Modellierung der Benutzerpräferenzen in herkömmlichen Datenanwendungen gelöst werden. Das auf diesem Framework basierende Abrufgenerierungssystem hat 18 % des Suchverkehrs abgedeckt und wird häufig in Text-, Video-, Bild- und anderen Suchszenarien verwendet. Die umfangreichen und recycelbaren Eigenschaften des Feedbacks mehrerer Benutzer ermöglichen es dem System, sich schnell an Änderungen in Daten, Produkten und Umgebung anzupassen, helfen dem System, automatisch nach Optimierungen zu suchen und die Entwicklung des Systems in einen idealen Zustand zu beschleunigen. Es hat einen äußerst hohen praktischen Wert Wettbewerbsfähigkeit des Marktes.