Am 5. September teilte Shun Xiangyang, Vorsitzender des Kuratoriums der Hong Kong University of Science and Technology und ausländischer Akademiker der National Academy of Engineering, auf der Inclusion 2024 seine acht Gedanken zur Umsetzung der Großmodellindustrie mit ·Bund-Konferenz. Er glaubt, dass die Ankunft der KI-Agenten-Ära kein magisches und leistungsstarkes Modell sein wird, das plötzlich alle Arbeitsabläufe ersetzt. Es beinhaltet die kontinuierliche Integration von Technologie, Technik und Markt und bietet den Menschen schließlich Dienstleistungen, die die Erwartungen übertreffen.
Gedanke 1: Die Rechenleistung ist die Schwelle „Wenn man heute große Modelle und Deep Learning macht, ist die Rechenleistung das Erste und Wichtigste.“ Er wies darauf hin, dass sich die erforderliche Rechenleistung für große Modelle seit 2010 um das Sechs- bis Siebenfache erhöht habe. Es hat sich in den letzten Jahren stabilisiert und ist jedes Jahr etwa viermal gewachsen. Das Modell wird immer größer, die Anzahl der Parameter wird immer größer und auch der Bedarf an Rechenleistung wächst mit zunehmenden Parametern in einer flachen Richtung. Seiner Ansicht nach hat sich die Entwicklung der gesamten Computerchipindustrie vom ursprünglichen „Mooreschen Gesetz“ zum „Huangschen Gesetz“ verändert. Das Mooresche Gesetz besagte früher, dass sich die Rechenleistung alle 18 Monate verdoppelt. Es wird nun vorhergesagt, dass die GPU die KI-Rechenleistung von Jahr zu Jahr verdoppeln wird. „Es tut den Gefühlen weh, über Karten zu sprechen, aber es gibt keine Emotionen, wenn man keine Karten hat. Früher gab es ein Sprichwort, dass Armut die Vorstellungskraft einschränkt, aber jetzt kann Armut die Vorstellungskraft verzerren, denn wenn es keine Karten gibt, sind die Projekte das „Man kann sich vorstellen, dass es anders sein könnte.“ Shen Xiangyang seufzte vor Emotionen. Gedanke 2: Daten über Daten Aus öffentlichen Informationen geht hervor, dass die Trainingsdaten von GPT3 einen Token (Durchsatz) von 2 T erreicht haben und die von GPT4 etwa 12 T. Laut Shun Xiangyangs Vorhersage könnten die Trainingsdaten von GPT5 200 T erreichen. Die aktuellen Daten im Internet decken bei weitem nicht die Anforderungen zukünftiger Modellschulungen, und wir müssen über Möglichkeiten nachdenken, mehr Daten zu gewinnen. Im Bereich der künstlichen Intelligenz werden Daten als „Treibstoff“ des Modells betrachtet, und das Modell muss aus diesen Daten lernen und nützliche Informationen extrahieren. Daher wirken sich Quantität, Qualität und Vielfalt der Daten direkt auf die Genauigkeit und Leistung des Modells aus. Shen Xiangyang sagte, dass in der Vergangenheit die meisten Daten von Google zur Erstellung von Suchmaschinen verwendet wurden. In Zukunft werden diese Daten zum Trainieren großer Modelle verwendet. „Die vom Internet in den letzten 40 Jahren gesammelten Daten scheinen genau für einen solchen KI-Moment zu sein.“ Gedanke 3: Das nächste Kapitel des großen Modells Was kommt als nächstes? Shen Xiangyang glaubt, dass der zukünftige Entwicklungspfad der großen Modellindustrie sehr klar ist und in Zukunft vom bisherigen großen Sprachmodell zum multimodalen Modell und hin zum Weltmodell übergehen wird. Technisch gesehen müssen wir den Weg gehen, Verständnis und Generation zu vereinen. „Die Zukunft wird sich definitiv in Richtung verkörperter Intelligenz und Roboter bewegen. Eine der Sonderformen ist das autonome Fahren“, sagte Shen Xiangyang. Tatsächlich gibt es in der Branche keine einheitliche Definition des Weltmodells. Das von OpenAI eingeführte Sora-Modell hat in der Branche Diskussionen über das „Weltmodell“ ausgelöst. OpenAI betrachtet es als Grundlage für Modelle, die die reale Welt verstehen und simulieren können, und ist davon überzeugt, dass seine Fähigkeiten einen wichtigen Meilenstein auf dem Weg zur AGI (künstliche allgemeine Intelligenz) darstellen. Shun Xiangyang glaubt jedoch: „Obwohl das Sora-Modell sehr gut ist, ist es nicht so leistungsstark. Die darin enthaltenen physikalischen Eigenschaften können nicht garantiert werden und es kann kein Weltmodell sein.“ Gedanke 4: Große Modelle breiten sich in Tausenden von Branchen aus Große Modelle können in allgemeine große Modelle, große Industriemodelle, große Unternehmensmodelle und persönliche große Modelle unterteilt werden. Shen Xiangyang wies darauf hin, dass große Allzweckmodelle die Grundlage der KI sind und dass das Training eines großen Allzweckmodells mindestens 10.000 Kalorien erfordert. Große Industriemodelle sind die Basis für Domänenanwendungen und erfordern ein Training für große Unternehmensmodelle Die Wiederentdeckung des Werts von Unternehmensdaten erfordert Hunderte von Kalorien an Schulungen. Diese großen Modelle stellen extrem hohe Anforderungen an die Rechenleistung. „Das Aufregendste ist das groß angelegte persönliche Modell. Beispielsweise fördern Lenovo und Microsoft AIPC und Apples Apple Intelligence entwickeln sich alle in Richtung persönlicher Intelligenz.“ Bis Ende Juli dieses Jahres hat China 197 Großmodelle registriert, davon 30 % allgemeine Großmodelle und 70 % Industrie-Großmodelle. „Es ist ersichtlich, dass große Modelle in der Branche die überwiegende Mehrheit ausmachen, und es werden in Zukunft definitiv immer mehr sein“, sagte Shen Xiangyang. Gedanke 5: KI-Agent – von der Vision bis zur Umsetzung Im Mai 2024 erklärte Microsoft-Gründer Bill Gates öffentlich, dass AI Agent nicht nur die Art und Weise verändern wird, wie jeder mit Computern interagiert, sondern auch die Softwareindustrie untergraben und die größte Computerrevolution seit der Eingabe von Befehlen bis zum Klicken auf Symbole herbeiführen wird. Shun Xiangyang stimmte dieser Ansicht zu. Er glaubt, dass im Zeitalter der künstlichen Intelligenz die wirklich erstaunliche Superanwendung AI Agent ist. Im Prozess des AI Agent von der Vision bis zur Implementierung ist es notwendig, sich stets auf die Bedürfnisse zu konzentrieren, die Fähigkeiten des Modells genau zu verstehen und einen Workflow mit umfassender KI-Beteiligung aufzubauen. „Wenn man heute in einem Unternehmen arbeitet, ist der gesamte Workflow sehr komplex. Obwohl ChatGPT sehr leistungsfähig ist, erreicht es bei weitem nicht das Niveau eines Agenten. Es erzielt nur einen einzigen Durchbruch. Um wirklich voranzukommen, muss es in das integriert werden.“ gesamten Arbeitsablauf“, sagte er. Gedanke 6: Achten Sie auf die Governance der KI KI-Governance ist sehr wichtig. Das Thema der diesjährigen World Artificial Intelligence Conference (WAIC) ist die KI-Governance. Verschiedene Länder haben unterschiedliche Ansichten zu diesem Thema. Die Entwicklung der KI hatte starke Auswirkungen auf Menschen, Unternehmen, staatliche Aufsicht, soziale Entwicklung und andere Aspekte und löste in der Öffentlichkeit Bedenken hinsichtlich ihrer Sicherheitsführung aus. „Ich denke, der nächste wichtige Punkt in der Entwicklung künstlicher Intelligenz. Aus der Sicht verschiedener Länder auf der ganzen Welt ist es notwendig, souveräne künstliche Intelligenz aufzubauen, und hinter souveräner künstlicher Intelligenz muss eine souveräne Cloud stehen, um die Entwicklung souveräner Intelligenz zu unterstützen.“ Künstliche Intelligenz“, sagte Shen Xiangyang. Gedanke 7: Überdenken Sie die Mensch-Maschine-Beziehung „Wie groß ist der Einfluss von GPT auf den Schock der Mensch-Computer-Interaktion und wie groß ist die Entwicklung der maschinellen Intelligenz?“ Shen Xiangyang ist der Ansicht, dass die Beziehung zwischen Mensch und Maschine neu überdacht werden sollte. Er wies darauf hin, dass KI dem Menschen einen neuen Kontext für die Symbiose mit Technologie bietet und dass die neue Art der Mensch-Computer-Interaktion auf die Integration und den Fortschritt von „KI und IA“ hinweist. IA (Intelligent Augmentation) stellt einen menschenzentrierten KI-Entwicklungspfad dar. Es konzentriert sich auf den Einsatz von Technologie zur Verbesserung menschlicher Fähigkeiten, anstatt Menschen zu ersetzen, und betont die kollaborative Beziehung zwischen Menschen und KI. „Der Kolumnist der New York Times, John Markoff, erwähnte, dass der wahre Gewinner bei der Entwicklung von Computern in den letzten Jahrzehnten die Mensch-Computer-Interaktion war. Unabhängig von der Technologie sollte das ultimative Ziel darin bestehen, Menschen dabei zu helfen, Maschinen besser zu nutzen.“ " Shen Xiang Yang sagte: „Im KI-Zeitalter ist der Dialog der wichtigste Aspekt der Mensch-Computer-Interaktion, genau wie ChatGPT und Microsoft das größte Unternehmen im KI-Zeitalter werden.“ erzählen." Gedanke 8: Die Natur der Intelligenz Heute ist die Entwicklung von GPT in vollem Gange, aber tatsächlich ist das Verständnis der Menschen für Intelligenz noch sehr begrenzt. Im Gegensatz zur Physik kann alles, vom riesigen Sternenhimmel bis hin zu winzigen Quanten, durch eine einheitliche Theorie erklärt werden; viele Dinge sind im heutigen Deep Learning unerklärlich und haben keine Robustheit. „Die Essenz der Intelligenz ist der jahrhundertealte Kampf zwischen neuronalen Netzen und Symbolsystemen.“ Shen Xiangyang sagte: „Auch wenn sich die Entwicklung künstlicher Intelligenz heute noch in einem relativ frühen Stadium befindet, gibt es in der Branche bereits viele Anwendungen sind es wert, ich bin entschlossen, es zu tun, und ich blicke zuversichtlich in die Zukunft.