Was ist die Lösung für das 600-Milliarden-Dollar-Problem der KI? Startup-Führungskräfte diskutieren über hohe Modellkosten und Kommerzialisierung
Autor:Eve Cole
Aktualisierungszeit:2024-11-16 11:42:01
Beijing News Shell Finance News (Reporter Bai Jinlei und Chen Weicheng) Vom 25. bis 26. Oktober fand in Peking die 10. Echtzeit-Internetkonferenz RTE2024 statt, die von der RTE Developer Community und Shengwang gemeinsam gesponsert wurde. Bei dem Treffen diskutierten Jia Yangqing, Gründer und CEO von Lepton AI, Wei Wei, Partner von MiniMax, Guoyang Zeng, Mitbegründer und Chief Technology Officer von Wall-Facing Intelligence, und Wang Tiezhen, Ingenieur von Hugging Face, „die 600 US-Dollar von AI“. Milliardenproblem: Von den Grundlagen ausgehen“ Das Roundtable-Forum „Von Anlagen zur Kommerzialisierung“ erregte die Aufmerksamkeit der Branche. „Das 600-Milliarden-Dollar-Problem der künstlichen Intelligenz“ stammt aus einem Artikel von David Cahn, einem Partner bei Sequoia Capital. Er glaubte, dass die Lücke zwischen riesigen Investitionen in die KI-Infrastruktur (künstliche Intelligenz) und den tatsächlichen Einnahmen bald zu groß sei Punkt einer Blase; KI könnte die nächste transformative Technologiewelle sein, und der Rückgang der GPU-Rechnerpreise (Grafikprozessor) wird sich tatsächlich positiv auf langfristige Innovationen und Start-ups auswirken, während Investoren darunter leiden werden. RTE2024 Die 10. Echtzeit-Internetkonferenz. Bild |. Foto vom Befragten . In Bezug auf den Aufbau der KI-Infrastruktur teilte Jia Yangqing zwei Kernansichten: Modelle gleicher Größe werden immer leistungsfähiger, insbesondere durch Technologien wie Destillation und Komprimierung. Das aktuelle LLama 3.2 3B-Modell kann dies sogar haben ähnliche Fähigkeiten wie das vorherige LLama 70B-Modell; mit Ausnahme einiger führender Unternehmen werden immer mehr Unternehmen „Open Source + Feinabstimmung“ übernehmen, um Modelle der nächsten Generation zu erstellen, sodass die Anwendung von Open-Source-Architektur immer häufiger wird . „Der Vorteil des Open-Source-Modells liegt in der Ökologie und der Gemeinschaft. Aus Sicht der praktischen Anwendung können viele Menschen ein Open-Source-Modell finden und verfeinern, aber es reicht nicht aus, alle Probleme mit dem Open-Source-Modell zu lösen.“ „Wang Tiezhen sagte: „Wir werden in Zukunft sehen, dass immer mehr Infra (Infrastruktur) und Echtzeit (Echtzeitverarbeitung) arbeiten, und jeder muss nicht nur auf das Open-Source-Modell selbst achten, sondern auch darauf.“ Infrastruktur und Daten-Closed-Loop des Open-Source-Modells, damit das Open-Source-Modell besser und schneller in Echtzeit ausgeführt werden kann, sind TTS (Text to Speech) und große Modelle erforderlich, die auf irgendeine Weise zusammengestellt und näher am Rand platziert werden können , es kann zu sehr guten Ergebnissen führen. „ Wie sollten wir das Training großer Modelle sehen? Und die Kosten für die Argumentation?“ Zeng Guoyang teilte mit: „Mit der Weiterentwicklung der Technologie wird die Rechenleistung definitiv immer billiger und der Umfang der Modelle mit den gleichen Fähigkeiten wird immer kleiner, aber die Optimierung der Rechenleistungskosten wird letztendlich dazu führen, dass leistungsstärkere Modelle trainiert werden.“ „Um wirklich das AGI-Niveau (allgemeine künstliche Intelligenz) zu erreichen, können wir nur spüren, dass das Modell immer leistungsfähiger wird, und es ist schwierig, die Veränderung der Kosten zu spüren, da die wandorientierte Intelligenz ein Ende hat.“ Um das Modell am Ende schneller laufen zu lassen, werden während des eigentlichen Bereitstellungsprozesses verschiedene Quantisierungskomprimierungs- und sogar Sparsifizierungsmethoden verwendet, um den tatsächlichen Bereitstellungsaufwand zu optimieren. Jia Yangqing wies auch darauf hin, dass die Kosten keine Rolle spielen. Er schätzte, dass die Kosten für die Begründung innerhalb eines Jahres auf ein Zehntel der aktuellen Kosten sinken werden. Bei der Erstellung von Anträgen können Unternehmer eine Kostenrechnung auf der Grundlage der aktuellen Kosten für die Antragstellung durchführen, die ein Zehntel der aktuellen Kosten ausmachen. um zu sehen, ob es machbar ist, einschließlich Modellen, Hardware und Nach der Anwendung in großen Mengen können auch die Kosten gesenkt werden. Jüngsten Berichten zufolge löst OpenAI sein „AGI Readiness“-Team auf, das sich auf die KI-Sicherheitsforschung konzentriert. Wie sehen die Gründer von KI-Unternehmen derzeit KI-Sicherheit und ethische Fragen? Jia Yangqing sagte beispielsweise, dass aktuelle Flugzeuge viele Sicherheitsanforderungen haben, die Raketenherstellung jedoch flexibler gestaltet wird. Daher spekulierte er, dass OpenAI möglicherweise für eine bessere frühe Entwicklung geeignet sei oder dass die KI-Sicherheit nicht aus der traditionellen Sicherheitskategorie herausspringe. Traditionelle Datensicherheit und Cloud-Sicherheit seien ausreichende Garantien. Wang Tiezhen sagte, es sei noch relativ früh, sich Sorgen darüber zu machen, dass KI den Menschen ersetzen könnte, aber KI habe bereits negative Auswirkungen auf einige Branchen gehabt, etwa durch die Auswirkungen von gefälschten und echten Videos, einschließlich der Auswirkungen auf die Psyche von Teenagern, und dort Hier gibt es viele Möglichkeiten für Unternehmertum. Auf der Veranstaltung gab Shengwang bekannt, dass das Unternehmen und MiniMax Chinas erste Realtime API (Echtzeitverarbeitungs-Anwendungsprogrammierschnittstelle) aufpolieren. Wie sollten wir also das praktische Anwendungspotenzial multimodaler Audio- und Videomodelle betrachten? Wei Wei sagte, dass mit dem Aufkommen der Multimodalität die Grenzen der generativen künstlichen Intelligenz weiter erweitert und die Transformation dieser Branche beschleunigt werden. Im Produkt- und Benutzerserviceprozess entdeckte Wei Wei, dass Modelle wie Text, Sprache, Musik und Video Schöpfern in den Bereichen Kunst, Film, Fernsehen, Musik und anderen Bereichen dabei helfen können, ihre Effizienz erheblich zu steigern und ihnen neue Ideen und Methoden zu liefern . Wang Tiezhen glaubt auch, dass einige Leute bereit sein werden, es auszuprobieren, wenn die Effekte der Videogenerierung die Effekte auf Filmebene übertreffen können und nicht mehrmals generiert werden müssen, auch wenn der Preis hoch ist.