Die Forschung von Alibabas Labor von Tontyi hat die Bildungsfähigkeit literarischer und biografischer Grafikmodelle durchbruch. Sie fanden heraus, dass das vorhandene Diffusionstransformatormodell mehrfache Sätze mit spezifischen Beziehungen mit nur geringer Anleitung erzeugen kann, was die Erkenntnis untergräbt, dass herkömmliche Diffusionsmodelle ein massives Datentraining erfordern, um hochwertige Bilder zu generieren. Der Kern dieser Studie ist die IC-LORA-Technologie, die die Fähigkeit "Kontextlernen" des Modells effektiv aktiviert und dem Modell den Zusammenhang zwischen Bildern verstehen und eine Folge von Bildern mit logischer Konsistenz erzeugt. Diese Technologie verbessert nicht nur die Effizienz und Qualität der Bilderzeugung, sondern verringert auch die Kosten für das Modelltraining und bringt revolutionäre Änderungen auf dem Gebiet der KI -Bildgenerierung.
Das traditionelle Diffusionsmodell ist wie ein rote Schüler, und IC-Lora gibt ihm die Möglichkeit, voneinander zu lernen. Durch geschicktes Spleißen mehrerer Bilder in ein großes Bild und kombiniert Text, um ihn in eine lange Prop zu beschreiben, ermöglichen die Forscher dem Modell, die Informationen mehrerer Bilder gleichzeitig zu verarbeiten und die Beziehung zwischen Bildern zu verstehen. Gleichzeitig wird die Feinabstimmung durch eine kleine Anzahl hochwertiger Bildsammlungen durchgeführt. Die ursprünglichen Wissens- und Kontext-Lernfähigkeit des Modells werden erhalten. Der Artikel listet mehrere experimentelle Fälle auf und zeigt die Anwendungseffekte von IC-LORA in verschiedenen Szenarien, wie z. Die Entstehung von IC-Lora hat die Trainingskosten von KI-Modellen gesenkt und es ermöglicht, in Zukunft an der KI-Kreation teilzunehmen. Projektadresse: https://ali-vilab.github.io/in-context-lora-page/
Der bahnbrechende Fortschritt der IC-Lora-Technologie hat neue Möglichkeiten für die Erzeugung der KI-Image gebracht. In Zukunft können wir uns mit der kontinuierlichen Reife und Verbesserung der Technologie auf innovativere Anwendungen freuen, die auf IC-Lora und der breiteren Anwendung der KI auf dem Gebiet der künstlerischen Schöpfung basieren.