Die Anhui Engineering University, die Nanyang Technological University und die Lehigh University haben gemeinsam ein auffälliges multimodales Großmodell auf den Markt gebracht – TinyGPT-V. Das bemerkenswerte Merkmal dieses Modells ist seine erstaunliche Kosteneffizienz: Seine Leistung ist mit Modellen mit Dutzenden von Milliarden Parametern vergleichbar, aber es erfordert nur eine 24-G-GPU, um das Training abzuschließen, was die Ressourcenschwelle erheblich senkt. Dies ist zweifellos ein großer Vorteil für Einzelpersonen und Institutionen, die mit begrenzten Ressourcen groß angelegte Modellforschung und -anwendungen durchführen möchten. Die Architektur von TinyGPT-V besteht hauptsächlich aus dem großen Sprachmodell Phi-2, einem visuellen Encoder und einer linearen Projektionsschicht. Die Ergebnisse der Mehrwinkel-Leistungsbewertung zeigen auch seine starke Stärke bei mehreren visuellen Sprachaufgaben.
Forscher der Anhui Engineering University, der Nanyang Technological University und der Lehigh University haben ein großes multimodales Modell – TinyGPT-V – als Open Source bereitgestellt. Seine Leistung ist mit Modellen mit Dutzenden Milliarden Parametern vergleichbar, und für das Training ist lediglich eine 24G-GPU erforderlich. TinyGPT-V besteht hauptsächlich aus drei Hauptblöcken: dem großen Sprachmodell Phi-2, dem visuellen Encoder und der linearen Projektionsschicht. Die Forscher führten eine Multi-Angle-Bewertung der Leistung von TinyGPT-V durch und zeigten seine starke Leistung bei mehreren visuellen Sprachaufgaben.
Die Open Source von TinyGPT-V bietet neue Ideen und Möglichkeiten für die Erforschung und Anwendung multimodaler Großmodelle und stellt auch einen bedeutenden Fortschritt bei der Senkung der Schwelle für das Training großer Modelle dar. Wir können davon ausgehen, dass in Zukunft weitere ähnliche hocheffiziente und kostengünstige Großmodelle auf den Markt kommen werden, was die Popularisierung und Entwicklung der Technologie der künstlichen Intelligenz weiter vorantreiben wird. Seine effiziente Leistung in ressourcenbeschränkten Umgebungen hat sowohl der Wissenschaft als auch der Industrie gute Nachrichten gebracht.