Das umarmende Face-Team veröffentlichte zwei leichte KI-Modelle: SMOLVLM-256M und SMOLVLM-500M, mit Parametern von 256 Millionen bzw. 500 Millionen. Diese beiden Modelle sind besonders für Geräte mit weniger als 1 GB Speicher geeignet und bieten Entwicklern kostengünstige und hohe Effizienzdatenverarbeitungslösungen. Seine effiziente Leistung übertrifft viele größere Modelle in verschiedenen Benchmarks, insbesondere im Umgang mit Science-Charts der Grundschule und demonstriert sein großes Potenzial für Bildung und Forschung.
Kürzlich veröffentlichte das Team von Hugging Face, einer Plattform für künstliche Intelligenzentwicklung, zwei neue KI-Modelle, SMOLVLM-256M und SMOLVLM-500M. Sie behaupten zuversichtlich, dass die beiden Modelle bei weitem die kleinsten KI -Modelle sind, mit denen Bilder, kurze Videos und Textdaten gleichzeitig verarbeitet werden können, insbesondere für Geräte mit weniger als 1 GB Speicher wie Laptops. Diese Innovation ermöglicht es Entwicklern, bei der Verarbeitung großer Datenmengen eine höhere Effizienz zu geringeren Kosten zu erreichen.
Die Parameter dieser beiden Modelle betragen 256 Millionen bzw. 500 Millionen, was bedeutet, dass ihre Fähigkeit zur Lösung von Problemen auch entsprechend verbessert hat. Zu den Aufgaben, die die SMOLVLM -Serie ausführen kann, gehören die Beschreibung von Bildern oder Videoclips und die Beantwortung von Fragen zu PDF -Dokumenten und deren Inhalten, z. B. Scannen von Text und Diagrammen. Dadurch verfügen sie über eine breite Palette von Anwendungsaussichten in vielen Bereichen wie Bildung und Forschung.
Während des Trainings des Modells nutzte das Umarmungs-Face-Team 50 hochwertige Bild- und Textdatensätze, die als "Cauldron" bezeichnet werden, sowie Datei-Scans und detaillierte Paarungsdatensätze mit dem Namen docmatix. Beide Datensätze wurden durch das M4 -Team von Face entwickelt und konzentrierten sich auf die Entwicklung der multimodalen KI -Technologie. Es ist erwähnenswert, dass die SMOLVLM-256M- und SMOLVLM-500M viele größere Modelle in verschiedenen Benchmark-Tests wie die IDEFICS80B und insbesondere in AI2D-Tests übertreffen, und sie treten außerdem in der Lage, wissenschaftliche Diagramme für Grundschüler zu analysieren.
Obwohl erschwinglich und vielseitig erschwinglich sind, können kleine Modelle möglicherweise nicht so gut wie große Modelle für komplexe Inferenzaufgaben durchgeführt werden. Eine Studie von Google DeepMind, Microsoft Research Institute und dem Mila Institute in Quebec zeigte, dass viele kleine Modelle bei diesen komplexen Aufgaben enttäuschenderweise enttäuschend funktionierten. Die Forscher spekulieren, dass dies auf die Tendenz kleiner Modelle zur Identifizierung von Oberflächenmerkmalen der Daten zurückzuführen sein kann, und sie scheinen bei der Anwendung dieses Wissens in neuen Situationen skrupellos zu sein.
Umarme die Smolvlm -Modelsfamilie von Face nicht nur kleine KI -Werkzeuge, sondern zeigt auch beeindruckende Fähigkeiten, wenn es sich um verschiedene Aufgaben handelt. Dies ist zweifellos eine gute Wahl für Entwickler, die eine effiziente Datenverarbeitung zu geringen Kosten erreichen möchten.
Die Entstehung der SMOLVLM-Serie von Modellen hat neue Möglichkeiten für leichte KI-Anwendungen mit sich gebracht. Obwohl es immer noch Raum für Verbesserungen in komplexen Aufgaben gibt, machen es sein niedriger Schwellenwert und seine hohe Effizienz zu einer Wahl, die viele Entwickler verdienen. In Zukunft freuen wir uns darauf, die Anwendung und eine weitere Optimierung der Modelle der SMOLVLM -Serie in weiteren Feldern zu sehen.