Das chinesische Forschungsteam machte einen großen Durchbruch und schuf erfolgreich den größten öffentlichen multimodalen KI-Datensatz "Infinity-MM", basierend, und trainierte ein kleines Modell mit hervorragendem Aquila-VL-2B. Dieser Datensatz enthält massive Bildbeschreibungen, visuelle Anweisungsdaten und Daten, die von KI-Modellen wie GPT-4 generiert werden. Das Aquila-VL-2B-Modell hat bei mehreren Benchmark-Tests mit nur 2 Milliarden Parametern hervorragende Ergebnisse erzielt, hat jedoch dank der MMSTAR-Basistests einen hohen Punkt von 54,9% im MMSTAR-Basistest und ist auch in Mathematik- und Bildverständnis Effektive Verwendung synthetischer Daten, die Modellleistung wurde um 2,4%verbessert. Noch wichtiger ist, dass der Datensatz und das Modell für die Forschungsgemeinschaft geöffnet wurden, was die Entwicklung von Open Source AI vorantreibt.
Dieses Forschungsergebnis markiert einen signifikanten Fortschritt im multimodalen KI-Bereich Chinas. . Das Infinity-MM-Papier und das Aquila-VL-2B-Projekt sind verfügbar. Besuchen Sie bitte den entsprechenden Link, um mehr zu erfahren.