Die neuesten Untersuchungen von Apple zeigen, dass die Leistung eines visuellen Modells positiv mit der Menge seiner Parameter und der Menge der Vortrainingsdaten korreliert. Diese Studie bestätigte die Regel „Je mehr Parameter, desto stärker die Leistung“ durch das autoregressive Bildmodell und erweiterte die Modellkapazität erfolgreich auf Milliarden von Parametern, während die gute Leistung bei nachgelagerten Aufgaben beibehalten wurde. Dieser Durchbruch liefert wichtige theoretische Grundlagen und neue Forschungsrichtungen für die Leistungsverbesserung und Optimierung zukünftiger Bildmodelle und legt außerdem eine solide Grundlage für die weitere Entwicklung im Bereich der künstlichen Intelligenz.
Forscher von Apple haben die Regel „Je mehr Parameter, desto stärker die Leistung“ des visuellen Modells anhand des autoregressiven Bildmodells überprüft und damit weiter bewiesen, dass das Modell die Leistung weiter verbessern kann, wenn die Kapazität oder Menge der vorab trainierten Daten zunimmt . Die Forscher bestätigten, dass die Modellkapazität problemlos auf Milliarden von Parametern erweitert werden kann und gleichzeitig eine gute Leistung bei nachgelagerten Aufgaben aufweist, was neue Forschungsrichtungen und Ideen für zukünftige Leistungsverbesserungen und -optimierungen von Bildmodellen lieferte.Dieses Forschungsergebnis ist von großer Bedeutung, da es die Richtung für die Entwicklung und Anwendung zukünftiger Bildmodelle aufzeigt und das bevorstehende Aufkommen leistungsfähigerer und leistungsfähigerer Bildmodelle ankündigt. Ich glaube, dass wir in naher Zukunft weitere innovative Anwendungen sehen werden, die auf den Ergebnissen dieser Forschung basieren.