Kürzlich veröffentlichte das Sky Computing Lab Team der University of California, Berkeley, Sky-T1-32B-Präview, ein Open-Source-Inferenzmodell für künstliche Intelligenz, das die Entwicklung von Inferenz-KI leichter und billiger markiert. Das Modell war in mehreren wichtigen Benchmarks gut abgelegt, sogar vergleichbar mit den früheren Versionen von OpenAI -Versionen von O1.
Die Schulungskosten des Sky-T1 sind beeindruckend mit nur 450 US-Dollar, was bedeutet, dass die Replikation von Argumentationsfunktionen auf hoher Ebene erschwinglicher und effizienter geworden ist. Während die Gebühr von 450 US -Dollar möglicherweise nicht niedrig klingt, ist es ein enormer Rückgang im Vergleich zu den Schulungskosten, die vor einigen Jahren Hunderte Millionen Dollar kosten. Mit Hilfe synthetischer Trainingsdaten, d. H. Trainingsdaten, die von anderen Modellen generiert wurden, werden die Kosten erheblich reduziert. Die AI Company Writer hat kürzlich den Palmyra X004 veröffentlicht, der fast ausschließlich auf synthetischen Daten beruht, und die Entwicklungskosten betragen nur 700.000 US -Dollar.
Im Gegensatz zu den meisten AIs können Inferenzmodelle effektiv selbst prüfen, was sie bei einigen häufigen Problemen zuverlässiger macht. Inferenzmodelle benötigen normalerweise mehr Zeit, wenn die Lösungen abgeleitet werden, die Sekunden bis Minuten dauern können. In Bereichen wie Physik, Naturwissenschaften und Mathematik sind die Zuverlässigkeitsvorteile erheblich.
Das Novasky-Team verwendete ein weiteres Inferenzmodell-Alibabas QWQ-32B-Präview, um die anfänglichen Trainingsdaten von Sky-T1 zu generieren und die Daten zu "geplant" Mehr operatives Format. Es dauert nur etwa 19 Stunden, um Sky-T1 mit 3,2 Milliarden Parametern zu trainieren, wobei ein Satz von 8 NVIDIA H100GPUs verwendet wird. Die Anzahl der Parameter hängt grob mit der Fähigkeit zur Problemlösung des Modells zusammen.
Laut dem Novasky-Team übertraf Sky-T1 die frühe Vorschau-Version von O1 auf einer Math500-Sammlung von mathematischen Herausforderungen auf „Wettbewerbsebene“. Darüber hinaus hat Sky-T1 in LivecodeBench mehr Schwierigkeiten als die Vorschau-Version von O1 aufgetreten. Sky-T1 wurde jedoch schlechter als die O1-Vorschau in den GPQA-Diamond-Tests, wenn es um Probleme mit Physik, Biologie und Chemie geht.
Es ist zu beachten, dass die GA -Version O1 von OpenAI in den nächsten Wochen ein noch besseres Inferenzmodell O3 veröffentlichen wird. Das Novasky-Team sagte jedoch, dass Sky-T1 nur der Beginn ihrer Reise zur Entwicklung eines Open-Source-Modells mit fortgeschrittenen Argumentationsfunktionen ist.
„Wir freuen uns darauf, dass wir uns darauf konzentrieren, effizientere Modelle zu entwickeln, um eine starke Inferenzleistung aufrechtzuerhalten und fortschrittliche Technologien zu untersuchen, die die Modelleffizienz und -genauigkeit weiter verbessern“, schrieb das Team in einem Blog. "Seien Sie gespannt auf unsere Fortschritte bei diesen aufregenden Projekten."