Inländische große Modelle suchen aktiv nach Möglichkeiten, GPT-4 zu übertreffen. Allerdings weisen bestehende Bewertungsmethoden Einschränkungen auf, wie z. B. Testlecks und unzureichende Glaubwürdigkeit. Um die Bewertung großer Modelle zu standardisieren und eine zuverlässigere Referenz für die Branchenentwicklung bereitzustellen, ist es von entscheidender Bedeutung, das technische Niveau großer Modelle objektiv und fair zu bewerten. In diesem Artikel werden der Entwicklungsstand und die Herausforderungen inländischer Großmodelle erörtert.
Inländische große Modelle suchen nach Möglichkeiten, GPT4 zu übertreffen, und verschiedene Bewertungsmethoden offenbaren die Fähigkeiten großer Modelle, es gibt jedoch Testlecks und Zweifel an der Glaubwürdigkeit. Die China Academy of Information and Communications Technology hat einen nationalen Standardplan veröffentlicht, um einen offiziellen und maßgeblichen Standard für die Bewertung großer Modelle bereitzustellen.
Der von der China Academy of Information and Communications Technology herausgegebene nationale Standardplan stellt eine wichtige Garantie für die gesunde Entwicklung inländischer Großmodelle dar und markiert einen wichtigen Schritt auf dem Gebiet der Großmodellbewertung in meinem Land. Zukünftig wird ein umfassenderes Bewertungssystem den technologischen Fortschritt inländischer Großmodelle weiter fördern und letztendlich Wettbewerb schaffen und das internationale fortgeschrittene Niveau übertreffen.