Die inländische KI-Firma Deepseek veröffentlichte das multimodale Janus-Pro-Modell, trat offiziell in das Gebiet der literarischen und biografischen Grafiken ein und erzielte bemerkenswerte Ergebnisse. Dieses Produkt, das auf dem Janusflow-Modell-Upgrade basiert, übertraf bekannte Modelle wie Dall-E3 von OpenAI in mehreren Benchmarks. Deepseeks Bewegung markiert einen erheblichen Durchbruch in der multimodalen KI -Technologie und verleiht der Entwicklung der inländischen KI neue Vitalität.
Das inländische Big Model Deepseek hat das neue janus-pro-multimodale Big Model veröffentlicht und offiziell in das Gebiet der literarischen und biografischen Grafiken eingetreten. Dieser Schritt markiert einen großen Durchbruch in Deepseek in der multimodalen KI -Technologie.
In den Geneval- und DPG-Bench-Benchmarks übertrifft Janus-Pro-7b nicht nur OpenAs Dall-E3, sondern übertrifft auch beliebte Modelle wie stabile Diffusion und EMU3-Gen. Janus-Pro nimmt das MIT Open Source-Protokoll an, was bedeutet, dass es in kommerziellen Szenarien ohne Einschränkungen verwendet werden kann. Laut Deepseek ist Janus-Pro eine Premium-Version des Janusflow-Modus, das am 13. November 2024 veröffentlicht wurde.
Im Vergleich zu Modellen der früheren Generation optimierte Janus-Pro die Trainingsstrategie, erweiterte die Trainingsdaten und die Modellskala war größer. Diese Verbesserungen haben es Janus-PRO ermöglicht, erhebliche Fortschritte beim multimodalen Verständnis und den Anweisungsfunktionen für Text-zu-Image-Anweisungen zu erzielen und gleichzeitig die Stabilität der Text-zu-Image-Erzeugung zu verbessern.
Obwohl Janus-Pro nur Bilder mit einer Auflösung von 384x384 verarbeiten kann, ist es bereits erstaunlich, angesichts seiner kompakten Modellgröße ein solches Niveau erreichen zu können.
Als multimodales Modell kann Janus-Pro nicht nur Bilder erzeugen, sondern auch Bilder beschreiben, Wahrzeichen-Attraktionen identifizieren, Text in Bildern identifizieren und Wissen in Bildern einführen.
Punkte:
Deepseek veröffentlicht Janus-Pro-multimodales Modell, um in das Gebiet der literarischen und biografischen Grafiken einzugeben.
In den Benchmarks übertrifft die Janus-Pro-7b-Leistung beliebte Modelle wie Openai's Dall-E3.
Janus-Pro verwendet das MIT Open Source-Protokoll und kann in kommerziellen Szenarien ohne Einschränkungen verwendet werden.
Die Entstehung von Janus-Pro zeigt, dass die technologische Stärke von inländischen großen Modellen im Bereich literarischer und biografischer Bilder rasch steigt. Zu!