Microsoft hat kürzlich drei leistungsstarke Phi-3.5-KI-Modelle veröffentlicht, nämlich Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct und Phi-3.5-vision-instruct, die sich an leichtgewichtige Argumentations- bzw. Hybrid-Expertenmodelle und multimodale Aufgaben richten sind optimiert. Dies markiert den bedeutenden Fortschritt von Microsoft im Bereich der mehrsprachigen und multimodalen künstlichen Intelligenz und festigt seine führende Position in diesem Bereich weiter. Alle drei Modelle werden unter der MIT-Open-Source-Lizenz veröffentlicht und bieten Entwicklern vielfältige Anwendungsmöglichkeiten.
Microsoft kündigte die Veröffentlichung von drei neuen Phi-3.5-Modellen an und festigte damit seine führende Position in der Entwicklung mehrsprachiger und multimodaler künstlicher Intelligenz weiter. Die drei neuen Modelle sind: Phi-3.5-mini-instruct, -3.5-MoE-instruct und Phi-3.5-vision-instruct, die jeweils auf unterschiedliche Anwendungsszenarien abzielen.
Das Phi-3.5Mini Instruct-Modell ist ein leichtes KI-Modell mit 380 Millionen Parametern, das sich sehr gut für Umgebungen mit begrenzter Rechenleistung eignet. Es unterstützt eine Kontextlänge von 128 KB und ist speziell für die Fähigkeit zur Befehlsausführung optimiert, sodass es für Aufgaben wie Codegenerierung, mathematische Problemlösung und logisches Denken geeignet ist. Trotz seiner geringen Größe zeigt dieses Modell eine beeindruckende Wettbewerbsfähigkeit bei mehrsprachigen Dialogaufgaben und übertrifft andere Modelle seiner Klasse.
Eingang: https://huggingface.co/microsoft/Phi-3.5-mini-instruct
Das Phi-3.5MoE-Modell, ein „Experten-Hybrid“-Modell, kombiniert mehrere verschiedene Modelltypen, die sich jeweils auf eine bestimmte Aufgabe konzentrieren. Es verfügt über 41,9 Milliarden Parameter und unterstützt eine Kontextlänge von 128 KB, was eine leistungsstarke Leistung bei einer Vielzahl von Argumentationsaufgaben beweisen kann. Dieses Modell schneidet in den Bereichen Code, Mathematik und Mehrsprachenverständnis sehr gut ab und übertrifft in einigen Benchmarks sogar größere Modelle, beispielsweise übertrifft es OpenAIs GPT-4o in MMLU (Massive Multi-Task Language Understanding) mini.
Eingang: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct
Das Phi-3.5Vision Instruct-Modell ist ein fortschrittliches multimodales KI-Modell, das Text- und Bildverarbeitungsfunktionen integriert und für Aufgaben wie Bildverständnis, optische Zeichenerkennung, Diagramm- und Tabellenanalyse sowie Videozusammenfassung geeignet ist. Dieses Modell unterstützt auch eine Kontextlänge von 128 KB und kann komplexe Multi-Frame-Vision-Aufgaben bewältigen.
Eingang: https://huggingface.co/microsoft/Phi-3.5-vision-instruct
Um diese drei Modelle zu trainieren, führte Microsoft eine umfangreiche Datenverarbeitung durch. Das Mini-Instruct-Modell verwendete 3,4 Billionen Marker und wurde 10 Tage lang auf 512 H100-80G-GPUs trainiert; das Vision-Instruct-Modell verwendete 500 Milliarden Marker und wurde an 6 Tagen trainiert, und das MoE-Modell verwendete 23 Tage lang 4,9 Billionen Marker zum Training.
Es ist erwähnenswert, dass diese drei Phi-3.5-Modelle alle unter der MIT-Open-Source-Lizenz veröffentlicht werden und Entwickler diese Software frei verwenden, ändern und verteilen können. Dies spiegelt nicht nur die Unterstützung von Microsoft für die Open-Source-Community wider, sondern ermöglicht auch mehr Entwicklern die Integration modernster KI-Funktionen in ihre Anwendungen.
Highlight:
Microsoft hat drei neue KI-Modelle auf den Markt gebracht, die auf leichtes Denken, Hybrid-Experten- und multimodale Aufgaben abzielen.
„Phi-3.5MoE übertrifft GPT-4o mini in Benchmark-Tests und schneidet gut ab.“
?Alle drei Modelle sind unter der MIT-Open-Source-Lizenz lizenziert und können von Entwicklern frei verwendet und geändert werden.
Alles in allem werden die drei von Microsoft veröffentlichten Phi-3.5-Modelle mit ihrer leistungsstarken Leistung, ihrem breiten Anwendungsspektrum und ihren offenen Lizenzen zweifellos tiefgreifende Auswirkungen auf den Bereich der künstlichen Intelligenz haben und Entwicklern und Forschern leistungsstarke Werkzeuge zur Verfügung stellen kündigen auch die neue Richtung der zukünftigen Entwicklung der KI-Technologie an.