Microsoft는 최근 경량 추론 및 하이브리드 전문가를 대상으로 하는 Phi-3.5-mini-instruct, Phi-3.5-MoE-instruct 및 Phi-3.5-vision-instruct라는 세 가지 강력한 Phi-3.5 AI 모델을 출시했습니다. 최적화되어 있습니다. 이는 다국어 및 다중 모드 인공 지능 분야에서 Microsoft의 상당한 발전을 의미하며 이 분야에서 선두 위치를 더욱 확고히 합니다. 세 가지 모델 모두 MIT 오픈 소스 라이선스로 출시되어 개발자에게 광범위한 응용 가능성을 제공합니다.
Microsoft는 세 가지 새로운 Phi-3.5 모델 출시를 발표하여 다중 언어 및 다중 모드 인공 지능 개발에서 선두 위치를 더욱 공고히 했습니다. 세 가지 새로운 모델은 Phi-3.5-mini-instruct, -3.5-MoE-instruct 및 Phi-3.5-vision-instruct이며 각각 서로 다른 애플리케이션 시나리오를 대상으로 합니다.
Phi-3.5Mini Instruct 모델은 3억 8천만 개의 매개변수를 갖춘 경량 AI 모델로, 컴퓨팅 성능이 제한된 환경에 매우 적합합니다. 128k의 컨텍스트 길이를 지원하고 명령어 실행 기능에 특별히 최적화되어 코드 생성, 수학적 문제 해결, 논리적 추론과 같은 작업에 적합합니다. 이 모델은 작은 크기에도 불구하고 다국어, 다단계 대화 작업에서 동급 모델을 능가하는 놀라운 경쟁력을 보여줍니다.
입구: https://huggingface.co/microsoft/Phi-3.5-mini-instruct
"전문가 하이브리드" 모델인 Phi-3.5MoE 모델은 각각 특정 작업에 초점을 맞춘 여러 가지 유형의 모델을 결합합니다. 419억 개의 매개변수를 갖고 있으며 128k의 컨텍스트 길이를 지원하므로 다양한 추론 작업에서 강력한 성능을 발휘할 수 있습니다. 이 모델은 코드, 수학 및 다중 언어 이해에서 매우 뛰어난 성능을 발휘하며 MMLU(Massive Multi-Task Language Understanding) mini에서 OpenAI의 GPT-4o를 능가하는 등 일부 벤치마크에서는 더 큰 모델을 능가하기도 합니다.
입구: https://huggingface.co/microsoft/Phi-3.5-MoE-instruct
Phi-3.5Vision Instruct 모델은 텍스트와 이미지 처리 기능을 통합한 고급 멀티모달 AI 모델로, 이미지 이해, 광학 문자 인식, 차트 및 표 분석, 비디오 요약 등의 작업에 적합합니다. 이 모델은 또한 128k의 컨텍스트 길이를 지원하며 복잡한 다중 프레임 비전 작업을 처리할 수 있습니다.
입구: https://huggingface.co/microsoft/Phi-3.5-vision-instruct
이 세 가지 모델을 훈련하기 위해 Microsoft는 대규모 데이터 처리를 수행했습니다. Mini Instruct 모델은 3조 4천억 개의 마커를 사용하고 10일 동안 512개의 H100-80G GPU에서 훈련되었습니다. Vision Instruct 모델은 5,000억 개의 마커를 사용하고 6일 동안 훈련되었으며 MoE 모델은 23일 동안 4조 9천억 개의 마커가 사용되었습니다. 훈련을 위해.
이 세 가지 Phi-3.5 모델은 모두 MIT 오픈 소스 라이선스에 따라 출시되며 개발자는 이 소프트웨어를 자유롭게 사용, 수정 및 배포할 수 있다는 점을 언급할 가치가 있습니다. 이는 오픈 소스 커뮤니티에 대한 Microsoft의 지원을 반영할 뿐만 아니라 더 많은 개발자가 최첨단 AI 기능을 애플리케이션에 통합할 수 있도록 해줍니다.
가장 밝은 부분:
Microsoft는 경량 추론, 하이브리드 전문가 및 다중 모드 작업을 목표로 하는 세 가지 새로운 AI 모델을 출시했습니다.
?Phi-3.5MoE는 벤치마크 테스트에서 GPT-4o mini보다 성능이 뛰어납니다.
? 세 가지 모델 모두 MIT 오픈소스 라이선스에 따라 라이선스가 부여되며, 개발자는 자유롭게 사용하고 수정할 수 있습니다.
전체적으로 강력한 성능, 광범위한 애플리케이션 시나리오 및 공개 라이센스를 갖춘 Microsoft가 출시한 세 가지 Phi-3.5 모델은 의심할 여지 없이 인공 지능 분야에 지대한 영향을 미치고 개발자와 연구자들에게 강력한 도구를 제공할 것입니다. 미래 AI 기술 발전의 새로운 방향도 제시한다.