메타 플랫폼은 오늘날 LLAMA 3.21B 및 3B 간소화 된 대형 언어 모델을 출시했는데, 이는 업계에서 일반적인 휴대 전화 및 태블릿에서 대형 언어 모델의 안정적인 운영을 달성 한 최초입니다. 정량적 교육 기술 및 최적화 알고리즘을 통해이 버전은 파일 크기를 56%줄이고 실행중인 메모리를 41%줄이며 원래 버전의 4 배로 속도를 증가시킵니다. 이러한 획기적인 진행 상황은 데이터 처리 모드가 중앙 서버에서 개인 터미널로 변환되어 모바일 장치의 향후 애플리케이션 개발을위한 새로운 방법을 열어줍니다.
Meta Platforms는 오늘 LLAMA 3.21B 및 3B 제품을 포함하여 LLAMA 모델의 새로운 간소화 된 버전을 출시하여 일반 스마트 폰 및 태블릿에서 대규모 언어 모델의 안정적인 작동을 달성했습니다. 정량적 교육 기술 및 최적화 알고리즘을 혁신적으로 통합함으로써 새 버전은 원래 처리 품질을 유지하면서 파일 크기를 56% 줄이고 작동 메모리 요구 사항을 41% 줄이며 프로세싱 속도를 원래 버전으로 4 배 증가시킵니다. 8,000 문자 텍스트의 지속적인 처리.
Android 전화에서 테스트 할 때 Meta의 압축 AI 모델 (Spinquant 및 Qlora)은 표준 버전에 비해 속도와 효율성이 크게 향상되었습니다. 소규모 모델은 4 배 더 빠르게 실행되며 메모리 사용량이 줄어 듭니다.
OnePlus12 전화의 실제 테스트 에서이 압축 버전은 표준 버전과 비교할 수있는 성능을 보여 주었고, 운영 효율성을 크게 향상시키고 모바일 장치의 컴퓨팅 능력이 충분하지 않은 장기적인 문제를 효과적으로 해결했습니다. Meta는 공개 협력 시장 전략을 채택하고 Qualcomm 및 Mediatek와 같은 주류 모바일 프로세서 제조업체와의 심층적 인 협력을 선택했습니다. .
이 전략은 업계의 다른 거인들과는 대조적입니다. Meta의 Open Route는 Google과 Apple이 새로운 기술을 운영 체제와 깊이 통합하기로 선택할 때 개발자에게 더 큰 혁신 공간을 제공합니다. 이 릴리스는 데이터 처리 모드를 중앙 서버에서 개인 프로세싱 솔루션으로 변환하면 사용자 개인 정보를 더 잘 보호 할 수 있습니다.
이 기술 혁신은 장치 성능 요구 사항 및 개발자 플랫폼 선택과 같은 과제에 직면하지만 개인용 컴퓨터가 대중화되는 기간과 같은 주요 변화를 유발할 수 있습니다. 모바일 장치의 성능이 계속 향상됨에 따라 현지화 된 처리 솔루션의 장점이 점차 나타날 것입니다. Meta는 공개 협력을 통해보다 효율적이고 안전한 방향으로 발전 할 수 있도록 전체 업계가 홍보하고, 모바일 장치의 향후 애플리케이션 개발을위한 새로운 방법을 공개하기를 희망합니다.
메타의 개방형 협력 전략 선택은 다른 기술 거인과는 대조적으로 개발자에게 혁신을위한 광범위한 공간을 제공하고 현지화 된 AI 처리의 미래 개발 방향을 예고합니다. 이 기술 혁신은 모바일 장치가 사용되는 방식을 바꿀 것으로 예상되어 개인용 컴퓨터 대중화 기간과 같은 주요 변화를 가져 오며 향후 개발을 기대할 가치가 있습니다.