Meta는 일상 생활에 진정으로 적합하고 강력한 추론 능력을 가질 수있는 자율 머신 인텔리전스를 만들기 위해 대형 언어 모델 인 LLAMA의 개발을 적극적으로 홍보하고 있습니다. 이 기사는 LLAMA4의 예상되는 진보를 포함하여 Meta의 개선 전략, 교육 방법 및 LLAMA 모델에 대한 향후 계획을 탐구 할 것입니다. Meta는 LLAMA 모델을 AI 시스템으로 구축하고 복잡한 작업을 효율적으로 처리하고 동적으로 변화하는 환경에 적응할 수 있으며 인공 지능 분야에 중대한 영향을 미칩니다.
최근 Meta의 AI 과학자 인 Yann Lecun은 셀프 기계 지능 (AMI)이 사람들의 일상 생활을 진정으로 도울 수 있다고 말했다. Meta는 GPT-4O와 같은 최고 모델과 경쟁하기 위해 LLAMA 모델의 추론 능력을 향상시키기 위해 노력하고 있습니다.
Meta의 Manohar Paluri 부사장은 라마 모델을“계획”뿐만 아니라 실시간으로 결정을 평가하고 조건이 변경 될 때 조정하기 위해 LLAMA 모델을 만들기 위해 탐구하고 있다고 언급했습니다. 이 반복적 인 접근 방식은 "사고 체인"의 기술을 결합하여 인식, 추론 및 계획을 효과적으로 결합 할 수있는 자율 머신 인텔리전스를 달성합니다.
또한 Paluri는 "비정상적인 도메인"의 AI 추론에서 모델이 동적으로 적응하기 위해 복잡한 작업을 관리 가능한 단계로 분류해야한다고 강조합니다. 예를 들어, 여행을 계획하려면 비행 예약이 필요할뿐만 아니라 실시간 날씨 변화를 다루어야하므로 경로의 재 플래닝으로 이어질 수 있습니다. Meta는 최근에 인간 인식 중 빠른 직관과 느린 사고 사이를 동적으로 전환하여 복잡한 작업을 효과적으로 해결할 수있는 Dualformer 모델을 출시했습니다.
LLAMA 모델의 교육과 관련하여 Meta는 자체 감독 학습 (SSL)을 사용하여 모델이 여러 분야에서 광범위한 데이터 표현을 학습하여 유연성을 제공하는 데 도움이됩니다. 한편, 강화 학습 및 인간 피드백 (RLHF)은 모델이 특정 작업에 대해 더욱 절대적으로 성능을 발휘합니다. 이 둘의 조합은 LLAMA 모델을 고품질 합성 데이터, 특히 언어 특징이 부족한 영역에서 탁월하게 만듭니다.
LLAMA4의 출시와 관련하여 Meta CEO Mark Zuckerberg는 인터뷰에서 팀이 LLAMA4의 사전 훈련을 시작했다고 밝혔다. 그는 또한 Meta가 LLAMA4의 컴퓨팅 클러스터 및 데이터 인프라를 구축하고 있다고 언급했으며, 이는 주요 개선이 될 것으로 예상됩니다. Paluri는 Zuckerberg가 언제 석방되었는지 물어 보면 AI 개발에서 회사의 빠른 진전을 강조하면서“오늘”이라고 말할 수 있다고 유머러스하게 언급했습니다.
메타는 앞으로 몇 달 안에 새로운 LLAMA 버전을 계속 출시하여 AI 기능을 지속적으로 개선하기를 희망합니다. 자주 업데이트되면 개발자는 각 릴리스에 대한 상당한 업그레이드를 기대할 수 있습니다.
핵심 사항 :
- 메타 최고 AI 과학자는 자율 기계 지능이 일상 생활을 향상시키는 데 도움이 될 것이라고 믿는다.
-Llama 모델은 자체 감독 학습 및 강화 학습을 결합하여 멀티 필드 추론 기능을 향상시킵니다.
-LLAMA4에 대한 사전 훈련이 시작되었으며 2025 년경에 출시 될 것으로 예상됩니다.
대체로 Llama 모델에서 Meta의 지속적인 투자와 혁신은 인공 지능 분야에서 야심을 보여줍니다. LLAMA 모델의 미래 개발은 기대할 가치가 있으며 지속적으로 향상된 기능은 사람들이 살고 일하는 방식에 큰 영향을 미칩니다.