Tencent Cloud Ti Platform은 공식적으로 "Full Blood 버전"V3 및 R1 오리지널 모델을 포함하여 671b의 매개 변수 볼륨 및 다중 증류 모델을 포함하여 Deepseek 시리즈의 대형 모델을 공식적으로 출시했습니다. 탁월한 성능 및 MIT 오픈 소스 라이센스를 통해 DeepSeek-R1은 수학, 코드, 자연어 추론 및 GPT-4와 비교할 수있는 작업에서 뛰어납니다. 이번에는 개발자에게 강력한 AI 도구를 제공했을뿐만 아니라 대형 모델의 사용 임계 값을 줄이고 대규모 모델 기술의 대중화 및 적용을 홍보했습니다.
최근 Tencent Cloud Ti 플랫폼은 671b의 매개 변수를 갖춘 "Full Blood 버전"V3 및 R1 모델을 포함하여 매우 눈에 띄는 Deepseek 시리즈 모델의 공식 출시를 발표했습니다 70b에서 1.5b 범위입니다. 이 측정은 개발자에게 강력한 AI 도구 지원을 제공하여 대규모 모델 기술의 대중화 및 적용을 더욱 촉진합니다.
DeepSeek 시리즈 모델은 우수한 성능으로 전 세계적으로 광범위한 관심을 끌었습니다. 그 중에서도 DeepSeek-R1은 출시 될 때 공개되었으며, 라벨이 붙은 데이터가 거의 없더라도 강화 학습 기술이 대규모로 사용되었습니다. 수학, 코드, 자연어 추론 및 기타 작업에서 DeepSeek-R1의 성능은 OpenAI GPT-4의 공식 버전과 비슷합니다. 또한 DeepSeek-R1은 MIT 라이센스를 따라 증류 기술을 통해 다른 모델을 훈련시킬 수 있습니다.
Tencent Cloud Ti 플랫폼은 DeepSeek 시리즈 모델의 원 클릭 배포를 완전히 지원할뿐만 아니라 제한된 시간 동안 R1 모델의 무료 온라인 경험을 엽니 다. 사용자는 "Ti Platform-Big Model Plaza"에서 DeepSeek 시리즈 모델 카드를 클릭하여 모델 정보를 이해하고 온라인 경험 및 원 클릭 배포를 수행 할 수 있습니다. 또한 TI 플랫폼은 모델 서비스 관리, 모니터링 및 운영 및 리소스 스케일링과 같은 엔터프라이즈 레벨 기능을 제공하여 기업 및 개발자가 DeepSeek 모델을 실제 비즈니스에 효율적이고 안정적으로 연결하도록 도와줍니다.
다른 사용자의 요구를 충족시키기 위해 TI 플랫폼은 청구 및 패킷을 포함한 다양한 청구 모델을 제공합니다. 단기 경험이 필요한 사용자의 경우 TI 플랫폼에서 컴퓨팅 전력을 직접 구매하고 CVM 머신을 구매하거나 장기 경험이 필요한 사용자를 위해 미터 별 청구 모드를 선택할 수 있습니다. 자체 CVM 기계를 추론 컴퓨팅 전력 에센스로 사용하십시오. 컴퓨팅 전원 구성 측면에서 "풀 혈액 버전"DeepSeek-R1은 Tencent Cloud에서 안정적인 비즈니스 경험을 얻기 위해 2 개의 8 카드 HCCPNV6 모델을 사용하는 것이 좋습니다. 1.5 B 모델은 단일 미드 엔드 GPU 카드로 배포 할 수 있습니다. 개발자는 비즈니스 복잡성에 따라 테스트하기에 적합한 모델을 선택하고 API에 전화하여 AI 응용 프로그램에 연결할 수 있습니다.
Tencent Cloud Ti 플랫폼의 이러한 새로운 움직임은 개발자에게 강력한 AI 도구 지원을 제공 할뿐만 아니라 대규모 모델 기술의 대중화 및 적용을 강력하게 향상시킬 수 있습니다. TI 플랫폼은 무료 경험과 원 클릭 배포 기능을 통해 개발자가 큰 모델을 사용할 수있는 임계 값을 낮추어 AI 기술을 실제 비즈니스에보다 빠르게 적용하여 AI 기술의 실용성과 접근성을 더욱 향상시킬 수 있습니다.
요컨대, Tencent Cloud Ti Platform은 DeepSeek 시리즈 모델을 시작하여 개발자에게 편리하고 효율적인 대규모 응용 프로그램 경험을 제공하여 인공 지능 기술의 개발 및 적용을 촉진하며 향후 개발을 기대할 가치가 있습니다.