Dark Side of the Moon 키미 멀티모달 이미지 이해 모델 API 출시 - AI 기사

저자：Eve Cole 업데이트 시간：2025-01-28 16:32:01

Beijing Dark Side of the Moon Technology Co., Ltd.는 새로운 다중 모드 이미지 이해 모델인 Moonshot-v1-vision-preview를 출시했습니다. 이 모델은 Moonshot-v1 시리즈의 확장판으로 Kimi의 이미지 정보 이해 능력을 크게 향상시켰습니다. . Vision 모델은 강력한 이미지 인식 기능을 갖추고 있어 블루베리 머핀과 치와와의 매우 유사한 사진을 쉽게 구별하는 등 미묘한 차이를 정확하게 구분할 수 있습니다. 또한 OCR 텍스트 인식 성능도 뛰어나 영수증, 택배 주문 등 휘갈겨 쓴 손글씨를 포함한 다양한 문서를 정확하게 인식할 수 있다. 이 모델은 멀티 라운드 대화, 스트리밍 출력 등 다양한 기능을 지원하여 사용자에게 보다 편리하고 효율적인 경험을 제공합니다.

2025년 1월 15일, Beijing Dark Side of the Moon Technology Co., Ltd.는 새로운 다중 모드 이미지 이해 모델 Moonshot-v1-vision-preview의 공식 출시를 발표했습니다. 이 모델은 Moonshot의 다중 모드 기능을 향상시킵니다. -v1 모델 시리즈는 Kimi가 세상을 더 잘 이해하도록 도와줍니다.

Vision 모델은 강력한 이미지 인식 기능을 갖추고 있어 음식이든 동물이든 이미지의 복잡한 세부 사항과 뉘앙스를 정확하게 식별할 수 있으며 유사하지만 동일하지 않은 물체를 구별할 수 있습니다. 예를 들어, 인간의 눈으로 구별하기 어려운 블루베리 머핀과 치와와의 유사한 사진 16장에 직면하면 Vision 모델은 이를 정확하게 구별하고 식별할 수 있습니다.

Vision 모델은 또한 국내 최고의 고급 이미지 인식 기능을 갖추고 있으며 OCR 텍스트 인식 및 이미지 이해 시나리오에서 우수한 성능을 발휘하며 일반 문서 스캐닝 및 OCR 인식 소프트웨어보다 정확하며 영수증 및 빠른 배송 주문과 같이 휘갈겨 쓴 내용을 인식할 수 있습니다. .

微信截图_20250115135433.png

Vision 비전 모델은 여러 라운드의 대화, 스트리밍 출력, 도구 호출, JSON 모드, 부분 모드 및 기타 기능을 지원하지만 현재는 이미지 콘텐츠가 포함된 컨텍스트 캐시 생성을 지원하지 않습니다. 성공적으로 생성된 캐시 호출의 사용 Vision 모델은 URL 형식의 이미지를 지원하지 않으며 현재 base64로 인코딩된 이미지 콘텐츠만 지원합니다.

모델 청구

모델 청구 단가 moonshot-v1-8k-vision-preview100만 토큰12.00moonshot-v1-32k-vision-preview100만 토큰24.00moonshot-v1-128k-vision-preview100만 토큰60.00

Moonshot-v1-vision-preview 모델의 출시는 다중 모드 인공 지능 분야에서 Beijing Dark Side of the Moon Technology Co., Ltd.가 이룩한 새로운 돌파구를 의미하며 이미지 이해 개발의 새로운 방향을 제시합니다. 기술. 강력한 성능과 풍부한 기능은 많은 응용 시나리오에서 광범위한 응용 가능성을 제공하며 향후 개발 및 응용을 기대할 가치가 있습니다.