프랑스 오픈 소스 AI Research Laboratory Kyutai는 최근 Moshi라는 멀티 모달 모델을 시작했습니다. Moshi의 릴리스는 음성 상호 작용 및 실시간 추론에서 AI 기술의 큰 잠재력을 보여 주어 전 세계 AI 애호가들에게 새로운 경험을 제공합니다.
7 월 4 일 이른 아침, Kyutai는 공식 웹 사이트를 통해 Moshi의 탄생을 공식적으로 발표했습니다. 이 모델은 OpenAI의 GPT-4O와 동일한 기능을 가지고 있으며 음성을 통해 실시간 Q & A를 수행 할 수 있습니다. 그러나 가을이 완전히 열릴 때까지 기다려야하는 GPT-4O의 음성 모드와 달리 Moshi는 대중에게 공개되어 시장에서 초연되었습니다.
Moshi의 주요 기능에는 멀티 모드 능력, 즉 사용자의 음성 질문을 듣고 실시간 추론 답변을 수행 할 수 있습니다. 또한 Moshi의 음성 모드가 완전히 열리고 GPT-4O의 가을 출시 계획과 비교하여 Moshi는 사용자에게 더 빠른 경험을 제공합니다. 더 중요한 것은 Moshi는 지역 제한이 없으며 전 세계 사용자가 사용할 수 있으며, 만다린에 대한 지원은 아직 완벽하지는 않지만 영어 질문은 완전히 접근 할 수 있습니다.
Kyutai는 또한 오픈 소스 Moshi를 계획하고 있으며, 코드, 모델 가중치 및 논문을 게시 할 것입니다.
모시의 출시는 의심 할 여지없이 AI 기술에 대한 대담한 시도입니다. 그것은 듣고 말할 수있는 능력뿐만 아니라 미래에 볼 수있는 능력을 보여줄 수있어 AI의 미래를 기대합니다. Moshi를 사용하는 과정은 매우 간단합니다. 공식 웹 사이트에 로그인하고 이메일 주소를 작성하고 Moshi와의 대화를 시작하십시오.
만다린에 대한 모시의 지원을 개선해야하며 영어로 질문을하면 더 나은 경험을 제공 할 것입니다. 또한 Moshi는 잠긴 상태가 아니며 어디에 있든 직접 사용할 수 있으며, 이는 의심 할 여지없이 전 세계 AI 애호가에게 큰 편의를 제공합니다.
Kyutai Laboratory에 의한 이러한 움직임은 또한 오픈 소스 정신에서의 지속성을 보여줍니다. 그들은 곧 오픈 소스 모시, 코드, 모델 가중치 및 논문을 게시하여 전 세계의 개발자와 연구원이 Moshi의 개발 및 최적화에 참여할 수 있도록 계획합니다.
사용 경험 측면에서, Moshi의 응답 속도는 매우 빠르며, 국가 노선에서 사용하더라도 거의 지연없이 질문에 응답 할 수 있습니다. 현재 Moshi는 주로 영어와 프랑스어를 지원하며 중국 만다린 지원을 개선해야합니다. 등록 절차는 간단합니다. 이메일 주소를 제출하십시오. 모시는 듣고 말하는 능력을 보여 주며 미래에 시청 능력을 향상시킬 수도 있습니다. 모시의 의인화 톤은 기계 냄새가 거의없는 주요 특징 중 하나이며 대화가 더 자연스럽고 매끄럽게 만듭니다.
물론, Moshi의 현재 답변은 여전히 비교적 제한적이며 일반적인 개요와 요약 만 제공 할 수 있습니다. 그러나 제품의 지속적인 반복 및 최적화로 인해 Moshi의 대답은 더 자세하고 정확해질 것이라고 생각합니다.
또한 Moshi의 발표는 교육 산업에 큰 영향을 미칠 것입니다. 예를 들어, AI는 학생들에게 순환 설명을 제공 할 수 있으며, 이는 교육에 큰 도움이됩니다. 우리는 앞으로 더 유사한 제품을 기대하고 더 많은 현지 언어를 지원하며 AI 기술을 사람들의 삶에 더 가깝게 만듭니다.