American AI Startup 인 Smallest.ai는 최신 제품인 Lightning, TTS (Text-Toecee) 모델을 놀라운 속도로 출시했습니다. Lightning은 100 밀리 초에서 최대 10 초의 오디오를 생성하고 영어와 힌디어의 여러 악센트를 지원하며 더 많은 언어를 지원할 계획입니다. 저렴한 비용 (분당 0.02 달러)과 간단한 REST API 디자인은 음성 로봇 개발자에게 이상적이며 개발 및 운영 비용을 크게 줄이고 음성 합성 효율성 및 응용 프로그램 액세스를 향상시킵니다. 이 기사는 다양한 기능적 특성, 시장 포지셔닝 및 가장 작은 기업 비전을 자세히 분석합니다.
최근 캘리포니아 주 샌프란시스코에 본사를 둔 AI 스타트 업인 Smallest.AI는 100 밀리 초 내에 최대 10 초의 오디오를 생성 할 수있는 TTS (Text-To-Steepee) 모델 인 신제품 Lightning을 출시했습니다. 이 기술의 발전으로 인해 전 세계의 개발자가 매우 짧은 지연 시간으로 시뮬레이션 된 음성 로봇 애플리케이션을 구축 할 수 있었으며 구현 비용을 줄이고 응용 프로그램 접근성을 향상시킬 수있었습니다.
Lightning은 현재 영어와 힌디어의 여러 악센트를 지원하며 팀은 또한 시장 수요를 충족시키기 위해 더 많은 언어를 신속하게 추가 할 계획입니다. 분당 US $ 0.02의 가격 (약 1.6 약 1.6)이 모델은 음성 로봇 개발자를위한 비용 효율적인 솔루션을 제공하며, 응용 프로그램 운영 비용은 분당 1 미만으로 제어되며 음성 로봇 구축 비용을 크게 줄이고 시장 접근성을 확대합니다.
스트리밍 및 네트워크 소켓에 의존하여 서버 부담과 복잡한 확장 성을 향상시키는 기존 TTS 모델과 달리 Lightning은 간단한 REST API 설계를 사용하여 오디오를 약 100 밀리 초로 전달하여 서버 압력을 피합니다. 이 빠른 처리 능력과 비용 효율성은 음성 로봇 산업에서 중요한 대안이됩니다.
Lightning의 제품 기능은 다음과 같이 요약 할 수 있습니다
1. 속도와 효율성. 세계에서 가장 빠른 텍스트 음성으로 알려진 Lightning 모델은 100 밀리 초, 실시간 음성 합성으로 10 초의 초현실적 오디오를 생성하여 빠른 응답의 요구를 충족시킵니다.
2. 작고 호환성. 비디오 메모리 요구 사항이 1GB 미만인 모델의 크기는 작고 대부분의 소비자 및 에지 장치에서 쉽게 실행할 수있어 하드웨어 요구 사항이 줄어 듭니다.
3. 다국어 지원. 다국어 및 악센트 지원은 현재 영어 및 힌디어의 여러 악센트를 지원하며 전 세계 사용자의 요구를 충족시키기 위해 더 많은 언어를 신속하게 추가 할 계획입니다.
4. 고도로 사용자 정의 가능. 특별한 스타일 디퓨저를 사용하는 스타일 디퓨저는 사용자 요구에 따라 오디오 스타일을 조정하여 생성 된 목소리를 더 자연스럽고 감정적으로 만듭니다.
5. 간단한 통합. REST API 통합은 간단한 REST API 인터페이스를 제공하며 개발자는 번개 모델을 기존 시스템에 빠르게 통합하여 복잡한 WebSocket 연결을 제거 할 수 있습니다.
6. 저렴한 가격은 분당 US $ 0.04로 시작하여 모든 유형의 기업에 적합합니다.
Smallest.ai는 Indian Institute of Technology Guwahati Alumni Sudarshan Kamath와 Akshat Mandloi에 의해 설립되었습니다. Kamath는 Smallest.AI의 저가 전략은 데이터 품질 및 모델 효율성에 중점을두기 때문이라고 말했다. "우리의 모델은 ElevenLabs와 같은 경쟁 업체보다 훨씬 작지만 세련된 데이터로 고품질 음성 출력을 달성합니다."라고 그는 설명합니다.
Lightning에 조기에 접근 한 음성 로봇 개발자는 운영 비용이 8 배나 줄어든 반면 오디오 품질이 향상되었다고보고했습니다. 실시간 음성 로봇 앱 외에도 Lightning은 Instagram 및 YouTube와 같은 플랫폼과 같은 오디오 북 및 소셜 미디어 컨텐츠를위한 음성 오버를 만드는 데 사용될 수 있습니다. 비 개발자는 또한 파도 스피치 플랫폼을 통해 번개에 액세스하여 현재 베타 버전에있는 사운드 클로닝 및 악센트 변환을 포함한 기능을 경험할 수 있습니다.
Kamath는 Journal of Analytics India와의 독점적 인 상호 작용에서 다음과 같이 말했습니다 생산. "요구.”
올해 6 월 Smallest.ai는 짧은 오디오 클립을 통해 사운드 클로닝을 지원하는 Awaaz 모델을 출시했으며 경쟁력있는 가격으로 가격이 책정되었습니다. 이 모델은 지역 언어 시장에서 확장 가능한 응용 프로그램을 충족시키고 엔터프라이즈 수준의 보안 및 규정 준수를 제공하도록 설계되었습니다. Kamath는 미션에 대해 물었습니다.“수십억 명의 사람들이 Voice AI 기술의 큰 발전에도 불구하고 매일 AI 음성과 의사 소통하지 않는 이유는 무엇입니까?”
프로젝트 입구 : https://smallest.ai/blog/lightning-fast-text-speech
핵심 사항 :
Lightning Text-Steech Model은 100 밀리 초의 오디오를 생성하고 영어와 힌디어의 여러 악센트를 지원하며 앞으로 더 많은 언어를 확장 할 것입니다.
분당 0.02 달러의 저렴한 비용으로 음성 로봇 개발자의 운영 비용이 크게 줄어 듭니다.
번개는 음성 로봇뿐만 아니라 오디오 북 및 소셜 미디어 더빙에도 적합하여 개발자와 비 개발자가 쉽게 사용할 수 있습니다.
요컨대, 가장 작은 Lightning 모델은 속도, 효율성, 저렴한 비용 및 사용 편의성으로 음성 합성 분야에 혁명을 일으켜 글로벌 개발자와 사용자에게보다 편리하고 경제적 인 음성 AI 서비스를 제공 할 것으로 예상됩니다. Voice AI 기술의 포괄 성을 해결하려는 비전도 주목할 가치가 있습니다.