React / Vanilla語音亮點是一個功能強大的庫,用於將文本到語音和實時單詞 /句子集成到您的Web應用程序中。它支持音頻文件,文本到語音API和Web語音綜合API ,使其非常適合創建交互式,易於訪問和動態的用戶體驗。
?嘗試演示:反應語音亮點
我們支持使用香草JS實施。該軟件包的捆綁包大小為45 kb。您可以輕鬆地將此庫與您的網站相結合,也許是使用jQuery的網站
閱讀api_vanilla.md以查看不同的內容。
嘗試演示香草演講亮點
觀看有關JavaScript文本到語音任務的YouTube視頻。
用反應本機CLI構建。嘗試演示Android應用程序
您想要其他實施嗎?只是通過不和諧問我:Albirrkarim
這是網絡版本的文檔
目錄
最近,我想用我網站上說的單詞和句子來實現文本到語音。
然後,我在互聯網上進行搜索。但是我找不到解決所有TTS問題的NPM軟件包
我只想要一些功能強大的軟件包,可以靈活而良好的語音質量。
總體而言,無論是使用Web語音綜合還是音頻文件,文本到語音任務的文本都帶有問題(請參閱問題上的詳細信息)。
使用網絡語音合成
他們有機器人的問題,例如聲音,可用的支持設備等。
使用付費訂閱文本到語音合成API
當我們談論良好的聲音 /人類(如聲音)時,AI模型應該參與其中。因此,如果在客戶端這樣做是沒有意義的。
然後,語音合成API提供商,例如Elevenlabs,Murf AI,Open AI,Amazon Polly和Google Cloud扮演角色。
但是它們沒有提供NPM包來進行突出顯示。
然後我找到了語音。但是我找不到有關使用與其服務集成的一些NPM軟件包有關的文檔。這也是付費訂閱服務。
再次搜索,然後我發現ElevenLab是免費的,如果每月10000個字符,並將在下個月重置。酷吧?因此,我決定將其用作項目中的語音合成API。該平台還不能提供React NPM軟件包來突出顯示音頻,但是它們提供了可以用來產生“當在某些音頻中說單詞”(成績單時間戳)的流量輸出音頻,就像某人對此有關此內容的作品。
在生產中,您必須進行成本計算,您應該選擇哪個TTS服務API提供商。具有功能流音頻的服務是有希望的突出顯示字。但也有高價。便宜的TTS服務API通常沒有太多功能。
ElevenLabs具有高質量的聲音和許多功能,但是當生產來生產時,它們與開放的AI TT相比,在生產中,成本是重要的。
因此,我決定製作此NPM軟件包,將上面的各種方法結合在一起,以實現所有美好的事物並拋出壞事。所有邏輯均在客戶端完成,請查看上面的概述。無需使用高級後端託管。
我的軟件包結合了內置的Web語音合格和音頻文件(可選)。
當使用優先/後備對音頻文件時,您可以從內置的Web Speechsysis中刪除高質量的聲音並刪除所有緊湊型問題。
您如何自動獲取某些文本的音頻文件?您可以使用Elevenlabs,Murf AI,打開AI,Amazon Polly和Google Cloud或任何其他TTS API,只要它們可以產生音頻文件(MP3,MP4,WAV等),請參見Audio_file.md 。在演示網站中,我為您提供了使用ElevenLabs的示例,甚至您也可以在該演示網絡上嘗試自己的音頻文件。
此軟件包只需輸入輸入文本和音頻文件,因此您可以靈活地使用任何可以產生音頻文件的TTS API,當您考慮成本時,一個昂貴的一個甚至便宜的API。
這個包裝如何知道播放音頻的時機口語或句子?該軟件包可以在客戶端檢測口語和句子。
此軟件包是一次付款。沒有訂閱。誰喜歡訂閱?我也沒有。查看如何購買波紋管。
當您是企業家時,我確定您有一些瘋狂的用途案例。
交互式博客
想像一下,您有很長的文章,並且擁有TTS按鈕,然後將文本播放到語音,用戶可以看到文章的閱讀範圍。您的文章將準備就緒,因為此軟件包具有服務器端渲染(SSR)功能。
Web AI Avatar / NPC
在我提供的演示中,您可以從readyplayer.me中看到3D頭像可以活著播放idle
動畫,他們的嘴可以與突出顯示的文本同步到語音,因為它具有反應狀態,代表當前的口語Viseme。我在演示中使用的視覺列表是Oculus OVR Lipsync。
語言學習應用具有真實的人類聲音
查看演示中的示例6。它是使用真實的人聲音進行文字進行語音的一個例子。也許您的本地語言不受TTS API的支持。您可以使用此軟件包使用真實的人類聲音。真正的人類聲音是由真實的人記錄的。真正的人類聲音比TTS API更自然。
學術文本閱讀器
當我們在學術文本上進行TT時,問題。它包含數學方程,公式,符號,顯示所示項與其發音不同。因此,我們利用開放的AI API來思考該術語應該是什麼,我們為某些發音校正引擎做出了什麼。
關係突出顯示YouTube成績單的單詞級別突出顯示
它具有YouTube IFRAME,右側的YouTube成績單,當您播放YouTube視頻時,將突出顯示成績單。突出顯示是基於播放視頻的當前時間。此軟件包是遵循的時間。
關係突出顯示功能 - 當您懸停在某個單詞中時,相關的單詞也將被突出顯示。例如,當您徘徊在中文單詞中時,拼音和英語單詞也將被突出顯示,反之亦然。怎麼樣?看。
帶有自動生成字幕的視頻播放器
案例:您只有沒有文本成績單的音頻或視頻文件。我們的軟件包可以從音頻文件生成成績單。甚至將成績單轉換為其他語言。播放視頻時可以突出顯示字幕,也許它希望一次顯示兩個不同的語言字幕。並根據單詞的含義強調兩者。
在上面的預覽視頻上,視頻原始語言用意大利語,我還用英語展示了翻譯。系統是基於含義的重點。
意大利語bella
在英語beautiful
中有意義
轉到此視頻演示頁面。
您的用例
只需問我要做什麼,包裝架構可擴展以製作各種功能。
請參閱包含簡單示例代碼的API.MD和example_code.md。
完整的示例代碼和實現示例是使用Demo網站上的源代碼。購買此軟件包時,包括演示網站的源代碼。
此軟件包是用打字稿編寫的,您不必在此處讀取所有文檔,因為此軟件包現在支持JS Doc和VS Code Intellisense,那是什麼?僅當您將鼠標懸停到某些變量或功能與代碼中時,它將顯示一些彈出窗口(簡單教程)函數是什麼,示例,參數等...
只需使用Demo網站上的源代碼,您就可以從字面上理解該軟件包。
ChangElog包含有關新功能的信息,提高準確性,修復錯誤以及在更新版本時應該做什麼。
請參閱ChangElog.md
沒有退款。
我喜歡客戶的反饋。您可以在“問題”選項卡上寫入,因此當我有時間時,我可以嘗試解決該問題並進行下一個更新。
還在擔心嗎?請參閱《生產者》的評論
好吧,我需要資金來資助研究,您知道製作複雜的包裹花費了很多時間,當然還有金錢。
使LLM發動機結合了迅速的工程和有效算法來節省開放AI API成本。需要進行測試,並且測試的重複是API調用的費用。
另外,我還通過Discord(用戶名:Albirrkarim)通過實時私人聊天提供支持,那裡有任何服務嗎?
該軟件包是可用於各種用例的base
軟件包。我用包裹賺了很多錢。極限是您的企業家技能。
以更高的價格,我保持了功能的稀缺性。
告訴我的問題或困難,我將向您展示解決這個問題的方法。
我通過不和諧提供了我的實時支持。
只是買它。刪除頭痛。您可以專注於您的項目。
是的,如果您是學生或老師,則可以享受折扣。只需告訴我您的學生卡或老師卡即可。
是的,如果您幫助我投票在產品狩獵方面投票
您可以在此存儲庫中查看文檔,並且該軟件包用打字稿編寫,並使用JEST進行測試以確保質量。
您不必閱讀此處的所有文檔,因為現在該軟件包支持VS代碼Intellisense,那是什麼?僅當您將鼠標懸停到某些變量或功能與代碼中時,它將顯示一些彈出窗口(簡單教程)函數是什麼,示例,參數等...
只需使用Demo網站上的源代碼,您就可以從字面上理解該軟件包。
是的,只需問Chat GPT,並解釋您的問題。
例子 :
“我的項目正在使用webpack,代碼正在使用JSX,我想在JSX旁邊使用TSX代碼,我該如何?”
Goto The Vanilla演講亮點
我製作演示以將Viseme輸出到console.log中。只需打開瀏覽器控制台,然後播放Exex Audio示例(英語)即可。您將在當前播放的TTS時機中看到單詞和Viseme。
只要看到演示
嘗試使用偏愛或後備到音頻文件,請參閱audio_file.md
或者
嘗試在設備中設置語音綜合或語言。
如果使用智能手機(Android):
確保安裝語音識別和綜合
如果步驟1不起作用。嘗試下載Google鍵盤。然後設置聽寫語言。等待幾分鐘(您的設備將自動下載語音),然後重新啟動智能手機。
您的設備將首先下載該聲音。然後,您的設備將在本地具有該聲音。
嘗試使用偏愛或後備到音頻文件,請參閱audio_file.md
是的,請參閱
此軟件包需要打開AI API,以更好地執行文本到語音任務(解決了我在Qualises.s.md中寫的許多問題)。
但是,如果您不想使用打開的AI API,它仍然可以正常工作。查看有關此軟件包使用的依賴性的常見問題解答?
NPM依賴性:
對於React語音亮點:請參閱此存儲庫中的package.json。在構建此軟件包後,請參閱peerDependencies
您將僅需要在peerDependencies
中使用的NPM軟件包。只反應。
對於香草語音亮點:無依賴性,只需使用香草JS文件即可。
AI依賴性:
此軟件包需要打開AI API,以更好地執行文本到語音任務(解決了我在Qualises.s.md中寫的許多問題)。
可選地使用任何可以生成音頻文件的TTS API,以提高聲音質量。像Elevenlabs一樣,MURF AI,打開AI,Amazon Polly和Google Cloud或任何其他TTS API,只要它們可以生成音頻文件(MP3,MP4,WAV等),請參見Audio_file.md。
是的,請參閱test.md上的細節
或者,您可以嘗試使用偏愛或後備到音頻文件,請參閱audio_file.md
它只是工作。簡單的解釋是上面的引言。
架構可擴展,只需問我想要什麼功能即可。
請參閱llm_engine.md
不,因為我的軟件包處理了所有批處理系統,發音系統並提供文本,因此TTS API可以生成可用於突出顯示的音頻文件。
您只需執行緩存策略即可緩存請求響應。對於音頻文件打開AI API和TTS API。
適用於個人開發人員,自由職業者或小型企業。
價格為200美元。太貴了嗎?請參閱演示網站,可能會為您提供折扣,或填寫此表格,當您收到要約時收到的通知。
付款後,您將被邀請到我的私人存儲庫,在那裡您可以訪問一年,包括在此期間的所有更新。
對於隨後幾年的持續訪問,您每年可以支付50美元以留在私人存儲庫中。
你得到了什麼
演示網站(下一個基於JS)
包裝庫(React Elect Speakemight)
包裝倉庫(香草語音亮點)
我知道此軟件包很複雜,某些需要架構和高級編程技能才能使用它的功能。
因此,我對如何使用這種高級武器進行了一些完整的屏幕截圖教程。
從安裝到高級實施等示例。
價格是訂閱$ 5 /月。 (即將推出)
對於已經有業務且需要長期使用的固體軟件包的您而言。
價格為700美元。
你得到了什麼
價格為150美元。
你得到了什麼
包含:YouTube關係成績單重點,視頻自動生成筆錄,流TTS
包含:Backenify LLM引擎
React GPT Web指南($ 100) + React Speeck Emairlight( $ 200 )($ 50)= $ 150
你得到了什麼
我接受各種付款方式:
Github贊助商
選擇一個時間選項卡,選擇該選項,然後按照Github的下一個指令遵循。
因此,此包是您尋找的人的答案: