react speech highlight demo下載 - react speech highlight demo源代碼下載

react speech highlight demo

Ai源碼

1.0.0

下載

React / Vanilla語音突出顯示 - 帶有單詞的文字到語音突出顯示

React / Vanilla演講亮點

React / Vanilla語音亮點是一個功能強大的庫，用於將文本到語音和實時單詞 /句子集成到您的Web應用程序中。它支持音頻文件，文本到語音API和Web語音綜合API ，使其非常適合創建交互式，易於訪問和動態的用戶體驗。

？嘗試演示：反應語音亮點

react.speech.highlight.mp4

其他版本

香草JS（本地JavaScript）

我們支持使用香草JS實施。該軟件包的捆綁包大小為45 kb。您可以輕鬆地將此庫與您的網站相結合，也許是使用jQuery的網站

閱讀api_vanilla.md以查看不同的內容。

嘗試演示香草演講亮點

觀看有關JavaScript文本到語音任務的YouTube視頻。

反應本地語音亮點

React-native.mp4

用反應本機CLI構建。嘗試演示Android應用程序

您想要其他實施嗎？只是通過不和諧問我：Albirrkarim

這是網絡版本的文檔

v5.3.6的文檔

A.簡介
B. Todo
C. API和示例代碼
D. Changelog
E.免責聲明和保修
F.常見問題解答
G.付款

A.簡介

我想要什麼？

最近，我想用我網站上說的單詞和句子來實現文本到語音。

然後，我在互聯網上進行搜索。但是我找不到解決所有TTS問題的NPM軟件包

我只想要一些功能強大的軟件包，可以靈活而良好的語音質量。

我在互聯網上搜索時得到的東西：

總體而言，無論是使用Web語音綜合還是音頻文件，文本到語音任務的文本都帶有問題（請參閱問題上的詳細信息）。

使用網絡語音合成

他們有機器人的問題，例如聲音，可用的支持設備等。

使用付費訂閱文本到語音合成API

當我們談論良好的聲音 /人類（如聲音）時，AI模型應該參與其中。因此，如果在客戶端這樣做是沒有意義的。

然後，語音合成API提供商，例如Elevenlabs，Murf AI，Open AI，Amazon Polly和Google Cloud扮演角色。

但是它們沒有提供NPM包來進行突出顯示。

然後我找到了語音。但是我找不到有關使用與其服務集成的一些NPM軟件包有關的文檔。這也是付費訂閱服務。

再次搜索，然後我發現ElevenLab是免費的，如果每月10000個字符，並將在下個月重置。酷吧？因此，我決定將其用作項目中的語音合成API。該平台還不能提供React NPM軟件包來突出顯示音頻，但是它們提供了可以用來產生“當在某些音頻中說單詞”（成績單時間戳）的流量輸出音頻，就像某人對此有關此內容的作品。

在生產中，您必須進行成本計算，您應該選擇哪個TTS服務API提供商。具有功能流音頻的服務是有希望的突出顯示字。但也有高價。便宜的TTS服務API通常沒有太多功能。

ElevenLabs具有高質量的聲音和許多功能，但是當生產來生產時，它們與開放的AI TT相比，在生產中，成本是重要的。

解決方案

概述React語音突出顯示如何工作

因此，我決定製作此NPM軟件包，將上面的各種方法結合在一起，以實現所有美好的事物並拋出壞事。所有邏輯均在客戶端完成，請查看上面的概述。無需使用高級後端託管。

我的軟件包結合了內置的Web語音合格和音頻文件（可選）。

當使用優先/後備對音頻文件時，您可以從內置的Web Speechsysis中刪除高質量的聲音並刪除所有緊湊型問題。

您如何自動獲取某些文本的音頻文件？您可以使用Elevenlabs，Murf AI，打開AI，Amazon Polly和Google Cloud或任何其他TTS API，只要它們可以產生音頻文件（MP3，MP4，WAV等），請參見Audio_file.md 。在演示網站中，我為您提供了使用ElevenLabs的示例，甚至您也可以在該演示網絡上嘗試自己的音頻文件。

此軟件包只需輸入輸入文本和音頻文件，因此您可以靈活地使用任何可以產生音頻文件的TTS API，當您考慮成本時，一個昂貴的一個甚至便宜的API。

這個包裝如何知道播放音頻的時機口語或句子？該軟件包可以在客戶端檢測口語和句子。

此軟件包是一次付款。沒有訂閱。誰喜歡訂閱？我也沒有。查看如何購買波紋管。

功能概述

用例

當您是企業家時，我確定您有一些瘋狂的用途案例。

交互式博客
想像一下，您有很長的文章，並且擁有TTS按鈕，然後將文本播放到語音，用戶可以看到文章的閱讀範圍。您的文章將準備就緒，因為此軟件包具有服務器端渲染（SSR）功能。
Web AI Avatar / NPC
在我提供的演示中，您可以從readyplayer.me中看到3D頭像可以活著播放idle動畫，他們的嘴可以與突出顯示的文本同步到語音，因為它具有反應狀態，代表當前的口語Viseme。我在演示中使用的視覺列表是Oculus OVR Lipsync。
語言學習應用具有真實的人類聲音
查看演示中的示例6。它是使用真實的人聲音進行文字進行語音的一個例子。也許您的本地語言不受TTS API的支持。您可以使用此軟件包使用真實的人類聲音。真正的人類聲音是由真實的人記錄的。真正的人類聲音比TTS API更自然。
學術文本閱讀器
當我們在學術文本上進行TT時，問題。它包含數學方程，公式，符號，顯示所示項與其發音不同。因此，我們利用開放的AI API來思考該術語應該是什麼，我們為某些發音校正引擎做出了什麼。
關係突出顯示YouTube成績單的單詞級別突出顯示
YouTube-Transcript-highlight.mp4
它具有YouTube IFRAME，右側的YouTube成績單，當您播放YouTube視頻時，將突出顯示成績單。突出顯示是基於播放視頻的當前時間。此軟件包是遵循的時間。
關係突出顯示功能 - 當您懸停在某個單詞中時，相關的單詞也將被突出顯示。例如，當您徘徊在中文單詞中時，拼音和英語單詞也將被突出顯示，反之亦然。怎麼樣？看。
帶有自動生成字幕的視頻播放器
Video-Auto-Transcribe.mp4
案例：您只有沒有文本成績單的音頻或視頻文件。我們的軟件包可以從音頻文件生成成績單。甚至將成績單轉換為其他語言。播放視頻時可以突出顯示字幕，也許它希望一次顯示兩個不同的語言字幕。並根據單詞的含義強調兩者。
在上面的預覽視頻上，視頻原始語言用意大利語，我還用英語展示了翻譯。系統是基於含義的重點。
意大利語bella在英語beautiful中有意義
轉到此視頻演示頁面。
您的用例
只需問我要做什麼，包裝架構可擴展以製作各種功能。

B. Todo

使用LLM添加Discord Chat Bot來解釋API，並說明您要製作的內容，它們將為您提供代碼。
自動化蠻力最終測試，測試所有API，運行時，順序動作等...
添加對漢字的觀察支持
讓我知道您想要的內容，包裝架構可擴展以製作各種功能，請在“問題”選項卡上寫下，或通過Discord與我聯繫（用戶名：Albirrkarim）

C. API和示例代碼

請參閱包含簡單示例代碼的API.MD和example_code.md。

完整的示例代碼和實現示例是使用Demo網站上的源代碼。購買此軟件包時，包括演示網站的源代碼。

此軟件包是用打字稿編寫的，您不必在此處讀取所有文檔，因為此軟件包現在支持JS Doc和VS Code Intellisense，那是什麼？僅當您將鼠標懸停到某些變量或功能與代碼中時，它將顯示一些彈出窗口（簡單教程）函數是什麼，示例，參數等...

只需使用Demo網站上的源代碼，您就可以從字面上理解該軟件包。

Intellisense.mp4

D. Changelog

ChangElog包含有關新功能的信息，提高準確性，修復錯誤以及在更新版本時應該做什麼。

請參閱ChangElog.md

E.免責聲明和保修

沒有退款。

我喜歡客戶的反饋。您可以在“問題”選項卡上寫入，因此當我有時間時，我可以嘗試解決該問題並進行下一個更新。

還在擔心嗎？請參閱《生產者》的評論

F.常見問題解答

為什麼很貴？為什麼不是OpenSource包？

好吧，我需要資金來資助研究，您知道製作複雜的包裹花費了很多時間，當然還有金錢。

使LLM發動機結合了迅速的工程和有效算法來節省開放AI API成本。需要進行測試，並且測試的重複是API調用的費用。

另外，我還通過Discord（用戶名：Albirrkarim）通過實時私人聊天提供支持，那裡有任何服務嗎？

該軟件包是可用於各種用例的base軟件包。我用包裹賺了很多錢。極限是您的企業家技能。

以更高的價格，我保持了功能的稀缺性。

支持怎麼樣？

告訴我的問題或困難，我將向您展示解決這個問題的方法。

我通過不和諧提供了我的實時支持。

只是買它。刪除頭痛。您可以專注於您的項目。

你能給我一些折扣嗎？

是的，如果您是學生或老師，則可以享受折扣。只需告訴我您的學生卡或老師卡即可。

是的，如果您幫助我投票在產品狩獵方面投票

它有據可查且精心製作嗎？

您可以在此存儲庫中查看文檔，並且該軟件包用打字稿編寫，並使用JEST進行測試以確保質量。

您不必閱讀此處的所有文檔，因為現在該軟件包支持VS代碼Intellisense，那是什麼？僅當您將鼠標懸停到某些變量或功能與代碼中時，它將顯示一些彈出窗口（簡單教程）函數是什麼，示例，參數等...

只需使用Demo網站上的源代碼，您就可以從字面上理解該軟件包。

Intellisense.mp4

這個包裹用打字稿編寫？它可以與JSX或本機JS項目混合在一起嗎？

是的，只需問Chat GPT，並解釋您的問題。

例子：

“我的項目正在使用webpack，代碼正在使用JSX，我想在JSX旁邊使用TSX代碼，我該如何？”

視覺世代的準確性如何？

Goto The Vanilla演講亮點

我製作演示以將Viseme輸出到console.log中。只需打開瀏覽器控制台，然後播放Exex Audio示例（英語）即可。您將在當前播放的TTS時機中看到單詞和Viseme。

高光能力的準確性如何？

只要看到演示

為什麼設備上沒有可用的聲音？

嘗試使用偏愛或後備到音頻文件，請參閱audio_file.md

或者

嘗試在設備中設置語音綜合或語言。

如果使用智能手機（Android）：

確保安裝語音識別和綜合
如果步驟1不起作用。嘗試下載Google鍵盤。然後設置聽寫語言。等待幾分鐘（您的設備將自動下載語音），然後重新啟動智能手機。

為什麼演講不適合初次演奏的聲音？（網絡語音綜合）

您的設備將首先下載該聲音。然後，您的設備將在本地具有該聲音。

嘗試使用偏愛或後備到音頻文件，請參閱audio_file.md

我可以在不顯示亮點的情況下使用此文本對語音嗎？

是的，請參閱

沒有OpenAI API，我可以使用嗎？

此軟件包需要打開AI API，以更好地執行文本到語音任務（解決了我在Qualises.s.md中寫的許多問題）。

但是，如果您不想使用打開的AI API，它仍然可以正常工作。查看有關此軟件包使用的依賴性的常見問題解答？

該軟件包使用什麼依賴性？

NPM依賴性：

對於React語音亮點：請參閱此存儲庫中的package.json。在構建此軟件包後，請參閱peerDependencies您將僅需要在peerDependencies中使用的NPM軟件包。只反應。
對於香草語音亮點：無依賴性，只需使用香草JS文件即可。

AI依賴性：

此軟件包需要打開AI API，以更好地執行文本到語音任務（解決了我在Qualises.s.md中寫的許多問題）。
可選地使用任何可以生成音頻文件的TTS API，以提高聲音質量。像Elevenlabs一樣，MURF AI，打開AI，Amazon Polly和Google Cloud或任何其他TTS API，只要它們可以生成音頻文件（MP3，MP4，WAV等），請參見Audio_file.md。

支持各種瀏覽器和設備？

是的，請參閱test.md上的細節

或者，您可以嘗試使用偏愛或後備到音頻文件，請參閱audio_file.md

它如何工作？軟件包架構是否可擴展？

它只是工作。簡單的解釋是上面的引言。

架構可擴展，只需問我想要什麼功能即可。

使用打開AI API用於包裝使用的API成本如何？

請參閱llm_engine.md

我們公司已經製作了很多音頻文件，我可以將其用於突出顯示您的軟件包嗎？

不，因為我的軟件包處理了所有批處理系統，發音系統並提供文本，因此TTS API可以生成可用於突出顯示的音頻文件。

您只需執行緩存策略即可緩存請求響應。對於音頻文件打開AI API和TTS API。