Download react speech highlight demo react speech highlight demo React

react speech highlight demo

Kode Sumber AI

1.0.0

Unduh

React / Vanilla Speech Sorotan-Teks-ke-Pidato dengan Word Sorote

Sorotan Pidato Bereaksi / Vanilla

Sorotan Pidato React / Vanilla adalah perpustakaan yang kuat untuk mengintegrasikan kata-ke-kata dan kata-kata real-time / kalimat yang menyorot ke dalam aplikasi web Anda. Ini mendukung file audio , API Text-to-Speech , dan API Sintesis Pidato Web , menjadikannya ideal untuk menciptakan pengalaman pengguna yang interaktif, mudah diakses, dan dinamis.

? Coba Demo: Sorotan Pidato Bereaksi

React.speech.highlight.mp4

Versi lainnya

Vanilla JS (Javascript asli)

Kami mendukung implementasi menggunakan Vanilla JS. Paket ini memiliki ukuran bundel 45 kb. Anda dapat dengan mudah menggabungkan perpustakaan ini dengan situs web Anda, mungkin situs web Anda menggunakan jQuery

Baca api_vanilla.md untuk melihat perbedaannya.

Coba sorotan pidato vanilla demo

Tonton Video YouTube tentang implementasi sorotan pidato vanilla untuk tugas JavaScript untuk tugas bicara.

Bereaksi Sorotan Pidato Asli

react-native.mp4

Dibangun dengan CLI Native React. Coba Demo Android App

Apakah Anda ingin implementasi lain? Tanyakan saja padaku melalui Perselisihan: Albirrkarim

Ini adalah dokumentasi untuk versi web

Dokumen untuk v5.3.6

Daftar isi

A. Pendahuluan
B. TODO
C. API & Contoh Kode
D. Changelog
E. Penafian & Garansi
F. FAQ
G. Pembayaran

A. Pendahuluan

Apa yang saya inginkan?

Baru-baru ini, saya ingin mengimplementasikan teks-ke-speech dengan menyorot kata dan kalimat yang diucapkan di situs web saya.

Lalu saya mencari di internet. Tapi saya tidak dapat menemukan paket NPM untuk menyelesaikan semua masalah TTS

Saya hanya ingin beberapa paket kuat yang kualitas suara yang fleksibel dan bagus.

Di sini apa yang saya dapatkan ketika saya mencari di internet:

Secara keseluruhan tugas teks ke bicara hadir dengan masalah (lihat detail tentang masalah.md) apakah menggunakan sintesis pidato web atau file audio.

Menggunakan Web Speechsynthesis

Mereka memiliki masalah robot seperti suara, perangkat yang didukung tersedia, dll.

Menggunakan API Sintesis Teks-ke-Speech Berbayar

Ketika kita berbicara tentang suara yang baik / manusia seperti suara AI Inference harus terlibat. Jadi tidak masuk akal jika melakukan itu di sisi klien.

Kemudian penyedia API sintesis pidato seperti Elevenlabs, Murf AI, Open AI, Amazon Polly, dan Google Cloud memainkan peran mereka.

Tetapi mereka tidak menyediakan paket NPM untuk melakukan sorotan.

Kemudian saya menemukan Pidato. Tetapi saya tidak menemukan dokumen tentang menggunakan beberapa paket NPM yang terintegrasi dengan layanan mereka. Ini juga layanan langganan berbayar.

Mencari lagi, lalu saya menemukan ElevenLab gratis jika karakter / bulan 100.000 dan akan direset pada bulan depan. Keren kan? Jadi saya memutuskan untuk menggunakan ini sebagai API sintesis ucapan dalam proyek saya. Platform ini juga tidak menyediakan paket React NPM untuk menyoroti audio mereka, tetapi mereka menyediakan audio output streaming yang dapat digunakan untuk menghasilkan "ketika kata -kata diucapkan dalam beberapa audio" (cap waktu) seperti yang dibuat seseorang tentang hal ini.

Dalam produksi Anda harus melakukan perhitungan biaya , penyedia API layanan TTS mana yang harus Anda pilih. Layanan yang memiliki audio streaming kemampuan menjanjikan kata sorotan. tetapi juga datang dengan harga tinggi. API layanan TTS murah biasanya tidak memiliki banyak fitur.

Elevenlab telah menghasilkan suara berkualitas baik dan banyak fitur, tetapi ketika datang untuk produksi mereka lebih mahal membandingkan dengan AI TTS terbuka, dalam produksi biayanya adalah masalah penting.

Solusi

Tinjauan Bagaimana cara kerja sorotan pidato reaksi

Jadi, saya memutuskan untuk membuat paket NPM ini yang menggabungkan berbagai metode di atas untuk mencapai semua hal baik dan melemparkan hal -hal buruk. Semua logika dilakukan di sisi klien, lihat ikhtisar di atas. Tidak perlu menggunakan hosting backend canggih.

Paket saya menggabungkan built in web speechsynthesis dan file audio (opsional) untuk dijalankan.

Saat menggunakan file preferensi/fallback ke audio, Anda dapat mencapai suara berkualitas tinggi dan menghapus semua masalah kompak dari built in web speechsynthesis.

Bagaimana Anda bisa secara otomatis mendapatkan file audio dari beberapa teks? Anda dapat menggunakan ElevenLabs, Murf AI, Open AI, Amazon Polly, dan Google Cloud atau API TTS lainnya selama mereka dapat menghasilkan file audio (mp3, mp4, wav, dll ...) untuk detailnya lihat audio_file.md . Di situs web demo saya memberikan contoh Anda menggunakan ElevenLabs dan bahkan Anda dapat mencoba file audio Anda sendiri di web demo itu.

Paket ini hanya mengambil file teks dan audio input, sehingga Anda dapat fleksibel untuk menggunakan API TTS apa pun yang dapat menghasilkan file audio, yang mahal atau bahkan murah ketika Anda mempertimbangkan biayanya.

Bagaimana paket ini mengetahui waktu yang diucapkan kata atau kalimat audio yang dimainkan? Paket ini dapat mendeteksi kata dan kalimat yang diucapkan di sisi klien.

Paket ini adalah pembayaran satu kali. Tidak ada langganan. Siapa yang suka berlangganan? Saya juga tidak. Lihat cara membeli di bawah.

Penentuan posisi

Tinjauan Fitur

Menggunakan kasus

Ketika Anda adalah pengusaha, saya yakin Anda memiliki beberapa kasus penggunaan gila untuk paket ini.

Blog Interaktif
Bayangkan Anda memiliki artikel panjang dan memiliki tombol TTS kemudian memutar teks untuk berbicara dan pengguna dapat melihat seberapa jauh artikel telah dibaca. Artikel Anda akan siap SEO karena paket ini memiliki kemampuan server rendering (SSR).
Web AI Avatar / NPC
Dalam demo yang saya berikan, Anda dapat melihat avatar 3D dari ReadyPlayer.me dapat hidup memainkan animasi idle dan mulut mereka dapat disinkronkan dengan teks yang disorot untuk diucapkan, karena paket ini bereaksi yang mewakili viseme lisan saat ini. Daftar Viseme yang saya gunakan dalam demo adalah Oculus OVR Lipsync.
Aplikasi Pembelajaran Bahasa dengan Suara Manusia Nyata
Lihatlah Contoh 6 pada demo. Ini adalah contoh penggunaan suara manusia nyata untuk teks untuk diucapkan. Mungkin bahasa lokal Anda tidak didukung oleh API TTS. Anda dapat menggunakan paket ini untuk menggunakan suara manusia yang sebenarnya. Suara manusia yang sebenarnya direkam oleh manusia sejati. Suara manusia yang sebenarnya lebih alami daripada API TTS.
Pembaca Teks Akademik
Masalah ketika kita melakukan TTS pada teks akademik. Ini berisi persamaan matematika, rumus, simbol bahwa istilah yang ditampilkan berbeda dengan pengucapannya lihat. Jadi kami membuat mesin koreksi pengumuman menggunakan AI AI terbuka untuk memikirkan apa yang harus diucapkan istilah.
Sorotan relasi dan penyorotan level kata dari transkrip YouTube
YouTube-Transcript-highlight.mp4
Ini memiliki iframe YouTube, dan transkrip YouTube di sebelah kanan, saat Anda memutar video YouTube, transkrip akan disorot. Sorotan didasarkan pada waktu saat ini dari video yang diputar. Paket ini mengikuti waktu.
Fitur Sorotan Relasi - Ketika Anda melayang ke beberapa kata, kata terkait akan disorot juga. Contoh ketika Anda melayang ke kata Cina, kata pinyin dan bahasa Inggris akan disorot juga dan sebaliknya. Bagaimana bisa? melihat.
Pemutar video dengan Auto menghasilkan subtitle
Video-auto-Transcribe.mp4
CASE: Anda hanya memiliki file audio atau video tanpa transkrip teks. Paket kami dapat menghasilkan transkrip dari file audio. atau bahkan menggores transkrip ke bahasa lain. Subtitle dapat disorot saat video diputar, dan mungkin ingin menampilkan dua subtitle bahasa yang berbeda sekaligus. dan juga menyoroti keduanya berdasarkan arti kata -kata.
Pada video pratinjau di atas video asli bahasa Italia, dan saya juga menunjukkan terjemahan dalam bahasa Inggris. dan sistem disorot baik berdasarkan artinya.
Kata Italia bella memiliki makna dalam bahasa Inggris beautiful
Buka halaman Demo Video ini.
Kasus penggunaan Anda di sini
Tanyakan saja kepada saya apa yang ingin Anda buat, arsitektur paket dapat diskalakan untuk membuat berbagai fitur.

B. TODO

Tambahkan Bot Obrolan Perselisihan menggunakan LLM untuk menjelaskan API, dan jelaskan apa yang ingin Anda buat, dan mereka akan memberi Anda kode.
Otomation Brute Force dari ujung ke ujung, uji semua API, runtime, aksi berurutan, dll ...
Tambahkan dukungan viseme untuk karakter Cina
Beri tahu saya apa yang Anda inginkan dari paket ini, arsitektur paket dapat diskalakan untuk membuat berbagai fitur, silakan tulis di tab Masalah, atau hubungi saya melalui Discord (nama pengguna: Albirrkarim)

C. API & Contoh Kode

Lihat API.MD dan example_code.md yang berisi kode contoh sederhana.

Contoh kode lengkap dan contoh implementasi adalah menggunakan kode sumber dari situs web demo. Sumber Sumber Situs Web Demo disertakan saat Anda membeli paket ini.

Paket ini ditulis dengan TypeScript, Anda tidak perlu membaca semua dokumen di sini, karena paket ini sekarang mendukung JS Doc dan VS Code IntelliSense apa itu? Cukup ketika Anda mengarahkan mouse Anda ke beberapa variabel atau fungsi vs kode akan menampilkan beberapa popup (tutorial sederhana) apa fungsinya, contoh, param, dll ...

Cukup gunakan kode sumber dari situs web demo, Anda benar -benar dapat memahami paketnya.

Intellisense.mp4

D. Changelog

Changelog berisi informasi tentang fitur baru, meningkatkan akurasi, memperbaiki bug, dan apa yang harus Anda lakukan saat versi diperbarui.

Lihat Changelog.MD

E. Penafian & Garansi

Tidak ada pengembalian dana.

Saya suka umpan balik dari pelanggan saya. Anda dapat menulis di tab Masalah jadi ketika saya punya waktu, saya dapat mencoba menyelesaikannya dan mengirimkannya untuk pembaruan berikutnya.

Masih khawatir? Lihat ulasan tentang ProductThunt

F. FAQ

Kenapa mahal? Mengapa itu bukan paket opensource?

Yah, saya butuh uang untuk mendanai penelitian, Anda tahu bahwa membuat paket yang kompleks menghabiskan banyak waktu dan tentu saja uang.

Membuat mesin LLM yang menggabungkan rekayasa cepat dan algoritma yang efisien untuk menghemat biaya API AI terbuka. Perlu diuji dan tesnya berulang kali dengan biaya panggilan API.

Saya juga memberikan dukungan melalui obrolan pribadi langsung kepada saya melalui Discord (nama pengguna: Albirrkarim), apakah ada layanan di luar sana yang melakukan itu?

Paket ini adalah paket base yang dapat digunakan untuk berbagai kasus penggunaan. Saya menghasilkan banyak uang dengan paket. Batasnya adalah keterampilan kewirausahaan Anda.

Dengan harga yang lebih tinggi saya mempertahankan kelangkaan fungsionalitas.

Bagaimana dengan dukungan?

Ceritakan masalah atau kesulitan Anda kepada saya, saya akan menunjukkan cara untuk menyelesaikannya.

Saya memberikan dukungan realtime dari saya dengan perselisihan.

Beli saja. Lepaskan sakit kepala. Dan Anda dapat fokus pada proyek Anda.

Bisakah Anda memberi saya diskon?

Ya, jika Anda mahasiswa atau guru, Anda bisa mendapatkan diskon. Tunjukkan saja kartu siswa atau kartu guru Anda.

Ya, jika Anda membantu saya memilih paket ini pada perburuan produk

Apakah ini didokumentasikan dengan baik dan dibuat dengan baik?

Anda dapat melihat dokumen dalam repo ini, dan paket ini ditulis dengan TypeScript, dan diuji menggunakan Jest untuk memastikan kualitasnya.

Anda tidak perlu membaca semua dokumen di sini, karena paket ini sekarang mendukung vs Code Intellisense apa itu? Cukup ketika Anda mengarahkan mouse Anda ke beberapa variabel atau fungsi vs kode akan menampilkan beberapa popup (tutorial sederhana) apa fungsinya, contoh, param, dll ...

Cukup gunakan kode sumber dari situs web demo, Anda benar -benar dapat memahami paketnya.

Intellisense.mp4

Paket ini ditulis dalam naskah? Apakah dapat dicampur bersama dengan JSX atau proyek JS asli?

Ya itu bisa, tanyakan saja obrolan GPT, dan jelaskan masalah Anda.

Contoh :

"Proyek saya menggunakan Webpack, kode menggunakan JSX, saya ingin menggunakan kode TSX di samping JSX, bagaimana saya bisa?"

Seberapa akurat generasi viseme?

Goto sorotan pidato vanilla

Saya membuat demo untuk mengeluarkan viseme ke konsol.log. Cukup buka konsol browser dan mainkan contoh preferensi audio (bahasa Inggris). Dan Anda akan melihat kata dan viseme dalam waktu yang diputar saat ini.

Seberapa akurat kemampuan highlight?

Lihat saja demo

Mengapa tidak ada suara yang tersedia di perangkat?

Coba gunakan file preferensi atau fallback ke audio lihat audio_file.md

atau

Cobalah untuk mengatur sintesis atau bahasa ucapan di perangkat Anda.

Jika Anda menggunakan smartphone (Android):

Pastikan Anda memasang pengenalan ucapan & sintesis
Jika langkah 1 tidak berhasil. Coba unduh Google Keyboard. kemudian mengatur bahasa dikte. Tunggu beberapa menit (perangkat Anda akan secara otomatis mengunduh suara), lalu restart ponsel cerdas Anda.

Mengapa pidato tidak bekerja untuk suara pertama kali dimainkan? (Sintesis Pidato Web)

Perangkat Anda akan mengunduh suara itu terlebih dahulu. maka perangkat Anda akan memiliki suara itu secara lokal.

Coba gunakan file preferensi atau fallback ke audio lihat audio_file.md

Dapatkah saya menggunakan teks-ke-speech ini tanpa menunjukkan sorotan?

Ya, lihat

Bisakah saya menggunakan tanpa Openai API?

Paket ini secara opsional membutuhkan AI API Buka untuk melakukan tugas teks-ke-ucapan (menyelesaikan banyak masalah yang saya tulis di Problem.md).

Tetapi jika Anda tidak ingin menggunakan Open AI API, itu masih bisa berhasil. Lihat FAQ tentang ketergantungan apa yang digunakan paket ini?

Ketergantungan apa yang digunakan paket ini?

Ketergantungan NPM:

Untuk sorotan pidato bereaksi: lihat paket.json dalam repo ini. Lihat peerDependencies Setelah Anda membuat paket ini, Anda hanya perlu paket NPM yang ada di peerDependencies itu. Hanya bereaksi.
Untuk sorotan pidato vanilla: tidak ada ketergantungan, cukup gunakan file vanilla js.

AI Ketergantungan:

Paket ini secara opsional membutuhkan AI API Buka untuk melakukan tugas teks-ke-ucapan (menyelesaikan banyak masalah yang saya tulis di Problem.md).
Secara opsional menggunakan API TTS apa pun yang dapat menghasilkan file audio untuk kualitas suara yang lebih baik. Seperti Elevenlabs, Murf AI, Open AI, Amazon Polly, dan Google Cloud atau API TTS lainnya selama mereka dapat menghasilkan file audio (MP3, MP4, WAV, dll ...) untuk detailnya lihat audio_file.md.

Dukungan untuk berbagai browser dan perangkat?

Ya, lihat detailnya di test.md

atau Anda dapat mencoba menggunakan file preferensi atau fallback ke audio lihat audio_file.md

Bagaimana cara kerjanya? Apakah Paket Arsitektur dapat diskalakan?

Itu hanya berhasil. Penjelasan sederhana ada dalam pengantar di atas.

Arsitektur dapat diskalakan, tanyakan saja pada saya fitur apa yang Anda inginkan.

Bagaimana dengan biaya API menggunakan AI API terbuka untuk penggunaan paket Anda?

Lihat llm_engine.md

Perusahaan kami sudah membuat banyak file audio, dapatkah saya menggunakannya untuk menyorot dengan paket Anda?

Tidak, karena paket saya menangani semua sistem batching, sistem pengumuman, dan menyediakan teks sehingga API TTS dapat menghasilkan file audio yang dapat digunakan untuk disorot.

Anda bisa melakukan strategi caching untuk menyimpan respons permintaan. untuk API AI AI dan TTS API untuk file audio.

G. Pembayaran

- Versi Web (React and Vanilla JS)

Versi Web (React and Vanilla JS)

Untuk pengembang individu, freelancer, atau bisnis kecil.

Harganya USD $ 200. Terlalu mahal? Lihat situs web demo mungkin ada diskon untuk Anda atau mengisi formulir ini yang Anda beri tahu saat ada penawaran.

Setelah pembayaran, Anda akan diundang ke repositori pribadi saya, di mana Anda akan memiliki akses selama satu tahun, termasuk semua pembaruan selama waktu itu.

Untuk akses berkelanjutan di tahun -tahun berikutnya, Anda dapat membayar USD $ 50 per tahun untuk tetap berada di repositori pribadi.

Apa yang kamu punya

Situs web demo (berbasis JS berikutnya)
Paket repo (sorotan pidato reaksi)
Paket repo (sorotan pidato vanilla)

- Tutorial Screencast

Saya tahu paket ini kompleks, beberapa fitur yang membutuhkan arsitektur & keterampilan pemrograman lanjutan untuk menggunakannya.

Jadi saya membuat beberapa tutorial screencast penuh tentang cara menggunakan senjata canggih semacam ini.

Dari instalasi hingga contoh implementasi lanjutan dan banyak lagi.

Harganya berlangganan $ 5 / bulan. (Segera hadir)

- Versi Web Enterprise

Versi Web Perusahaan

Untuk Anda yang sudah memiliki bisnis dan menginginkan paket solid yang dapat digunakan untuk jangka panjang.

Harganya USD $ 700.

Apa yang kamu punya

Versi Web Paket ini.
Dukungan arsitektur, saya dapat membuat gambar tentang arsitektur implementasi.
Tinjauan Kode Implementasi, saya dapat meninjau kode Anda melakukan implementasi praktik terbaik.
4 tahun di dalam repo dan dukungan pribadi.

- Versi aplikasi seluler (React Native)

Versi aplikasi seluler (React Native)

Harganya USD $ 150.

Apa yang kamu punya

Kode Sumber Demo Aplikasi Berdasarkan React Native CLI (Ready) (Coba Aplikasi Demo Android)

Server backend untuk fitur canggih

Server backend

Server Python ($ 20)

Berisi: Sorotan Transkrip Relasi YouTube, Transkrip Generat Otomatis Video, Streaming TTS

Node JS Server ($ 20)

Berisi: Backenify LLM Engine

- Versi Web yang dibundel dengan Panduan Web React GPT

React GPT Web Guide ($ 100) + react ucapan sorotan ( ~~$ 200~~ ) ($ 50) = $ 150

Apa yang kamu punya

Situs web demo (berbasis JS berikutnya)
Semua versi web repo pribadi dari sorotan pidato reaksi

Metode pembayaran

Saya menerima berbagai metode pembayaran:

Sponsor GitHub

Pilih tab One Time, pilih opsi, dan ikuti instruksi berikutnya dari GitHub.

Kata kunci

Jadi paket ini adalah jawaban untuk Anda yang mencari:

Teks terbaik untuk pustaka ucapan
Teks untuk berbicara dengan viseme lipsync javascript
Teks JavaScript untuk kata -kata sorotan ucapan
Cara mengirim pesan untuk berbicara dengan menyoroti kalimat dan kata -kata seperti berbicara
Cara mengirim pesan untuk berbicara dengan menyorot kalimat dan kata -kata menggunakan sebelas lab
Cara mengirim pesan untuk berbicara dengan menyoroti kalimat dan kata -kata menggunakan AI terbuka
Cara mengirim pesan untuk berbicara dengan menyorot kalimat dan kata -kata menggunakan sintesis Google Speech
SMS ke ucapan JavaScript
Teks TypeScript untuk berbicara
Teks yang disorot untuk berbicara
Sorotan Pidato di TTS
Tts dengan highlight kalimat
Sorotan kata dalam teks-ke-speech.
Elevenlabs tts
Sorotan TTS Elevenlabs
Teks openai untuk berbicara
Teks yang disorot openai tts
Bereaksi teks terhadap sorotan pidato
Bereaksi dengan sorotan
Sintesis Bicara Bereaksi
TT yang disorot di React
Sintesis Google Speech di React
Teks untuk berbicara bereaksi JS
Bereaksi JS TTS
Bereaksi teks-ke-ucapan
TT di React JS
Bereaksi Sintesis Bicara JS
JavaScript Tts
Teks-ke-Speech di JS
Sintesis ucapan JS
JavaScript TTS yang disorot
Sorotan transkrip YouTube
Sorotan kata dalam transkrip youtube
Cara menyorot kata -kata dalam transkrip youtube
Waktu Word Transkrip YouTube
Streaming TT dengan sorotan

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode Sumber AI
Waktu Pembaruan 2025-02-17
ukuran 34.59MB
Berasal dari Github

Aplikasi Terkait

react native

2024-11-14
grav skeleton downloads demo

2024-11-01
demo studio atlet

2023-07-19
instalasi demo jockstudio

2023-07-19
Demo Bunga Bawah Tanah

2023-07-03
Demo kelas cache xml

2009-05-18

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
node telegram bot api

Kode Sumber AI

v0.50.0
typebot.io

Kode Sumber AI

v3.1.2
python wechaty getting started

Kode Sumber AI

1.0.0
waymo open dataset

Kode sumber lainnya

December 2023 Update
wp functions

Kategori lainnya

1.0.0
termwind

Kategori lainnya

v2.3.0

Informasi Terkait Semua