Serangkaian efek, generator, dan penganalisis berkemampuan AI untuk Audacity®. Fitur AI ini berjalan 100% secara lokal di PC Anda? -- tidak perlu koneksi internet! OpenVINO™ digunakan untuk menjalankan model AI pada akselerator yang didukung yang terdapat pada sistem pengguna seperti CPU, GPU, dan NPU.
Pemisahan Musik -- Pisahkan trek mono atau stereo menjadi batang tersendiri -- Drum, Bass, Vokal, & Instrumen Lainnya.
Peredam Kebisingan -- Menghilangkan kebisingan latar belakang dari sampel audio.
Pembuatan & Kelanjutan Musik -- Menggunakan MusicGen LLM untuk menghasilkan cuplikan musik, atau untuk menghasilkan kelanjutan dari cuplikan musik yang sudah ada.
Transkripsi Bisikan -- Menggunakan bisikan.cpp untuk menghasilkan trek label yang berisi transkripsi atau terjemahan untuk pilihan audio atau vokal lisan tertentu.
Buka di sini untuk menemukan paket instalasi & instruksi untuk rilis Windows terbaru.
Petunjuk Pembuatan Windows
Petunjuk Pembuatan Linux
Kami menyambut Anda untuk mengirimkan masalah di sini
Pertanyaan
Laporan Bug
Permintaan Fitur
Masukan dalam bentuk apa pun -- bagaimana kami dapat meningkatkan proyek ini?
Kontribusi Anda diterima dan dihargai, tidak peduli seberapa besar atau kecilnya. Jangan ragu untuk mengirimkan permintaan tarik!
Tim pengembangan Audacity® & Muse Group-- Terima kasih atas dukungan Anda!
Audacity® GitHub -- https://github.com/audacity/audacity
Transkripsi bisikan & penganalisis terjemahan menggunakan bisikan.cpp (dengan backend OpenVINO™): https://github.com/ggerganov/whisper.cpp
Pembuatan & Kelanjutan Musik menggunakan model MusicGen, dari Meta.
Saat ini kami memiliki dukungan untuk MusicGen-Small, dan MusicGen-Small-Stereo
Pipeline txt-ke-musik di-porting dari python ke C++, merujuk pada logika dari proyek transformator Hugging Face: https://github.com/huggingface/transformers
Efek Pemisahan Musik menggunakan model Demucs v4 Meta (https://github.com/facebookresearch/demucs), yang telah di-porting agar berfungsi dengan OpenVINO™
Peredam Kebisingan:
Porting model & saluran pipa dari sini: https://github.com/Rikorose/DeepFilterNet
Kami juga memanfaatkan fork/cabang @grazder (https://github.com/grazder/DeepFilterNet/tree/torchDF-changes) untuk lebih memahami implementasi Rust, jadi kami juga mendasarkan beberapa implementasi C++ kami di torch_df_offline.py
ditemukan di sini.
Kutipan:
@inproceedings{schroeter2022deepfilternet2,title = {{DeepFilterNet2}: Menuju Peningkatan Ucapan Real-Time pada Perangkat Tertanam untuk Audio Full-Band},author = {Schröter, Hendrik dan Escalante-B., Alberto N. dan Rosenkranz, Tobias dan Maier, Andreas},booktitle={Lokakarya Internasional ke-17 tentang Peningkatan Sinyal Akustik (IWAENC 2022)},tahun = {2022}, } @inproceedings{schroeter2023deepfilternet3,title = {{DeepFilterNet}: Peningkatan Ucapan Real-Time yang Termotivasi Secara Perseptual},author = {Schröter, Hendrik dan Rosenkranz, Tobias dan Escalante-B., Alberto N. dan Maier, Andreas},booktitle={ INTERSPEECH},tahun = {2023}, }
noise-suppression-denseunet-ll: dari Open Model Zoo OpenVINO™: https://github.com/openvinotoolkit/open_model_zoo
DeepFilterNet2 & DeepFilterNet3:
Notebook OpenVINO™ -- Kami telah belajar banyak dari rangkaian notebook python yang mengagumkan ini, dan masih menggunakannya untuk mempelajari praktik terbaru/terbaik dalam mengimplementasikan pipeline AI menggunakan OpenVINO™!