noise suppression for voice Télécharger - noise suppression for voice Téléchargement du code source

noise suppression for voice

Autre code source

v1.10 (VST2, VST3, LV2, LADSPA, AU, AUv3)

Télécharger

Plugin de suppression du bruit en temps réel

VST2, VST3, LV2, LADSPA, AU, AUv3

Un plugin de suppression du bruit en temps réel pour la voix basé sur RNNoise de Xiph. Plus d'informations sur la bibliothèque de base.

Le plugin est destiné à supprimer un large éventail d'origines de bruit (à partir du papier original) : ventilateurs d'ordinateur, bureau, foule, avion, voiture, train, construction.

D'après mes tests, les bruits de fond légers sont toujours supprimés, les sons forts, comme les clics d'un clavier mécanique, sont supprimés lorsqu'il n'y a pas de voix, mais leur volume est réduit uniquement lorsque la voix est présente.

Veuillez noter que ce plugin ne pourrait pas améliorer la qualité de la voix avec un mauvais microphone, il pourrait même aggraver les choses en classant à tort la voix comme un bruit, ce qui réduirait une qualité de voix déjà pas si bonne.

Le plugin fonctionne avec un ou plusieurs canaux, entrée audio 16 bits, 48 000 Hz.

❗ ❗ ❗ N'utilisez AUCUNE autre fréquence d'échantillonnage, utilisez UNIQUEMENT 48 000 Hz, assurez-vous que votre source audio est à 48 000 Hz et forcez-la à 48 000 Hz si ce n'est pas le cas.

Il existe une interface graphique minimaliste avec tous les paramètres et statistiques de diagnostic :

Sorties

Dernières versions

Comment faire

Paramètres du plugin

VAD Threshold (%) - si la probabilité que le son soit une voix est inférieure à ce seuil - il sera réduit au silence. Dans la plupart des cas, un seuil compris entre 85 et 95 % conviendrait. Sans le VAD, certains bruits forts peuvent encore être un peu audibles en l'absence de voix.
VAD Grace Period (ms) - pendant combien de temps après la dernière détection vocale, la sortie ne sera pas réduite au silence. Cela est utile lorsque les fins de mots/phrases sont coupées.
Retroactive VAD Grace Period (ms) - similaire à VAD Grace Period (ms) mais pour les débuts de mots/phrases. ️ Cela introduit de la latence !

Windows + Égaliseur APO (VST2)

Pour vérifier ou modifier les paramètres du micro, allez dans « Périphériques d'enregistrement » -> « Enregistrement » -> « Propriétés » du micro cible -> « Avancé ».

Pour activer le plugin dans Equalizer APO, sélectionnez "Plugins" -> "VST Plugin" et spécifiez la DLL du plugin.

Voir le guide détaillé fourni par @bssankaran.

v1.0 : Il existe désormais une interface graphique, il est donc devenu facile de modifier les paramètres.

Linux

Fil de tuyau

Depuis la version 0.3.45 PipeWire utilise la configuration en fichiers divisés, ce qui rend extrêmement facile la configuration des plugins et la modification de la configuration.

Pour les anciennes versions de PipeWire, vous devrez copier /usr/share/pipewire/pipewire.conf dans ~/.config/pipewire/pipewire.conf puis ajouter la configuration ci-dessous aux context.modules déjà existants.

Pour PipeWire >= 0.3.45 vous devez :

Créez le répertoire de configuration : ~/.config/pipewire/pipewire.conf.d/
Créez la configuration pour le plugin : ~/.config/pipewire/pipewire.conf.d/99-input-denoising.conf
Coller la configuration :

 context.modules = [
{   name = libpipewire-module-filter-chain
    args = {
        node.description =  "Noise Canceling source"
        media.name =  "Noise Canceling source"
        filter.graph = {
            nodes = [
                {
                    type = ladspa
                    name = rnnoise
                    plugin = /path/to/librnnoise_ladspa.so
                    label = noise_suppressor_mono
                    control = {
                        "VAD Threshold (%)" = 50.0
                        "VAD Grace Period (ms)" = 200
                        "Retroactive VAD Grace (ms)" = 0
                    }
                }
            ]
        }
        capture.props = {
            node.name =  "capture.rnnoise_source"
            node.passive = true
            audio.rate = 48000
        }
        playback.props = {
            node.name =  "rnnoise_source"
            media.class = Audio/Source
            audio.rate = 48000
        }
    }
}
]

Remplacez /path/to/librnnoise_ladspa.so par le chemin réel de la bibliothèque
Si vous êtes absolument sûr d'avoir besoin d'une sortie stéréo, changez noise_suppressor_mono -> noise_suppressor_stereo . Même si votre micro indique qu'il est stéréo, vous n'avez probablement pas besoin d'une sortie stéréo. Cela consommerait également 2x ressources.
Configurer les paramètres du plugin : VAD Threshold (%) , ...
Redémarrez PipeWire : systemctl restart --user pipewire.service
Vous devriez maintenant pouvoir sélectionner Noise Canceling source comme périphérique d'entrée.

Pour plus d'informations, consultez la documentation PipeWire sur les chaînes de filtres.

Dépannage :

À FAIRE, comment changer la fréquence d'échantillonnage du micro.

Solutions alternatives pour la configuration PipeWire/PulseAudio qui utilisent également RNNoise :

EasyEffects - une solution générale pour l'interface graphique d'effets audio pour PipeWire. Facile à installer et à utiliser. Moins de réglages pour le débruitage. Disponible sur Flathub.
NoiseTorch - facile à configurer, fonctionne avec PulseAudio et Pipewire. Moins de réglages pour le débruitage.

PulseAudio

TLDR : utilisez PipeWire... ou suivez les instructions ci-dessous.

Instructions (cliquez moi)

L'idée est :

Créez un récepteur à partir duquel les applications prendront l'audio plus tard et qui sera le récepteur final de la chaîne.
Chargez le plugin qui sort vers un récepteur déjà créé (paramètre sink_master ) et qui a un récepteur d'entrée (paramètre sink_name , le récepteur sera créé).
Créez un bouclage du microphone ( source ) au récepteur d'entrée du plugin ( sink ) avec 1 canal.

Par exemple, pour créer un nouveau périphérique mono avec un son à réduction de bruit provenant de votre microphone, recherchez d'abord le nom de votre micro en utilisant par exemple :

pactl list sources short

Ensuite, créez le nouvel appareil en utilisant :

pacmd load-module module-null-sink sink_name=mic_denoised_out rate=48000
pacmd load-module module-ladspa-sink sink_name=mic_raw_in sink_master=mic_denoised_out label=noise_suppressor_mono plugin=/path/to/librnnoise_ladspa.so control=50,20,0,0,0
pacmd load-module module-loopback source= < your_mic_name > sink=mic_raw_in channels=1 source_dont_move=true sink_dont_move=true

Cela doit être exécuté à chaque lancement de PulseAudio. Vous pouvez automatiser cela en créant un fichier dans ~/.config/pulse/default.pa avec le contenu :

 .include /etc/pulse/default.pa

load-module module-null-sink sink_name=mic_denoised_out rate=48000
load-module module-ladspa-sink sink_name=mic_raw_in sink_master=mic_denoised_out label=noise_suppressor_mono plugin=/path/to/librnnoise_ladspa.so control=50,200,0,0,0
load-module module-loopback source=your_mic_name sink=mic_raw_in channels=1 source_dont_move=true sink_dont_move=true

set-default-source mic_denoised_out.monitor

L'ordre des paramètres dans control=50,200,0,0,0 est : VAD Threshold (%) , VAD Grace Period (ms) , Retroactive VAD Grace Period (ms) , Placeholder1 , Placeholder2 .

Si vous êtes absolument sûr de vouloir une entrée stéréo, utilisez plutôt ces options :

label=noise_suppressor_stereo
channels=2

Si vous rencontrez des problèmes de crépitement audio ou de latence élevée/augmentante périodiquement, l'ajout latency_msec=1 au bouclage peut aider :

 load-module module-loopback source=your_mic_name sink=mic_raw_in channels=1 source_dont_move=true sink_dont_move=true latency_msec=1

️ Chrome et les autres navigateurs basés sur Chromium ignoreront les périphériques de surveillance et vous ne pourrez pas sélectionner le « Moniteur de sortie nulle ». Pour contourner ce problème, utilisez pavucontrol pour attribuer l'entrée à Chrome ou remapper cet appareil dans PulseAudio pour créer une source régulière :

pacmd load-module module-remap-source source_name=denoised master=mic_denoised_out.monitor channels=1

Vous devrez peut-être toujours définir l'entrée correcte pour l'application, cela peut être fait dans le panneau de mixage audio (si vous en avez un) dans l'onglet « Enregistrement » où vous devez définir « Moniteur de sortie nulle » comme source.

Lectures complémentaires :

Informations détaillées utiles sur la logique PulseAudio toadjaune/pulseaudio-config.
Le fil de discussion qui m'a aidé à post-traiter la sortie du micro et à la rendre disponible aux applications.

Mac OS

À FAIRE, les contributions sont les bienvenues !

Statut

Le plugin est testé avec :

Equalizer APO v1.2 x64 (égaliseur open source à l'échelle du système pour Windows)
PipeWire sur Arch Linux
Carla (sous Linux)
Audace (sous Linux)

Je ne suis pas associé au travail original de RNNoise et je n'ai AUCUNE compréhension des réseaux neuronaux récurrents sur lesquels il est basé.

Contribuer

Les dépendances externes sont vendues via git-subrepo. Il n'est donc pas nécessaire d'utiliser des sous-modules et l'application de correctifs aux sous-dépôts est facile (pour le moment, nous avons plusieurs correctifs pour JUCE).

Les améliorations sont les bienvenues ! Cependant, si vous souhaitez apporter une contribution importante, ouvrez d'abord un problème.

Compilation

Compilation pour x64 :

cmake -Bbuild-x64 -H. -GNinja -DCMAKE_BUILD_TYPE=Release
ninja -C build-x64

Compilation pour x32 :

cmake -D CMAKE_CXX_FLAGS=-m32 -D CMAKE_C_FLAGS=-m32 -Bbuild-x32 -H. -GNinja -DCMAKE_BUILD_TYPE=Release
ninja -C build-x32

Compilation croisée pour Windows x64 (les builds MinGW échouent actuellement en raison de certaines incompatibilités dans JUCE) :

cmake -Bbuild-mingw64 -H. -GNinja -DCMAKE_TOOLCHAIN_FILE=toolchains/toolchain-mingw64.cmake -DCMAKE_BUILD_TYPE=Release
ninja -C build-mingw64

Compiler uniquement les plugins sélectionnés

Par défaut, tous les plugins pris en charge pour une plateforme sont en cours de construction. Vous pouvez délibérément désactiver les plugins avec les indicateurs CMake suivants :

BUILD_LADSPA_PLUGIN
BUILD_VST_PLUGIN
BUILD_VST3_PLUGIN
BUILD_LV2_PLUGIN
BUILD_AU_PLUGIN (macOS uniquement)
BUILD_AUV3_PLUGIN (macOS uniquement)

Par exemple:

cmake -DBUILD_VST_PLUGIN=OFF -DBUILD_LV2_PLUGIN=OFF

Licence

Ce projet est sous licence GNU General Public License v3.0 - voir le fichier LICENSE pour plus de détails.

Bibliothèques utilisées :

JUCE est utilisé sous licence GPLv3
FST-GPLv3
catch2-BSL-1.0

Développer

Informations supplémentaires

Version v1.10 (VST2, VST3, LV2, LADSPA, AU, AUv3)
Type Autre code source
Date de mise à jour 2025-01-01
taille 50MB
Provenant de Github

Applications connexes

GLM 4 Voice

2024-11-02
Retrieval based Voice Conversion WebUI

2024-11-01
putain pour

2024-06-19
Interface SMS illimitée GOOGLE VOICE

2009-11-07
iTunes pour Windows

2009-06-03
Ajax pour les nuls

2009-05-23

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
waymo open dataset

Autre code source

December 2023 Update
SmartTube

Autre code source

24.71 Stable
Sunamu

Autre code source

Release 2.2.0
waymo open dataset

Autre code source

December 2023 Update
termwind

Autres catégories

v2.3.0
wp functions

Autres catégories

1.0.0

Actualités connexes Tout