noise suppression for voice - noise suppression for voice

noise suppression for voice

Outro código-fonte

v1.10 (VST2, VST3, LV2, LADSPA, AU, AUv3)

Baixar

Plug-in de supressão de ruído em tempo real

VST2, VST3, LV2, LADSPA, AU, AUv3

Um plugin de supressão de ruído em tempo real para voz baseado no RNNoise do Xiph. Mais informações sobre a biblioteca base.

O plugin destina-se a suprimir uma ampla gama de origens de ruído (do artigo original): ventiladores de computador, escritório, multidão, avião, carro, trem, construção.

Dos meus testes, o ruído de fundo suave é sempre suprimido, sons altos, como cliques de teclado mecânico, são suprimidos enquanto não há voz, porém seu volume só é reduzido quando a voz está presente.

Observe que este plugin não poderia melhorar a qualidade da voz com um microfone ruim, mas poderia até piorar as coisas ao classificar erroneamente a voz como um ruído, o que reduziria a qualidade de voz já não tão boa.

O plugin funciona com um ou mais canais, entrada de áudio de 16 bits e 48.000 Hz.

❗ ❗ ❗ NÃO use nenhuma outra taxa de amostragem, use SOMENTE 48.000 Hz, certifique-se de que sua fonte de áudio seja 48.000 Hz e force-a para 48.000 Hz se não for.

Existe uma GUI minimalista com todos os parâmetros e estatísticas de diagnóstico:

Lançamentos

Últimos lançamentos

Como fazer

Configurações de plug-in

VAD Threshold (%) - se a probabilidade do som ser uma voz for inferior a este limiar - será silenciado. Na maioria dos casos, o limite entre 85% e 95% seria adequado. Sem o VAD, alguns ruídos altos ainda podem ser um pouco audíveis quando não há voz.
VAD Grace Period (ms) - por quanto tempo após a última detecção de voz a saída não será silenciada. Isso ajuda quando o final das palavras/frases está sendo cortado.
Retroactive VAD Grace Period (ms) - semelhante ao VAD Grace Period (ms) mas para início de palavras/frases. ️ Isso introduz latência!

Windows + Equalizador APO (VST2)

Para verificar ou alterar as configurações do microfone, vá em "Dispositivos de gravação" -> "Gravação" -> "Propriedades" do microfone alvo -> "Avançado".

Para habilitar o plugin no Equalizer APO selecione "Plugins" -> "VST Plugin" e especifique a dll do plugin.

Veja o guia detalhado fornecido por @bssankaran.

v1.0: Agora existe uma GUI, então ficou fácil alterar os parâmetros.

Linux

PipeWire

Desde a versão 0.3.45 o PipeWire usa configuração de arquivo dividido, tornando extremamente fácil configurar plug-ins e ajustar configurações.

Para versões mais antigas do PipeWire, você teria que copiar /usr/share/pipewire/pipewire.conf para ~/.config/pipewire/pipewire.conf e então anexar a configuração abaixo ao já existente context.modules .

Para PipeWire >= 0.3.45 você deve:

Crie o diretório de configuração: ~/.config/pipewire/pipewire.conf.d/
Crie a configuração do plugin: ~/.config/pipewire/pipewire.conf.d/99-input-denoising.conf
Colar configuração:

 context.modules = [
{   name = libpipewire-module-filter-chain
    args = {
        node.description =  "Noise Canceling source"
        media.name =  "Noise Canceling source"
        filter.graph = {
            nodes = [
                {
                    type = ladspa
                    name = rnnoise
                    plugin = /path/to/librnnoise_ladspa.so
                    label = noise_suppressor_mono
                    control = {
                        "VAD Threshold (%)" = 50.0
                        "VAD Grace Period (ms)" = 200
                        "Retroactive VAD Grace (ms)" = 0
                    }
                }
            ]
        }
        capture.props = {
            node.name =  "capture.rnnoise_source"
            node.passive = true
            audio.rate = 48000
        }
        playback.props = {
            node.name =  "rnnoise_source"
            media.class = Audio/Source
            audio.rate = 48000
        }
    }
}
]

Altere /path/to/librnnoise_ladspa.so para o caminho real da biblioteca
Se você tem certeza absoluta de que precisa de saída estéreo - altere noise_suppressor_mono -> noise_suppressor_stereo . Mesmo que o seu microfone diga que é estéreo - você provavelmente não precisa de saída estéreo. Também consumiria 2x recursos.
Configure os parâmetros do plugin: VAD Threshold (%) , ...
Reinicie o PipeWire: systemctl restart --user pipewire.service
Agora você deve ser capaz de selecionar Noise Canceling source como dispositivo de entrada

Para mais informações consulte a documentação do PipeWire sobre Filter-Chains

Solução de problemas:

TODO, como alterar a taxa de amostragem do microfone.

Soluções alternativas para configuração PipeWire/PulseAudio que também usam RNNoise:

EasyEffects - uma solução geral para GUI de efeitos de áudio para PipeWire. Fácil de configurar e usar. Menos configurações para eliminação de ruído. Disponível no Flathub.
NoiseTorch – fácil de configurar, funciona com PulseAudio e Pipewire. Menos configurações para eliminação de ruído.

PulsoÁudio

TLDR: Use PipeWire... ou siga as instruções abaixo.

Instruções (clique em mim)

A ideia é:

Crie um coletor do qual os aplicativos extrairão o áudio posteriormente e que será o coletor final da cadeia.
Carregue o plugin que gera saída para o coletor já criado (parâmetro sink_master ) e tem coletor de entrada (parâmetro sink_name , o coletor será criado).
Crie loopback do microfone ( source ) para o coletor de entrada do plugin ( sink ) com 1 canal.

Por exemplo, para criar um novo dispositivo mono com áudio com redução de ruído do seu microfone, primeiro encontre o nome do seu microfone usando, por exemplo:

pactl list sources short

Em seguida, crie o novo dispositivo usando:

pacmd load-module module-null-sink sink_name=mic_denoised_out rate=48000
pacmd load-module module-ladspa-sink sink_name=mic_raw_in sink_master=mic_denoised_out label=noise_suppressor_mono plugin=/path/to/librnnoise_ladspa.so control=50,20,0,0,0
pacmd load-module module-loopback source= < your_mic_name > sink=mic_raw_in channels=1 source_dont_move=true sink_dont_move=true

Isso precisa ser executado sempre que o PulseAudio for iniciado. Você pode automatizar isso criando um arquivo em ~/.config/pulse/default.pa com o conteúdo:

 .include /etc/pulse/default.pa

load-module module-null-sink sink_name=mic_denoised_out rate=48000
load-module module-ladspa-sink sink_name=mic_raw_in sink_master=mic_denoised_out label=noise_suppressor_mono plugin=/path/to/librnnoise_ladspa.so control=50,200,0,0,0
load-module module-loopback source=your_mic_name sink=mic_raw_in channels=1 source_dont_move=true sink_dont_move=true

set-default-source mic_denoised_out.monitor

A ordem das configurações em control=50,200,0,0,0 é: VAD Threshold (%) , VAD Grace Period (ms) , Retroactive VAD Grace Period (ms) , Placeholder1 , Placeholder2 .

Se você tiver certeza absoluta de que deseja uma entrada estéreo, use estas opções:

label=noise_suppressor_stereo
channels=2

Se você tiver problemas com estalos de áudio ou latência alta/aumentada periodicamente, adicionar latency_msec=1 ao loopback pode ajudar:

 load-module module-loopback source=your_mic_name sink=mic_raw_in channels=1 source_dont_move=true sink_dont_move=true latency_msec=1

️ O Chrome e outros navegadores baseados em Chromium ignorarão os dispositivos de monitoramento e você não poderá selecionar o "Monitor de saída nula". Para contornar isso, use pavucontrol para atribuir a entrada ao Chrome ou remapeie este dispositivo no PulseAudio para criar uma fonte regular:

pacmd load-module module-remap-source source_name=denoised master=mic_denoised_out.monitor channels=1

Você ainda pode precisar definir a entrada correta para a aplicação, isso pode ser feito no painel do mixer de áudio (se você tiver um) na aba 'Gravação' onde você deve definir 'Monitor de Saída Nula' como fonte.

Leitura adicional:

Informações detalhadas úteis sobre a lógica PulseAudio toadjaune/pulseaudio-config.
O tópico que me ajudou a pós-processar a saída do microfone e disponibilizá-la para os aplicativos.

Mac OS

TODO, contribuições são bem-vindas!

Status

O plugin é testado com:

Equalizer APO v1.2 x64 (equalizador de código aberto para todo o sistema para Windows)
PipeWire no Arch Linux
Karla (no Linux)
Audácia (no Linux)

Não estou associado ao trabalho original do RNNoise e NÃO tenho nenhum conhecimento das redes neurais recorrentes nas quais ele se baseia.

Contribuindo

As dependências externas são vendidas via git-subrepo. Para que não haja necessidade de usar submódulos, e corrigir subrepos é fácil (no momento temos vários patches para JUCE).

Melhorias são bem-vindas! Porém, se você quiser contribuir com algo considerável, abra um problema primeiro.

Compilando

Compilando para x64:

cmake -Bbuild-x64 -H. -GNinja -DCMAKE_BUILD_TYPE=Release
ninja -C build-x64

Compilando para x32:

cmake -D CMAKE_CXX_FLAGS=-m32 -D CMAKE_C_FLAGS=-m32 -Bbuild-x32 -H. -GNinja -DCMAKE_BUILD_TYPE=Release
ninja -C build-x32

Compilação cruzada para Windows x64 (compilações MinGW estão falhando no momento devido a certas incompatibilidades no JUCE):

cmake -Bbuild-mingw64 -H. -GNinja -DCMAKE_TOOLCHAIN_FILE=toolchains/toolchain-mingw64.cmake -DCMAKE_BUILD_TYPE=Release
ninja -C build-mingw64

Compilando apenas plugins selecionados

Por padrão, todos os plugins suportados por uma plataforma estão sendo construídos. Você pode desativar plug-ins deliberadamente com os seguintes sinalizadores do CMake:

BUILD_LADSPA_PLUGIN
BUILD_VST_PLUGIN
BUILD_VST3_PLUGIN
BUILD_LV2_PLUGIN
BUILD_AU_PLUGIN (somente macOS)
BUILD_AUV3_PLUGIN (somente macOS)

Por exemplo:

cmake -DBUILD_VST_PLUGIN=OFF -DBUILD_LV2_PLUGIN=OFF

Licença

Este projeto está licenciado sob a Licença Pública Geral GNU v3.0 - consulte o arquivo LICENSE para obter detalhes.

Bibliotecas usadas:

JUCE é usado sob licença GPLv3
FST-GPLv3
catch2 - BSL-1.0

Expandir

Informações adicionais

Versão v1.10 (VST2, VST3, LV2, LADSPA, AU, AUv3)
Tipo Outro código-fonte
Data da Última Atualização 2025-01-01
tamanho 50MB
Vindo de Github

Aplicativos Relacionados

GLM 4 Voice

2024-11-02
Retrieval based Voice Conversion WebUI

2024-11-01
foda-se para

2024-06-19
Interface SMS ilimitada do GOOGLE VOICE

2009-11-07
iTunes para Windows

2009-06-03
Ajax para leigos

2009-05-23

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
termwind

Outras categorias

v2.3.0

Informações Relacionadas Todos