audioset downloader Download - audioset downloader Download do código-fonte

audioset downloader

Outro código-fonte

Baixar

downloader de audioset

Este repositório fornece uma ferramenta para baixar clipes de áudio com rótulos fortes do AudioSet, um conjunto de dados em grande escala de eventos de áudio anotados. A ferramenta pode ser usada para construir conjuntos de dados de áudio de rótulo forte personalizados para tarefas de aprendizado de máquina.

Características

Baixe arquivos de áudio do AudioSet com eficiência com base em rótulos específicos.
Suporta vários downloads paralelos para acelerar o processo.
Flexibilidade para escolher a quantidade de arquivos de áudio para download por gravadora.
Sistema de registro conveniente para acompanhar o processo de download.
A configuração do processo de download pode ser feita através de um arquivo config.yaml .

Requisitos

python3
ffmpeg
youtube-dl

Uso

Clone este repositório:

 git clone https://github.com/seu-nome de usuário/audioset-downloader.git

Instale dependências:

 pip instalar -r requisitos.txt

Execute o script input_label.py para gerar o dicionário de rótulos:

 python input_label.py

Abra o arquivo config.yaml e cole o dicionário de rótulos gerado na etapa anterior. Modifique os outros campos do arquivo conforme desejado.
Execute o script main.py para baixar clipes de áudio: Baixa arquivos de áudio para uma pasta output/dataset no diretório atual.

 python principal.py

Usa arquivos CSV encontrados em core/ por padrão. Execute main.py em seu próprio diretório.

Configuração

A configuração da ferramenta é especificada no arquivo config.yaml. Os seguintes campos estão disponíveis:

labels : lista de rótulos para download.
labels_id_dict : rótulos de mapeamento de dicionário para IDs AudioSet.
csv_dataset : Caminho para o conjunto de dados CSV.
workspace : diretório do espaço de trabalho.
destination_dir : diretório de destino para os arquivos de áudio baixados.
fs : Frequência de amostragem.
eval_rate : Taxa de avaliação.
num_threads : Número de threads a serem usados durante o download.

Por que é necessário um downloader para AudioSet

Exatamente, é por isso que é necessário um downloader para AudioSet. Os arquivos CSV fornecidos pelo AudioSet contêm apenas informações sobre os IDs do YouTube e os rótulos associados, mas não os dados de áudio reais. Por outro lado, os arquivos TFRecord contêm os vetores de recursos, mas não os sinais de áudio brutos, necessários para algumas tarefas de aprendizado de máquina.

Ao usar um downloader, os usuários podem baixar os dados de áudio em formato bruto e usá-los para treinar seus modelos. Esta ferramenta pode ajudar a economizar tempo e esforço, já que o usuário não precisa procurar e baixar manualmente cada clipe de áudio individual do YouTube. O usuário também pode usar a ferramenta para filtrar os clipes de áudio com base em seus rótulos, permitindo-lhes construir um conjunto de dados de rótulos fortes e personalizados, adaptado às suas necessidades específicas.

Conjunto de áudio

AudioSet pode ser baixado do Google aqui como um conjunto de arquivos CSV. Para cada elemento no conjunto de dados, os arquivos CSV listam um ID do YouTube associado, horário de início, horário de término e rótulos de classe. Os arquivos CSV são usados para baixar o AudioSet como arquivos de áudio brutos (WAV).

Isenção de responsabilidade

Este repositório é apenas para fins educacionais e de pesquisa. Respeite os termos de uso e os contratos de licença do AudioSet ao usar esta ferramenta.

Expandir

Informações adicionais

Versão
Tipo Outro código-fonte
Data da Última Atualização 2024-11-21
tamanho 50MB
Vindo de Github

Aplicativos Relacionados

waymo open dataset

2024-11-18
SmartTube

2024-12-14
Sunamu

2024-12-14
MySchedule.py

2024-12-15
viptools for eslam

2024-12-15
VITAident

2024-12-15

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
waymo open dataset

Outro código-fonte

December 2023 Update
SmartTube

Outro código-fonte

24.71 Stable
Sunamu

Outro código-fonte

Release 2.2.0
waymo open dataset

Outro código-fonte

December 2023 Update
wp functions

Outras categorias

1.0.0
termwind

Outras categorias

v2.3.0

Informações Relacionadas Todos