rubato Download - Download für rubato Quellcode

rubato

Anderer Quellcode

v0.16.1

Herunterladen

Rubato

Eine Audio -Probenrate -Konvertierungsbibliothek für Rost.

Diese Bibliothek bietet Resamplher, um Audio in Stücken zu verarbeiten.

Das Verhältnis zwischen Eingangs- und Ausgangsprobenraten ist vollständig frei. Implementierungen sind verfügbar, die eine Eingabe mit fester Länge akzeptieren, während eine Ausgabe einer variablen Länge zurückgegeben wird, und umgekehrt.

Rubato kann in Echtzeitanwendungen ohne Allokation während der Verarbeitung verwendet werden, indem ein [Resampler] und die Methoden "Input_buffer_allocation und Ausgabe_Buffer_allocation vor Beginn der Verarbeitung verwendet werden. Die Funktionsfunktion für die Protokollfunktion sollte für die Echtzeitanwendung deaktiviert werden (sie ist standardmäßig deaktiviert).

Datenformat für Eingabe und Ausgabe

Eingangs- und Ausgangsdaten werden in einem nicht interleierten Format gespeichert.

Eingangs- und Ausgangsdaten werden als Referenzschnitte gespeichert, &[AsRef<[f32]>] oder &[AsRef<[f64]>] . Die inneren Referenzen ( AsRef<[f32]> oder AsRef<[f64]> ) halten die Stichprobenwerte für jeweils einen Kanal.

Da normale Vektoren das AsRef -Merkmal implementieren, kann Vec<Vec<f32>> und Vec<Vec<f64>> sowohl für Eingabe als auch für die Ausgabe verwendet werden.

Asynchrone Resampling

Die asynchronen Resamplher sind mit und ohne Anti-Aliasing-Filter erhältlich.

Das Resampling mit Anti-Aliasing basiert auf bandbegrenzten Interpolation unter Verwendung von SINC-Interpolationsfiltern. Die SINC -Interpolation belastet um einen einstellbaren Faktor, und dann werden die neuen Probenpunkte durch Interpolieren zwischen diesen Punkten berechnet. Das Resampling -Verhältnis kann jederzeit aktualisiert werden.

Resampling ohne Anti-Aliasing lässt die CPU-stehende Sinc-Interpolation weg. Dies läuft viel schneller, führt aber ein Ergebnis von geringerer Qualität.

Synchrones Resampling

Synchrones Resampling wird über FFT implementiert. Die Daten sind FFT: ED, das modifizierte Spektrum und dann umgekehrte FFT: ED, um die Resampfdaten zu erhalten. Diese Art von Resampler ist erheblich schneller, unterstützt jedoch nicht die Änderung des Resampling -Verhältnisses.

Verwendung

Die von dieser Bibliothek bereitgestellten Resamplher sollen Audio in Stücken verarbeiten. Die optimale Chunk -Größe wird durch die Anwendung bestimmt, wird jedoch wahrscheinlich zwischen einigen hundert bis ein paar tausend Frames enden. Dies gibt einen guten Kompromiss zwischen Effizienz und Speicherverbrauch.

Überlegungen in Echtzeit

Rubato eignet sich für Echtzeitanwendungen bei der Verwendung der Methode Resampler::process_into_buffer() . Dies speichert die Ausgabe in einem vorab assoziierten Ausgangspuffer und führt keine Zuordnungen oder anderen Operationen durch, die den Thread blockieren können.

Wiederabtastung eines bestimmten Audioclips

Ein vorgeschlagener einfacher Prozess zum erneuten Abtastung eines Audioclips mit bekannter Länge zu einer neuen Stichprobenrate ist wie folgt. Hier wird davon ausgegangen, dass die Quelldaten in einem VEC oder einer anderen Struktur gespeichert sind, die das Lesen der beliebigen Anzahl von Frames gleichzeitig unterstützt. Der Einfachheit halber wird die Ausgabe während des Resamplings in einem temporären Puffer gespeichert und anschließend an das Ziel kopiert.

Vorbereitungen:

Erstellen Sie einen Resampler an geeignetem Typ, zum Beispiel FFTFixedin, der ziemlich schnell ist und eine gute Qualität bietet. Da weder Eingänge noch Ausgabe Beschränkungen für die Anzahl der Frames haben, die jeweils gelesen oder geschrieben werden können, kann die Stücke willkürlich ausgewählt werden. Beginnen Sie mit einer Stückgröße von zum Beispiel 1024.
Erstellen Sie einen Eingangspuffer.
Erstellen Sie einen temporären Puffer zum Sammeln der Resamplod -Ausgabedaten.
Rufen Sie Resampler::output_delay() auf, um zu wissen, wie viele Rahmen der Verzögerung, die der Resampler gibt. Speichern Sie die Nummer als delay .
Berechnen Sie die neue Cliplänge als new_length = original_length * new_rate / original_rate .

Jetzt ist es Zeit, den Großteil des Clips durch wiederholte Prozessanrufe zu verarbeiten. Schleife:

Rufen Sie Resampler::input_frames_next() auf, um zu erfahren, wie viele Rahmen der Resampler benötigt.
Überprüfen Sie die Anzahl der verfügbaren Frames in der Quelle. Wenn es weniger als die erforderliche Eingangsgröße ist, brechen Sie die Schleife.
Lesen Sie die erforderliche Anzahl von Frames aus der Quelle, konvertieren Sie die Beispielwerte in den Schwimmer und kopieren Sie sie in den Eingangspuffer.
Rufen Sie Resampler::process() an oder Resampler::process_into_buffer() .
Fügen Sie die Ausgabebrahmen an den temporären Ausgangspuffer hinzu.

Der nächste Schritt besteht darin, die letzten verbleibenden Frames zu verarbeiten.

Lesen Sie die verfügbaren Frames für die Quelle, konvertieren Sie die Beispielwerte in den Schwimmer und kopieren Sie sie in den Eingangspuffer.
Rufen Sie Resampler::process_partial() auf oder Resampler::process_partial_into_buffer() .
Gehen Sie die Ausgabebrahmen an den temporären Puffer an.

Zu diesem Zeitpunkt wurden alle Frames an den Resampler gesendet, aber aufgrund der Verzögerung durch den Resampler kann es immer noch einige Frames in seinen internen Puffern haben. Wenn alle gewünschten Frames erzeugt wurden, sollte die Länge des temporären Ausgangspuffers mindestens new_length + delay sein. Wenn dies nicht der Fall ist, rufen Sie Resampler::process_partial() auf, oder Resampler::process_partial_into_buffer() None als Eingabe und fügen Sie die Ausgabe an den temporären Ausgabepuffer hinzu. Bei Bedarf wiederholen Sie, bis die Länge ausreicht.

Kopieren Sie schließlich die Daten aus dem temporären Ausgangspuffer zum gewünschten Ziel. Überspringen Sie die ersten delay und kopieren Sie new_length Frames.

Wenn mehr als ein Clip von und zu den gleichen Stichprobenraten wiederholt werden kann, sollte derselbe Resampler wiederverwendet werden. Das Erstellen eines neuen Resastrlers ist eine teure Aufgabe und sollte nach Möglichkeit vermieden werden. Starten Sie den Verfahren von Anfang an, aber anstatt einen neuen Resampler zu erstellen, rufen Sie Resampler::reset() auf dem vorhandenen auf, um ihn für einen neuen Job vorzubereiten.

Einen Stream neu Samplesabtastung neu abspielen

Bei der Wiederholung eines Streams wird der Prozess normalerweise in Echtzeit durchgeführt, und entweder ist der Ausgangseingang eine API, die Frames zu einer bestimmten Geschwindigkeit bereitstellt oder konsumiert.

Beispiel, zeichnen Sie eine Datei von einer Audio -API auf

Audio -APIs wie Coreaudio auf MacOS oder die CPAL -Kiste der Cross -Plattform verwenden häufig Rückruffunktionen für den Datenaustausch.

Ein komplettes

Bei der Erfassung von Audioen gibt die Anwendung eine Funktion an die Audio -API. Die API ruft diese Funktion dann regelmäßig auf, wobei ein Zeiger auf einen Datenpuffer mit neuen Audio -Frames enthält. Die Datenpuffergröße ist bei jedem Aufruf normalerweise gleich, aber das variiert zwischen APIs. Es ist wichtig, dass die Funktion nicht blockiert wird, da dies eine interne Schleife der API blockiert und einen Verlust einiger Audiodaten verursacht. Es wird empfohlen, das Rückruffunktionslicht zu halten. Idealerweise sollte es die bereitgestellten Audiodaten aus dem von der API bereitgestellten Puffer lesen und optional eine leichte Verarbeitung durchführen, z. B. die Umwandlung des Beispielformats. Hier sollte keine starke Verarbeitung wie Resampling durchgeführt werden. Anschließend sollten die Audiodaten in einem gemeinsam genutzten Puffer gespeichert werden. Der Puffer kann ein Arc<Mutex<VecDeque<T>>> oder etwas Fortgeschritteneres wie Ringbuf.

Eine separate Schleife, die entweder im Haupt oder in einem separaten Thread ausgeführt wird, sollte dann aus diesem Puffer lesen, wiederproben und in Datei speichern. Wenn die Audio -API eine feste Puffergröße liefert, ist diese Anzahl von Frames eine gute Wahl für die Ressampler -Chunk -Größe. Wenn die Größe variiert, kann der gemeinsame Puffer verwendet werden, um die Stücke der Audio -API und des Resamplers anzupassen. Ein guter Ausgangspunkt für die Ressampler -Chunk -Größe ist die Verwendung eines "einfachen" Werts in der Nähe der durchschnittlichen Stücke der Audio -API. Stellen Sie sicher, dass der gemeinsam genutzte Puffer groß genug ist, um nicht voll zu werden, falls die Schleife blockiert wird. Warten Sie zum Beispiel auf den Zugriff auf Festplatten.

Die Schleife sollte einem Prozess folgen, der einem Clip ähnelt, aber der Eingang ist jetzt der gemeinsame Puffer. Die Schleife muss warten, bis die erforderliche Anzahl von Frames im Puffer verfügbar ist, bevor sie an den Resampler gelesen und weitergegeben werden.

Es wäre auch angemessen, den temporären Ausgangspuffer wegzulassen und die Ausgabe direkt an das Ziel zu schreiben. Die Houndkiste ist eine beliebte Wahl zum Lesen und Schreiben unkomprimierter Audioformate.

SIMD -Beschleunigung

Asynchrone Resampling mit Anti-Aliasing

Der asynchrone Resampler unterstützt SIMD unter x86_64 und auf AARCH64. Die SIMD -Funktionen der CPU werden zur Laufzeit bestimmt. Wenn kein unterstützter SIMD -Befehlssatz verfügbar ist, fällt er auf eine skalare Implementierung zurück.

Auf x86_64 wird versucht, AVX zu verwenden. Wenn AVX nicht verfügbar ist, wird es stattdessen SSE3 versuchen.

Auf AARCH64 (64-Bit-Arm) verwendet es Neon, falls verfügbar.

Synchrones Resampling

Die synchronen Resamplher profitieren von der SIMD -Unterstützung der Rustfft -Bibliothek.

Frachtmerkmale

`fft_resampler` : Aktivieren Sie die FFT -basierten synchronen Resampller

Diese Funktion ist standardmäßig aktiviert. Deaktivieren Sie es, wenn die FFT -Resamplher nicht benötigt werden, um die Kompilierungszeit zu sparen und die resultierende binäre Größe zu verringern.

`log` : Protokollierung aktivieren

Diese Funktion ermöglicht die Protokollierung über die log . Dies ist für Debugging -Zwecke gedacht. Beachten Sie, dass die Ausgabetlogs eine [STD :: STRING :: STRING] zuweisen und die meisten Protokollierungsimplementierungen verschiedene andere Systemaufrufe umfassen. Diese Anrufe können einige (unvorhersehbare) Zeit in Anspruch nehmen, in denen die Anwendung blockiert ist. Dies bedeutet, dass die Protokollierung vermieden werden sollte, wenn diese Bibliothek in einer Echtzeitanwendung verwendet wird.

Die log kann beim Ausführen von Tests aktiviert werden, was beim Debuggen sehr nützlich sein kann. Die Protokollierungsstufe kann über die RUST_LOG -Umgebungsvariable festgelegt werden.

Beispiel:

RUST_LOG=trace cargo test --features log

Beispiel

Proben Sie einen einzelnen Stück einer Dummy -Audio -Datei von 44100 bis 48000 Hz erneut. Siehe auch das Beispiel "process_f64", mit dem eine Datei von der Festplatte verarbeitet werden kann.

 use rubato :: { Resampler , SincFixedIn , SincInterpolationType , SincInterpolationParameters , WindowFunction } ;
let params = SincInterpolationParameters {
    sinc_len : 256 ,
    f_cutoff : 0.95 ,
    interpolation : SincInterpolationType :: Linear ,
    oversampling_factor : 256 ,
    window : WindowFunction :: BlackmanHarris2 ,
} ;
let mut resampler = SincFixedIn :: < f64 > :: new (
    48000 as f64 / 44100 as f64 ,
    2.0 ,
    params ,
    1024 ,
    2 ,
) . unwrap ( ) ;

let waves_in = vec ! [ vec! [ 0.0f64 ; 1024 ] ; 2 ] ;
let waves_out = resampler . process ( & waves_in , None ) . unwrap ( ) ;

Eingeschlossene Beispiele

Das examples enthält einige Beispielanwendungen zum Testen der Resamplher. Es gibt auch Python -Skripte, um einfache Testsignale zu generieren und die Resampfeergebnisse zu analysieren.

Die Beispiele lesen und schreiben Roh-Audio-Daten im 64-Bit-Float-Format. Sie können verwendet werden, um die Dateien zu verarbeiten, wenn die Dateien zuerst in das richtige Format konvertiert werden. Verwenden Sie sox , um ein .wav in Rohproben zu konvertieren:

sox some_file.wav -e floating-point -b 64 some_file_f64.raw

Nach der Verarbeitung kann das Ergebnis wieder in ein neues .wav konvertiert werden. Diese Beispiele wandeln sich auf 16 Bit bei 44,1 kHz um:

sox -e floating-point -b 64 -r 44100 -c 2 resampler_output.raw -e signed-integer -b 16 some_file_resampled.wav

Viele Audio -Redakteure, beispielsweise Audacity, können auch die Rohproben direkt importieren und exportieren.

Kompatibilität

Die rubato -Kiste benötigt RustC Version 1.61 oder neuer.

Changelog

v0.16.0
- Fügen Sie Unterstützung für das Ändern der festen Eingangs- oder Ausgangsgröße der asynchronen Resamplher hinzu.
v0.15.0
- Machen Sie FFT Resamplher optional über die Funktion fft_resampler .
- Beheben Sie die Berechnung der Eingangs- und Ausgangsgrößen beim Erstellen von FFTFixedInout -Resampller.
- Beheben Sie Panik, wenn Sie sehr kleine Chunkizes verwenden (weniger als 5).
v0.14.1
- Weitere Fehler für die Pufferzuweisung und die Berechnung der MAX -Ausgangslänge.
- Beheben Sie das Gebäude mit der log .
v0.14.0
- Fügen Sie Argument hinzu, um input/output_buffer_allocate() optional mit Nullen Puffer vorzuführen lassen.
- Fügen Sie Komfortmethoden zum Verwalten von Puffer hinzu.
- Bugfixes für die Berechnung der Pufferzuweisung und der MAX -Ausgangslänge.
v0.13.0
- Wechseln Sie zu Referenzscheiben für Eingabe- und Ausgabedaten.
- Fügen Sie schnellere (niedrigere Qualität) asynchrone Resampller hinzu.
- Fügen Sie ein Makro hinzu, um benutzerdefinierte Objekt -Sicherheitsressamplher zu implementieren.
- Optionale reibungslose Rampen von Verhältnisänderungen, um hörbare Schritte zu vermeiden.
- Fügen Sie Convenience -Methoden für den Umgang mit den letzten Frames in einem Stream hinzu.
- Fügen Sie die Resetet -Methode für Resampler hinzu.
- Refactoring für eine logischere Struktur.
- Fügen Sie die Helferfunktion zur Berechnung der Grenzfrequenz hinzu.
- Fügen Sie quadratische Interpolation für SINC Resampler hinzu.
- Fügen Sie die Methode hinzu, um die Verzögerung durch einen Resampler als eine Anzahl von Ausgangsrahmen zu erhalten.
v0.12.0
- Aktivieren Sie immer alle SIMD -Beschleunigungen (und entfernen Sie die SIMD -Frachtmerkmale).
v0.11.0
- Neue API für die Verwendung in Echtzeitanwendungen.
- Konfigurierbarer Einstellbereich von asynchronen Resamplieren.
v0.10.1
- Fix Compiling mit Neon -Funktion nach Änderungen in der letzten Nacht.
v0.10.0
- Fügen Sie ein Objekt-sicherer Wrapper-Merkmal zum Resampler hinzu.
v0.9.0
- Akzeptieren Sie alle ASREF <[t]> als Eingabe.

Lizenz: MIT

Expandieren

Zusätzliche Informationen

Version v0.16.1
Typ Anderer Quellcode
Aktualisierungszeit 2025-02-20
Größe 62.62KB
Kommt von Github

Ähnliche Anwendungen

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
chat.petals.dev

2024-11-30
SmartTube

2024-12-14
viptools for eslam

2024-12-15

rubato

Rubato

Datenformat für Eingabe und Ausgabe

Asynchrone Resampling

Synchrones Resampling

Verwendung

Überlegungen in Echtzeit

Wiederabtastung eines bestimmten Audioclips

Einen Stream neu Samplesabtastung neu abspielen

Beispiel, zeichnen Sie eine Datei von einer Audio -API auf

SIMD -Beschleunigung

Asynchrone Resampling mit Anti-Aliasing

Synchrones Resampling

Frachtmerkmale

`fft_resampler` : Aktivieren Sie die FFT -basierten synchronen Resampller

`log` : Protokollierung aktivieren

Beispiel

Eingeschlossene Beispiele

Kompatibilität

Changelog

waymo open dataset

Sunamu

MySchedule.py

chat.petals.dev

SmartTube

viptools for eslam

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

Sunamu

MySchedule.py

waymo open dataset

termwind

wp functions

rubato

Rubato

Datenformat für Eingabe und Ausgabe

Asynchrone Resampling

Synchrones Resampling

Verwendung

Überlegungen in Echtzeit

Wiederabtastung eines bestimmten Audioclips

Einen Stream neu Samplesabtastung neu abspielen

Beispiel, zeichnen Sie eine Datei von einer Audio -API auf

SIMD -Beschleunigung

Asynchrone Resampling mit Anti-Aliasing

Synchrones Resampling

Frachtmerkmale

fft_resampler : Aktivieren Sie die FFT -basierten synchronen Resampller

log : Protokollierung aktivieren

Beispiel

Eingeschlossene Beispiele

Kompatibilität

Changelog

`fft_resampler` : Aktivieren Sie die FFT -basierten synchronen Resampller

`log` : Protokollierung aktivieren