PDEBench Download - PDEBench Quellcode Download

PDEBench

Anderer Quellcode

v0.1.0

Herunterladen

Pdebch

Das Code -Repository für die Neurips 2022 Paper Pdebch: Ein umfangreicher Benchmark für wissenschaftliches maschinelles Lernen

? Simtech Best Paper Award 2023 ?

Pdebch bietet eine vielfältige und umfassende Reihe von Benchmarks für wissenschaftliches maschinelles Lernen, einschließlich herausfordernder und realistischer körperlicher Probleme. Dieses Repository besteht aus dem Code, mit dem die Datensätze generiert, die Datensätze aus dem Datenrepository hochgeladen und heruntergeladen werden können, sowie verschiedene maschinelle Lernmodelle als Baselines. Pdebch verfügt über eine viel größere Auswahl an PDEs als vorhandene Benchmarks und umfasst realistische und schwierige Probleme (sowohl vorwärts als auch inverse), größere Datensätze, die verschiedene Anfangs- und Randbedingungen sowie PDE-Parameter umfassen. Darüber hinaus wurde Pdebch erstellt, um den Quellcode auszudehnen zu machen, und wir laden eine aktive Teilnahme der Sciml -Community ein, den Benchmark zu verbessern und zu erweitern.

Visualisierungen einiger PDE -Probleme, die vom Benchmark behandelt werden.

Created and maintained by Makoto Takamoto <[email protected], [email protected]> , Timothy Praditia <[email protected]> , Raphael Leiteritz, Dan MacKinlay, Francesco Alesiani, Dirk Pflüger, and Mathias Niepert.

Datensätze und vorbereitete Modelle

Wir bieten auch Datensätze und vorbereitete Modelle für maschinelles Lernen.

PDEBch-Datensätze: https://darus.uni-stuttgart.de/dataset.xhtml?persistentide=doi:10.18419/darus-2986

PDEBench PreAned Models: https://darus.uni-stuttgart.de/dataset.xhtml?persistid=doi:10.18419/darus-2987

Dois

Installation

Verwenden von PIP

Lokal:

pip install --upgrade pip wheel
pip install .

Von pypi:

pip install pdebench

Abhängigkeiten für die Datenerzeugung einbeziehen:

pip install " pdebench[datagen310] "
pip install " .[datagen310] " # locally

oder

pip install " pdebench[datagen39] "
pip install " .[datagen39] " # locally

GPU -Unterstützung

Für die GPU-Unterstützung gibt es zusätzliche plattformspezifische Anweisungen:

Für Pytorch ist die neueste Version, die wir unterstützen, v1.13.1 Siehe vorherige Versionen/#Linux - CUDA 11.7.

Für JAX, der für Simulationen ungefähr 6-mal schneller ist als bei Pytorch in unseren Tests

Installation mit Conda:

Wenn Sie mögen, können Sie auch Abhängigkeiten mit Anaconda installieren, empfehlen wir, Mambaforge als Verteilung zu verwenden. Andernfalls müssen Sie möglicherweise den Conda-Forge-Kanal für die folgenden Befehle aktivieren .

Ausgehend von einer frischen Umgebung:

 conda create -n myenv python=3.9
conda activate myenv

Installieren Sie Abhängigkeiten für das Modelltraining:

 conda install deepxde hydra-core h5py -c conda-forge

Entsprechend Ihrer Hardwareverfügbarkeit installieren Sie entweder Pytorch mit CUDA -Unterstützung:

Siehe vorherige Versionen/#Linux - CUDA 11.7.

 conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia

oder CPU nur Binärdateien.

 conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 cpuonly -c pytorch

Optionale Abhängigkeiten für die Datenerzeugung:

 conda install clawpack jax jaxlib python-dotenv

Konfigurieren von DeepXde

In unseren Tests haben wir Pytorch als Backend für DeepXde verwendet. Bitte befolgen Sie die Dokumentation, um dies zu aktivieren.

Datenerzeugung

Die Datenerzeugungscodes sind in Data_Gen enthalten:

gen_diff_react.py Um die 2D-Diffusionsreaktionsdaten zu generieren.
gen_diff_sorp.py Um die 1D-Diffusionsorptionsdaten zu generieren.
gen_radial_dam_break.py Um die 2D-Sachwasserdaten zu generieren.
gen_ns_incomp.py um die inkompressiblen 2D-inhomogenen Navier-Stokes-Daten zu generieren.
plot.py um die generierten Daten zu zeichnen.
uploader.py , um die generierten Daten in das Datenrepository hochzuladen.
.env sind die Umgebungsdaten, um Dataverse -URL und API -Token zu speichern, um die generierten Daten hochzuladen. Beachten Sie, dass der Dateiname ausschließlich .env sein sollte (dh das example aus dem Dateinamen entfernen).
configs enthält die YAML -Dateien, die die Konfiguration für die Simulation speichern. Argumente für die Simulation sind problemspezifische und detaillierte Erläuterungen finden Sie in den Simulationsskripten.
src Verzeichnis enthält die Simulationsskripte für unterschiedliche Probleme: sim_diff_react-py für 2D-Diffusionsreaktion, sim_diff_sorp.py für 1D-Diffusionsorption und swe für die Flachwassergleichung.

Datenerzeugung für 1D Advection/Burgers/Reaktionsdiffusion/2d Darcyflow/kompressible Navier-Stokes-Gleichungen

Die Datenerzeugungscodes sind in data_gen_nle enthalten:

utils.py Util -Datei für die Datenerzeugung, hauptsächlich Randbedingungen und Anfangsbedingungen.
AdvectionEq -Verzeichnis mit den Quellcodes, um 1D -Proben der Advection -Gleichung zu generieren
BurgersEq -Verzeichnis mit den Quellcodes, um 1D Burgers Gleichungstraining -Proben zu generieren
CompressibleFluid -Verzeichnis mit den Quellcodes, um kompressible Navier-Stokes-Gleichungs-Trainingsproben zu erzeugen
- ReactionDiffusionEq -Verzeichnis mit den Quellcodes zur Generierung von 1D-Reaktions-Diffusion-Gleichungstraining-Proben ( Hinweis: Darcyflow-Daten können in diesem Ordner durch run_darcyflow2d.sh generiert werden. )
Verzeichnis save um die generierten Trainingsmuster zu speichern

Ein typisches Beispiel zum Generieren von Trainingsmuster (1d Advection -Gleichung): (in data_gen/data_gen_NLE/AdvectionEq/ )

python3 advection_multi_solution_Hydra.py +multi=beta1e0.yaml

Es wird angenommen, dass in jedem Verzeichnis ausgeführt wird.

Beispiele für die Erzeugung anderer PDEs sind in run_trainset.sh in den Verzeichnissen jedes PDE bereitgestellt. Die Konfigurationsdateien für HYDRA werden im Verzeichnis config in jedem PDE -Verzeichnis gespeichert.

Datentransformation und Verschmelzung in das HDF5 -Format

1d Advection/Burgers/Reaktionsdiffusion/2d Darcyflow/kompressible Navier-Stokes-Gleichungen speichern Daten als numpy Array. Um diese Daten über unsere DataLoader zu lesen, sollte die Datenumwandlung/-verarbeitung durchgeführt werden. Dies kann mit data_gen_NLE/Data_Merge.py erfolgen, deren Konfigurationsdatei sich unter: data_gen/data_gen_NLE/config/config.yaml befindet. Nachdem die Parameter in der Konfigurationsdatei ordnungsgemäß eingestellt wurden (Typ: Name von PDEs, Dim: Anzahl der räumlichen Dimensionen, BD: Randbedingung), konnte die entsprechende HDF5-Datei als:

python3 Data_Merge.py

Konfiguration

Sie können die Standardwerte für Datenorte für dieses Projekt festlegen, indem Sie Konfigurationsvars wie diese in der Datei .env einfügen:

 WORKING_DIR=~/Data/Working
ARCHIVE_DATA_DIR=~/Data/Archive

In example.env gibt es ein Beispiel.

Daten herunterladen

Die Download -Skripte sind in Data_download bereitgestellt. Es gibt zwei Optionen zum Herunterladen von Daten.

Verwenden Sie download_direct.py ( empfohlen )
- Ruft Datenschards direkt mit URLs ab. Der Befehl Beispiel für jede PDE ist in der ReadMe -Datei im Verzeichnis data_download angegeben.
Verwenden Sie download_easydataverse.py (könnte langsam sein und Sie können Fehler/Probleme aufnehmen; daher nicht empfohlen!)
- Verwenden Sie die Konfigurationsdateien aus dem config , das die YAML -Dateien enthält, die die Konfiguration speichern. Alle Dateien im Dataset -Matching args.filename werden in args.data_folder heruntergeladen.

Basismodelle

In dieser Arbeit stellen wir drei verschiedene ML-Modelle zur Verfügung, die an den Benchmark-Datensätzen trainiert und bewertet werden sollen, nämlich FNO, U-NET und Pinn. Die Codes für die Basismodellimplementierungen sind in Modellen enthalten:

train_models_forward.py ist das Hauptskript, um das Modell zu trainieren und zu bewerten. Es wird das modellspezifische Skript basierend auf dem Eingabeargument aufrufen.
train_models_inverse.py ist das Hauptskript, um das Modell für umgekehrte Probleme zu trainieren und zu bewerten. Es wird das modellspezifische Skript basierend auf dem Eingabeargument aufrufen.
metrics.py ist das Skript zur Bewertung der geschulten Modelle basierend auf verschiedenen in unserem Artikel beschriebenen Bewertungsmetriken. Darüber hinaus plant es auch die Vorhersage- und Zieldaten.
analyse_result_forward.py ist das Skript zum Umwandeln der gespeicherten Pickle -Datei aus dem Metrikenberechnungskript in das Pandas -Datenfreame -Format und speichern sie als CSV -Datei. Darüber hinaus plant es auch ein Balkendiagramm, um die Ergebnisse zwischen verschiedenen Modellen zu vergleichen.
analyse_result_inverse.py ist das Skript zum Umwandeln der gespeicherten Pickle -Datei aus dem Metrics -Berechnungskript in das Pandas -Datenfreame -Format und speichern sie als CSV -Datei. Dieses Skript wird für die inversen Probleme verwendet. Darüber hinaus plant es auch ein Balkendiagramm, um die Ergebnisse zwischen verschiedenen Modellen zu vergleichen.
fno enthält die Skripte der FNO -Implementierung. Diese sind teilweise aus dem FNO -Repository angepasst.
unet enthält die Skripte der U-NET-Implementierung. Diese sind teilweise aus dem U-Net-Repository angepasst.
pinn enthält die Skripte der Pinn -Implementierung. Diese nutzen die DeepXDE -Bibliothek.
inverse enthält das Modell für das inverse Modell basierend auf Gradienten.
config enthält die YAML -Dateien für die Modelltrainingseingabe. Die Standardvorlagen für verschiedene Gleichungen sind im Args -Verzeichnis bereitgestellt. Der Benutzer muss sie nur kopieren und in das Keyword von Args in der Datei config.yaml einfügen.

Ein Beispiel zum Ausführen des Vorwärtsmodelltrainings finden Sie in run_forward_1d.sh, und ein Beispiel zum Ausführen des inversen Modelltrainings finden Sie in run_inverse.sh.

Kurze Erklärungen zu den Konfigurationsargs

model_name: String, mit dem Basismodellnamen, entweder 'fno', 'unet' oder 'pinn'.
IF_TRINING: BOOL, für das Training einstellen oder für die Bewertung falsch.
CONTEILE_TRINING: Bool, festgelegt, um das Training von einem Kontrollpunkt aus fortzusetzen.
num_worker: int, Anzahl der Arbeiter für den Pytorch Dataloader.
Batch_Size: int, Trainingsstapelgröße.
initial_step: int, Anzahl der Zeitschritte, die als Eingabe für FNO und U-NET verwendet werden.
T_TRAIN: INT, Anzahl des letzten Zeitschritts, der für das Training verwendet wird (für Extrapolationstests, setzen Sie dies auf <nt).
model_update: int, Anzahl der Epochen zum Speichern von Modell.
Dateiname: STR, muss mit dem Dataset -Dateinamen übereinstimmen.
Single_file: Bool, für 2D-Diffusionsreaktion, 1D-Diffusionsorption und die radialen Damm-Bruch-Szenarien falsch eingestellt und ansonsten wahr eingestellt.
reduzierte_Resolution: int, Faktor, um die räumliche Auflösung zu verkleinern.
reced_resolution_t: int, faktor auf die zeitliche Auflösung zu verkleinern.
reced_batch: int, faktor, um die für das Training verwendete Stichprobengröße zu verkleinern.
Epochen: INT, Gesamt -Epochen, die für das Training verwendet werden.
Learning_rate: Float, Lernrate des Optimierers.
Scheduler_Step: Int, Anzahl der Epochen, um den Scheduler für die Lernrate zu aktualisieren.
Scheduler_Gamma: Float, Zerfallrate der Lernrate.

U-net-spezifische Argumente:

IN_Channels: int, Anzahl der Eingangskanäle
out_channels: int, Anzahl der Ausgabekanäle
AR_MODE: BOOL, Setzen Sie sich für ein vollständig autoregressives oder Pushforward -Training.
Pushforward: bool, für Pushforward -Training eingestellt, ansonsten false (AR_MODE muss ebenfalls wahr gesetzt werden).
Exproll_Step: int, Anzahl der Zeitschritte, die im Pushforward -Training zurückpropagieren.

FNO spezifische Argumente:

num_channels: int, Anzahl der Kanäle (Variablen).
Modi: int, Anzahl der Fourier -Modi, die sich multiplizieren.
Breite: int, Anzahl der Kanäle für die Fourier -Schicht.

Umgekehrte spezifische Argumente:

Base_path: String, Ort des Datenverzeichnisses
Training_type: String, Trainingstyp, autoregressiv, Single
mcmc_num_samples: int, Anzahl der generierten Proben
MCMC_WARMUP_STEPS: 10
mcmc_num_chains: 1
num_samples_max: 1000
IN_CHANNELS_HID: 64
Inverse_Model_Type: String, Typ des inversen Inferenzmodells, Probrasterlatent, InitialConditionInterpp
Inverse_epochs: int, Anzahl der Epochen für die Gradientenbasis -Methode
Inverse_learning_rate: Float, Lernrate für die gradientenbasierte Methode
inverse_verbose_flag: bool, etwas Druck

Zeichnen bestimmter Argumente:

Diagramm: bool, stimmt für das Aktivieren der Plotten.
Channel_Plot: Int, bestimmt, welche Kanal/Variable zu Diagramm zu sehen ist.
X_MIN: Float, linke räumliche Domäne.
X_MAX: Float, rechte räumliche Domäne.
y_min: float, untere räumliche Domäne.
Y_max: Float, obere räumliche Domäne.
T_MIN: Float, Start der zeitlichen Domäne.
T_MAX: Float, Ende der zeitlichen Domäne.

Datensätze und vorbereitete Modelle

Wir bieten die Benchmark -Datensätze, die wir im Papier über unser Darus -Datenrepository verwendet haben. Die Datenerzeugungskonfiguration finden Sie im Papier. Darüber hinaus können die vorbereiteten Modelle auch von PDEBch PretRainained Models Darus Repository heruntergeladen werden. Um die vorbereiteten Modelle zu verwenden, können Benutzer das Argument continue_training: True in der Konfigurationsdatei angeben.

Verzeichnistour

Unten ist eine Darstellung der Verzeichnisstruktur von Pdebch.

 pdebench
|_? models
  |_? pinn    # Model: Physics-Informed Neural Network
    |_? train.py
    |_? utils.py
    |_? pde_definitions.py
  |_? fno     # Model: Fourier Neural Operator
    |_? train.py
    |_? utils.py
    |_? fno.py
  |_? unet    # Model: U-Net
    |_? train.py
    |_? utils.py
    |_? unet.py
  |_? inverse # Model: Gradient-Based Inverse Method
    |_? train.py
    |_? utils.py
    |_? inverse.py
  |_? config  # Config: All config files reside here
  |_? train_models_inverse.py
  |_? run_forward_1D.sh
  |_? analyse_result_inverse.py
  |_? train_models_forward.py
  |_? run_inverse.sh
  |_? metrics.py
  |_? analyse_result_forward.py
|_? data_download  # Data: Scripts to download data from DaRUS
  |_? config
  |_? download_direct.py
  |_? download_easydataverse.py
  |_? visualize_pdes.py
  |_? README.md
  |_? download_metadata.csv
|_? data_gen   # Data: Scripts to generate data
  |_? configs
  |_? data_gen_NLE
  |_? src
  |_? notebooks
  |_? gen_diff_sorp.py
  |_? plot.py
  |_? example.env
  |_? gen_ns_incomp.py
  |_? gen_diff_react.py
  |_? uploader.py
  |_? gen_radial_dam_break.py
|_? __init__.py

Veröffentlichungen und Zitate

Bitte zitieren Sie die folgenden Arbeiten, wenn Sie PDEBch -Datensätze und/oder Quellcode in Ihrer Forschung verwenden.

PDEBch: Ein umfangreicher Benchmark für wissenschaftliches maschinelles Lernen - Neurips'2022

 @inproceedings{PDEBench2022,
author = {Takamoto, Makoto and Praditia, Timothy and Leiteritz, Raphael and MacKinlay, Dan and Alesiani, Francesco and Pflüger, Dirk and Niepert, Mathias},
title = {{PDEBench: An Extensive Benchmark for Scientific Machine Learning}},
year = {2022},
booktitle = {36th Conference on Neural Information Processing Systems (NeurIPS 2022) Track on Datasets and Benchmarks},
url = {https://arxiv.org/abs/2210.07182}
}

PDEBch -Datensätze - Neurips'2022

 @data{darus-2986_2022,
author = {Takamoto, Makoto and Praditia, Timothy and Leiteritz, Raphael and MacKinlay, Dan and Alesiani, Francesco and Pflüger, Dirk and Niepert, Mathias},
publisher = {DaRUS},
title = {{PDEBench Datasets}},
year = {2022},
doi = {10.18419/darus-2986},
url = {https://doi.org/10.18419/darus-2986}
}

Lernen neuronaler PDE -Solvers mit parametergesteuerter Kanalaufmerksamkeit - ICML'2023

 @article{cape-takamoto:2023,
     author   = {Makoto Takamoto and
                 Francesco Alesiani and
                 Mathias Niepert},
 title        = {Learning Neural {PDE} Solvers with Parameter-Guided Channel Attention},
 journal      = {CoRR},
 volume       = {abs/2304.14118},
 year         = {2023},
 url          = {https://doi.org/10.48550/arXiv.2304.14118},
 doi          = {10.48550/arXiv.2304.14118},
 eprinttype    = {arXiv},
 eprint       = {2304.14118},
 }

Vektorisierte bedingte neuronale Felder: Ein Rahmen zur Lösung zeitabhängiger parametrischer partieller Differentialgleichungen-ICLR-W'2024 & ICML'2024

 @inproceedings{vcnef-vectorized-conditional-neural-fields-hagnberger:2024,
author = {Hagnberger, Jan and Kalimuthu, Marimuthu and Musekamp, Daniel and Niepert, Mathias},
title = {{Vectorized Conditional Neural Fields: A Framework for Solving Time-dependent Parametric Partial Differential Equations}},
year = {2024},
booktitle = {Proceedings of the 41st International Conference on Machine Learning (ICML 2024)}
}

Aktives Lernen für neuronale PDE -Solvers - Neurip -W'2024

 @article{active-learn-neuralpde-benchmark-musekamp:2024,
 author       = {Daniel Musekamp and
                 Marimuthu Kalimuthu and
                 David Holzm{"{u}}ller and
                 Makoto Takamoto and
                 Mathias Niepert},
 title        = {Active Learning for Neural {PDE} Solvers},
 journal      = {CoRR},
 volume       = {abs/2408.01536},
 year         = {2024},
 url          = {https://doi.org/10.48550/arXiv.2408.01536},
 doi          = {10.48550/ARXIV.2408.01536},
 eprinttype    = {arXiv},
 eprint       = {2408.01536},
}

Code -Mitwirkende

Makato Takamoto (NEC Laboratories Europe)
Timothy Praditia (Stuttgart Center for Simulationswissenschaft | Universität Stuttgart)
Raphael Leiteritz (Stuttgart Center for Simulationswissenschaft | Universität von Stuttgart)
Francesco Alesiani (NEC Laboratories Europe)
Dan Mackinlay (CSIRO -Daten61)
Marimuthu Kalimuthu (Stuttgart Center for Simulationswissenschaft | Universität Stuttgart)
John Kim (Anu Techlauncher/CSIRO -Daten61)
Gefei Shan (Anu Techlauner/CSIRO -Daten61)
Yizhou Yang (Anu Techlauner/CSIRO -Daten61)
Ran Zhang (Anu Techlauncher/CSIRO -Daten61)
Simon Brown (Anu Techlauncher/CSIRO -Daten61)

Lizenz

MIT lizenziert, außer wenn sonst angegeben. Siehe LICENSE.txt .

Expandieren

Zusätzliche Informationen

Version v0.1.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-02-27
Größe 995.91KB
Kommt von Github

Ähnliche Anwendungen

waymo open dataset

2024-11-18
Sunamu

2024-12-14
MySchedule.py

2024-12-15
SmartTube

2024-12-14
chat.petals.dev

2024-11-30
viptools for eslam

2024-12-15

PDEBench

Pdebch

Datensätze und vorbereitete Modelle

Installation

Verwenden von PIP

GPU -Unterstützung

Installation mit Conda:

Konfigurieren von DeepXde

Datenerzeugung

Datenerzeugung für 1D Advection/Burgers/Reaktionsdiffusion/2d Darcyflow/kompressible Navier-Stokes-Gleichungen

Datentransformation und Verschmelzung in das HDF5 -Format

Konfiguration

Daten herunterladen

Basismodelle

Kurze Erklärungen zu den Konfigurationsargs

U-net-spezifische Argumente:

FNO spezifische Argumente:

Umgekehrte spezifische Argumente:

Zeichnen bestimmter Argumente:

Datensätze und vorbereitete Modelle

Verzeichnistour

Veröffentlichungen und Zitate

Code -Mitwirkende

Lizenz

waymo open dataset

Sunamu

MySchedule.py

SmartTube

chat.petals.dev

viptools for eslam

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

Sunamu

MySchedule.py

waymo open dataset

termwind

wp functions