dbt databricks Download - dbt databricks Quellcode Download

dbt databricks

Anderer Quellcode

v1.8.7

Herunterladen

Mit DBT können Datenanalysten und Ingenieure ihre Daten mithilfe der gleichen Praktiken, die Software -Ingenieure zum Erstellen von Anwendungen verwenden, transformieren.

Das Databricks Lakehouse bietet eine einfache Plattform, um alle Ihre Daten, Analysen und KI -Workloads zu vereinen.

DBT-Databricks

Der dbt-databricks Adapter enthält den gesamten Code, mit dem DBT mit Datenbanken arbeiten kann. Dieser Adapter basiert auf der erstaunlichen Arbeit im DBT-Spark. Einige wichtige Funktionen sind:

Einfache Setup . Sie müssen keinen ODBC -Treiber installieren, da der Adapter reine Python -APIs verwendet.
Standardmäßig öffnen . Beispielsweise verwendet es standardmäßig das Open- und Performant -Delta -Tabellenformat. Dies hat viele Vorteile, einschließlich der Verschmelzung als MERGE als standardmäßige inkrementelle Materialisierungsstrategie.
Unterstützung für den Einheitskatalog . DBT-DATABRICKS> = 1.1.1 unterstützt den 3-Level-Namespace des Unity-Katalogs (Katalog / Schema / Beziehungen), sodass Sie Ihre Daten so organisieren und sichern können, wie Sie möchten.
Leistung . Der Adapter generiert SQL -Ausdrücke, die automatisch von der nativen, vektorisierten Photonausführungsmaschine beschleunigt werden.

Wahl zwischen DBT-Databricks und DBT-Spark

Wenn Sie ein DBT-Projekt zu Datenbäumen entwickeln, empfehlen wir, dbt-databricks aus den oben genannten Gründen zu verwenden.

dbt-spark ist ein aktiv entwickeltes Adapter, der mit Datenbanken und Apache Spark überall, wo er auf AWS EMR gehostet wird, funktioniert.

Erste Schritte

Installation

Mit PIP installieren:

pip install dbt-databricks

Upgrade auf die neueste Version

pip install --upgrade dbt-databricks

Profil -Setup

your_profile_name:
  target: dev
  outputs:
    dev:
      type: databricks
      catalog: [optional catalog name, if you are using Unity Catalog, only available in dbt-databricks>=1.1.1]
      schema: [database/schema name]
      host: [your.databrickshost.com]
      http_path: [/sql/your/http/path]
      token: [dapiXXXXXXXXXXXXXXXXXXXXXXX]

Schneller beginnt

Mit diesen folgenden schnellen Starts werden Sie mit dem dbt-databricks -Adapter zum Laufen gebracht:

Entwicklung Ihres ersten DBT -Projekts
Verwenden von DBT -Cloud mit Datenbanken (Azure | AWS)
Ausführen von DBT -Produktionsjobs auf Datenbanken Workflows
Verwenden Sie einen Einheitskatalog mit DBT-Databricks
Verwenden von GitHub -Aktionen für DBT CI/CD auf Datenbanken
Laden Sie Daten von S3 in Delta mit dem Makro Databricks_Copy_into in Delta
Tragen Sie zu diesem Repository bei

Kompatibilität

Der dbt-databricks Adapter wurde getestet:

mit Python 3.7 oder höher.
Gegen Databricks SQL und Databricks runtime releases 9.1 LTS und später.

Tipps und Tricks

Wahl für ein Python -Modell wählen

Sie können die für ein bestimmte Python -Modell verwendete Berechnung überschreiben, indem Sie die Eigenschaft http_path in der Modellkonfiguration einstellen. Dies kann nützlich sein, wenn Sie beispielsweise ein Python -Modell auf einem Allzweck -Cluster ausführen möchten, während Sie SQL -Modelle in einem SQL -Lager ausführen. Beachten Sie, dass diese Funktion nur für Python -Modelle verfügbar ist.

def model(dbt, session):
    dbt.config(
      http_path="sql/protocolv1/..."
    )

Expandieren

Zusätzliche Informationen

Version v1.8.7
Typ Anderer Quellcode
Aktualisierungszeit 2025-02-20
Größe 841.28KB
Kommt von Github

Ähnliche Anwendungen

Code D

2023-08-01
Diablo 3D

2023-04-23
Diablo 3D

2023-04-23
Zauberer 3d

2023-04-23
K37-D

2022-08-22
D-Corp

2022-08-02

dbt databricks

DBT-Databricks

Wahl zwischen DBT-Databricks und DBT-Spark

Erste Schritte

Installation

Profil -Setup

Schneller beginnt

Kompatibilität

Tipps und Tricks

Wahl für ein Python -Modell wählen

Code D

Diablo 3D

Diablo 3D

Zauberer 3d

K37-D

D-Corp

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

Sunamu

MySchedule.py

waymo open dataset

termwind

wp functions