Kedro ist eine Toolbox für produktionsbereite Datenwissenschaft. Es verwendet die Best Practices für Software -Engineering, um Ihnen bei der Erstellung von reproduzierbaren, wartbaren und modularen Daten von Daten Engineering und Data Science zu helfen. Sie können mehr unter kedro.org erfahren.
Kedro ist ein Open-Source-Python-Framework, das von der LF AI & Data Foundation gehostet wird.
So installieren Sie Kedro aus dem Python Package Index (PYPI).
pip install kedro
Es ist auch möglich, Kedro mit conda
zu installieren:
conda install -c conda-forge kedro
Unser Get -Start -Leitfaden enthält vollständige Installationsanweisungen und die Einrichtung von virtuellen Python -Umgebungen.
Um auf die neueste Kedro -Version vor der offiziellen Veröffentlichung zuzugreifen, installieren Sie sie in der main
.
pip install git+https://github.com/kedro-org/kedro@main
Besonderheit | Was ist das? |
---|---|
Projektvorlage | Eine Standard-, modifizierbare und benutzerfreundliche Projektvorlage basierend auf CookieCutter-Datenwissenschaft. |
Datenkatalog | Eine Reihe von leichten Datenkonnektoren, die zum Speichern und Laden von Daten in vielen verschiedenen Dateiformaten und Dateisystemen verwendet werden, einschließlich lokaler und Netzwerkdateisysteme, Cloud -Objektspeicher und HDFs. Der Datenkatalog enthält auch Daten- und Modellversionierung für dateibasierte Systeme. |
Pipeline -Abstraktion | Automatische Auflösung von Abhängigkeiten zwischen reinen Pythonfunktionen und Datenpipeline-Visualisierung unter Verwendung von Kedro-Viz. |
Codierungsstandards | Testgetriebene Entwicklung mit pytest , gut dokumentierten Code mit Sphinx erstellen, mit Unterstützung von ruff ausgegebener Code erstellen und die Standard-Python-Protokollierungsbibliothek verwenden. |
Flexible Bereitstellung | Bereitstellungsstrategien, die eine einzelne oder verteilte Machine-Bereitstellung sowie zusätzliche Unterstützung für die Bereitstellung von Argo, Präfekten, Kubeflow, AWS-Batch und Datenbanken umfassen. |
In der Kedro -Dokumentation wird zunächst erläutert, wie Kedro installiert wird, und führt dann wichtige Kedro -Konzepte ein.
Sie können dann das SpaceFlight-Tutorial überprüfen, um ein Kedro-Projekt für praktische Erfahrungen zu erstellen.
Für neue und intermediäre Kedro-Benutzer gibt es einen umfassenden Abschnitt zum Visualisieren von Kedro-Projekten mit Kedro-Viz.
Eine mit Kedro-Viz erzeugte Pipeline-Visualisierung
Zusätzliche Dokumentation erläutert, wie man mit Kedro- und Jupyter -Notizbüchern arbeitet, und es gibt eine Reihe erweiterter Benutzerführer für Erweiterte für wichtige Kedro -Funktionen. Wir empfehlen auch die API -Referenzdokumentation für weitere Informationen.
Kedro basiert auf unseren kollektiven Best-Practice (und Fehlern), die versuchen, reale ML-Anwendungen mit großen Mengen an unzähligen Daten zu liefern. Wir haben Kedro entwickelt, um Folgendes zu erreichen:
Um die Hauptmängel von Jupyter-Notizbüchern, einmaligen Skripten und Klebercode zu beheben
Verbesserung der Teamzusammenarbeit , wenn verschiedene Teammitglieder unterschiedlich mit Software -Engineering -Konzepten ausgesetzt sind
Die Effizienz zu erhöhen, da angewandte Konzepte wie Modularität und Trennung von Bedenken die Erstellung von wiederverwendbarem Analysecode inspirieren
Erfahren Sie mehr darüber, wie Kedro Ihre Anwendungsfälle von den Produkt -FAQs von Produkten auf der Kedro -Website beantworten kann.
Das Kedro -Produktteam und eine Reihe von Open -Source -Mitwirkenden aus der ganzen Welt unterhalten Kedro.
Ja! Wir begrüßen alle möglichen Beiträge. Schauen Sie sich unseren Leitfaden zum Beitrag zu Kedro an.
In Kedro gibt es eine wachsende Gemeinschaft. Wir ermutigen Sie, technische Fragen zu Slack zu stellen und zu beantworten und das Leinenarchiv früherer Diskussionen zu einem Lesezeichen zu beantworten.
Wir führen eine Liste technischer FAQs in der Kedro-Dokumentation und finden Sie eine wachsende Liste von Blog-Posts, Videos und Projekten, die Kedro auf dem awesome-kedro
-Github-Repository verwenden. Wenn Sie mit Kedro etwas erstellt haben, würden wir es gerne in die Liste aufnehmen. Machen Sie einfach eine PR, um es hinzuzufügen!
Wenn Sie ein Akademiker sind, kann Kedro Ihnen beispielsweise auch als Instrument helfen, das Problem der reproduzierbaren Forschung zu lösen. Verwenden Sie die Schaltfläche "Dieses Repository zitieren" in unserem Repository, um ein Zitat aus der Datei citation.cff zu generieren.
Das Kern -Kedro -Framework unterstützt alle Python -Versionen, die vom CPython Core -Team aktiv aufrechterhalten werden. Wenn eine Python -Version das Lebensende erreicht, wird die Unterstützung für diese Version von Kedro fallen gelassen. Dies gilt nicht als brechen.
Das Kedro -Datasets -Paket folgt der NEP 29 Python Version Support -Richtlinie. Dies bedeutet, dass kedro-datasets
im Allgemeinen die Unterstützung der Python-Version vor kedro
fallen lassen. Dies liegt daran, dass kedro-datasets
viele Abhängigkeiten haben, die NEP 29 folgen, und der konservativere Ansatz der Versionsunterstützung des Kedro-Frameworks ist es schwierig, diese Abhängigkeiten ordnungsgemäß zu verwalten.
Wir schätzen unsere Community und möchten in Verbindung bleiben. Dafür bieten wir ein öffentliches Kaffee -Chat -Format an, in dem wir alle zwei Wochen Updates und coole Sachen in Kedro teilen und Ihnen Zeit geben, Ihre Fragen live zu stellen.
Schauen Sie sich die bevorstehenden Demo -Themen und Daten auf der Kedro Coffee Chat -Wiki -Seite an.
Folgen Sie unserem Slack -Ankündigungskanal, um Kedro Coffee Chat -Ankündigungen zu sehen und auf Demo -Aufnahmen zuzugreifen.