Kedro adalah kotak alat untuk ilmu data siap-produksi. Ia menggunakan praktik terbaik rekayasa perangkat lunak untuk membantu Anda membuat pipa rekayasa data dan saluran sains data yang dapat direproduksi, dapat dipelihara, dan modular. Anda dapat mengetahui lebih lanjut di kedro.org.
KEDRO adalah kerangka kerja Python open-source yang diselenggarakan oleh LF AI & Data Foundation.
Untuk menginstal Kedro dari Python Package Index (PYPI) Run:
pip install kedro
Dimungkinkan juga untuk menginstal kedro menggunakan conda
:
conda install -c conda-forge kedro
Panduan Get Get Start kami berisi instruksi instalasi penuh, dan termasuk cara mengatur lingkungan virtual Python.
Untuk mengakses versi Kedro terbaru sebelum rilis resminya, instal dari cabang main
.
pip install git+https://github.com/kedro-org/kedro@main
Fitur | Apa ini? |
---|---|
Template Proyek | Template proyek standar, dapat dimodifikasi dan mudah digunakan berdasarkan ilmu data cookiecutter. |
Katalog Data | Serangkaian konektor data ringan yang digunakan untuk menyimpan dan memuat data di berbagai format file dan sistem file, termasuk sistem file lokal dan jaringan, penyimpanan objek cloud, dan HDFS. Katalog data juga mencakup versi data dan model untuk sistem berbasis file. |
Abstraksi pipa | Resolusi otomatis ketergantungan antara fungsi python murni dan visualisasi pipa data menggunakan Kedro-viz. |
Standar pengkodean | Pengembangan yang digerakkan oleh uji menggunakan pytest , menghasilkan kode yang terdokumentasi dengan baik menggunakan SPHINX, membuat kode linted dengan dukungan untuk ruff dan memanfaatkan pustaka logging Python standar. |
Penyebaran fleksibel | Strategi penyebaran yang mencakup penyebaran mesin tunggal atau terdistribusi serta dukungan tambahan untuk penyebaran pada Argo, Prefek, Kubeflow, Batch AWS, dan databricks. |
Dokumentasi Kedro pertama -tama menjelaskan cara menginstal Kedro dan kemudian memperkenalkan konsep -konsep KEDRO kunci.
Anda kemudian dapat meninjau tutorial Spaceflights untuk membangun proyek Kedro untuk pengalaman langsung.
Untuk pengguna Kedro baru dan menengah, ada bagian komprehensif tentang cara memvisualisasikan proyek Kedro menggunakan Kedro-Viz.
Visualisasi pipa yang dihasilkan menggunakan kedro-viz
Dokumentasi tambahan menjelaskan cara bekerja dengan notebook Kedro dan Jupyter, dan ada satu set panduan pengguna canggih untuk fitur Key Kedro. Kami juga merekomendasikan dokumentasi referensi API untuk informasi lebih lanjut.
Kedro dibangun di atas praktik terbaik kolektif kami (dan kesalahan) yang mencoba memberikan aplikasi ML dunia nyata yang memiliki sejumlah besar data mentah yang tidak diperhatikan. Kami mengembangkan kedro untuk mencapai yang berikut:
Untuk mengatasi kekurangan utama dari buku catatan Jupyter, skrip sekali saja, dan kode lem karena ada fokus untuk membuat kode sains data yang dapat dipelihara
Untuk meningkatkan kolaborasi tim ketika anggota tim yang berbeda memiliki paparan yang bervariasi terhadap konsep rekayasa perangkat lunak
Untuk meningkatkan efisiensi, karena konsep terapan seperti modularitas dan pemisahan kekhawatiran menginspirasi penciptaan kode analitik yang dapat digunakan kembali
Cari tahu lebih lanjut tentang bagaimana Kedro dapat menjawab kasus penggunaan Anda dari FAQ produk di situs web KEDRO.
Tim produk Kedro dan sejumlah kontributor open source dari seluruh dunia mempertahankan Kedro.
Ya! Kami menyambut semua jenis kontribusi. Lihat panduan kami untuk berkontribusi ke Kedro.
Ada komunitas yang berkembang di sekitar Kedro. Kami mendorong Anda untuk mengajukan dan menjawab pertanyaan teknis tentang Slack dan menandai arsip linen dari diskusi sebelumnya.
Kami menyimpan daftar FAQ teknis dalam dokumentasi Kedro dan Anda dapat menemukan daftar posting blog, video, dan proyek yang terus berkembang yang menggunakan Kedro di repositori GitHub awesome-kedro
. Jika Anda telah membuat sesuatu dengan Kedro, kami ingin memasukkannya ke dalam daftar. Buat saja PR untuk menambahkannya!
Jika Anda seorang akademisi, Kedro juga dapat membantu Anda, misalnya, sebagai alat untuk menyelesaikan masalah penelitian yang dapat direproduksi. Gunakan tombol "CITE ini repositori" pada repositori kami untuk menghasilkan kutipan dari file Citation.cff.
Kerangka KEDRO inti mendukung semua versi Python yang secara aktif dikelola oleh tim inti CPYTHON. Ketika versi Python mencapai akhir kehidupan, dukungan untuk versi itu dijatuhkan dari Kedro. Ini tidak dianggap sebagai perubahan yang melanggar.
Paket Kedro Dataset mengikuti kebijakan dukungan versi NEP 29 Python. Ini berarti bahwa kedro-datasets
umumnya menjatuhkan dukungan versi Python sebelum kedro
. Ini karena kedro-datasets
memiliki banyak ketergantungan yang mengikuti NEP 29 dan pendekatan dukungan versi yang lebih konservatif dari kerangka kerja Kedro membuatnya sulit untuk mengelola ketergantungan tersebut dengan benar.
Kami menghargai komunitas kami dan ingin tetap terhubung. Untuk itu, kami menawarkan format obrolan kopi publik di mana kami berbagi pembaruan dan hal -hal keren di sekitar Kedro setiap dua minggu sekali dan memberi Anda waktu untuk mengajukan pertanyaan Anda secara langsung.
Lihatlah topik dan tanggal demo yang akan datang di halaman wiki obrolan kopi Kedro.
Ikuti saluran pengumuman Slack kami untuk melihat pengumuman obrolan kopi Kedro dan rekaman demo akses.