KEDRO-это набор инструментов для готовой к производству науки о данных. Он использует лучшие практики разработки программного обеспечения, чтобы помочь вам создать разработку данных и конвейеры по науке о данных, которые воспроизводимы, поддерживаемые и модульные. Вы можете узнать больше на kedro.org.
KEDRO-это рамка Python с открытым исходным кодом, размещенную Foundation LF AI & Data Foundation.
Для установки KEDro из запуска индекса пакетов Python (PYPI):
pip install kedro
Также можно установить Kedro с помощью conda
:
conda install -c conda-forge kedro
Наше руководство по началу работы содержит полные инструкции по установке и включает в себя, как настроить виртуальные среды Python.
Чтобы получить доступ к последней версии KEDRO до его официального выпуска, установите ее из main
филиала.
pip install git+https://github.com/kedro-org/kedro@main
Особенность | Что это? |
---|---|
Шаблон проекта | Стандартный, модифицируемый и простой в использовании шаблон проекта на основе науки о данных CookieCutter. |
Каталог данных | Серия легких разъемов данных, используемых для сохранения и загрузки данных во многих различных форматах файлов и файловых систем, включая локальные и сетевые файловые системы, хранилища облачных объектов и HDF. Каталог данных также включает в себя управление данными и модельными версиями для систем на основе файлов. |
Абстракция трубопровода | Автоматическое разрешение зависимостей между функциями Pure Python и визуализацией конвейера данных с использованием Kedro-Viz. |
Стандарты кодирования | Разработка тестирования с использованием pytest , создайте хорошо документированный код с использованием SPHINX, создайте изготовленный код с поддержкой ruff и используйте стандартную библиотеку журналов Python. |
Гибкое развертывание | Стратегии развертывания, которые включают в себя развертывание однократного или распределенного машины, а также дополнительную поддержку для развертывания на ARGO, префект, Kubeflow, AWS Parath и Databricks. |
Документация KEDRO сначала объясняет, как установить KEDRO, а затем вводит ключевые концепции KEDRO.
Затем вы можете просмотреть учебник Spaceflights, чтобы создать проект KEDro для практического опыта.
Для новых и промежуточных пользователей KEDRO есть комплексный раздел о том, как визуализировать проекты KEDro с использованием Kedro-Viz.
Визуализация трубопровода, генерируемая с использованием kedro-viz
Дополнительная документация объясняет, как работать с ноутбуками KEDRO и Jupyter, и существует набор передовых руководств по пользователям для Advanced для ключевых функций Kedro. Мы также рекомендуем справочную документацию API для получения дополнительной информации.
Кедро основан на нашей коллективной лучшей практике (и ошибках), пытаясь предоставить реальные приложения ML, которые имеют огромное количество необработанных данных. Мы разработали Kedro для достижения следующего:
Чтобы учесть основные недостатки ноутбуков Юпитера, одноразовых сценариев и клея
Для улучшения сотрудничества команды , когда разные члены команды имеют разное количество концепций разработки программного обеспечения
Для повышения эффективности, потому что прикладные концепции, такие как модульность и разделение проблем, вдохновляют создание многоразового кода аналитики
Узнайте больше о том, как Kedro может ответить на ваши варианты использования из часто задаваемых вопросов на веб -сайте Kedro.
Команда продукта KEDRO и ряд участников с открытым исходным кодом со всего мира поддерживают KEDRO.
Да! Мы приветствуем всевозможные вклады. Проверьте наше руководство по участию в KEDRO.
Вокруг Кедро растет сообщество. Мы рекомендуем вам задать и ответить на технические вопросы по Slack и добавить в закладки архив льняного белья прошлых дискуссий.
Мы храним список технических часто задаваемых вопросов в документации KEDRO, и вы можете найти растущий список сообщений в блоге, видео и проектов, которые используют Kedro Over в репозитории awesome-kedro
GitHub. Если вы создали что -нибудь с Kedro, мы хотели бы включить его в список. Просто сделай пиар, чтобы добавить его!
Если вы академик, Kedro также может помочь вам, например, в качестве инструмента для решения проблемы воспроизводимых исследований. Используйте кнопку «Цитировать этот репозиторий» в нашем репозитории, чтобы сгенерировать цитату из файла citation.cff.
Основная структура KEDRO поддерживает все версии Python, которые активно поддерживаются основной командой CPYTHON. Когда версия Python достигает конца жизни, поддержка этой версии отбрасывается из Kedro. Это не считается нарушением.
Пакет наборов данных KEDRO выполняет политику поддержки версии NEP 29 Python. Это означает, что kedro-datasets
обычно отбрасывает поддержку версии Python до kedro
. Это связано с тем, что kedro-datasets
имеет много зависимостей, которые следуют за NEP 29, и более консервативный подход поддержки версий Kedro Framework затрудняет правильное управление этими зависимостями.
Мы ценим наше сообщество и хотим оставаться на связи. Для этого мы предлагаем общедоступный формат кофейного чата, где мы делимся обновлениями и крутыми вещами вокруг Кедро раз в две недели и даем вам время, чтобы задать ваши вопросы вживую.
Проверьте предстоящие демонстрационные темы и даты на странице Wiki Coffe Chate Kedro.
Следуйте нашему каналу объявления Slack, чтобы увидеть объявления Kedro Coffee Chat и доступ к демонстрационным записям.