Kedro는 생산 준비 데이터 과학을위한 도구 상자입니다. 소프트웨어 엔지니어링 모범 사례를 사용하여 재현 가능하고 유지 관리 가능하며 모듈 식 데이터 엔지니어링 및 데이터 과학 파이프 라인을 만들 수 있습니다. kedro.org에서 자세한 내용을 확인할 수 있습니다.
Kedro는 LF AI & Data Foundation에서 주최하는 오픈 소스 파이썬 프레임 워크입니다.
Python 패키지 인덱스 (PYPI) 실행에서 Kedro를 설치하려면 :
pip install kedro
conda
사용하여 Kedro를 설치할 수도 있습니다.
conda install -c conda-forge kedro
우리의 시작 가이드에는 전체 설치 지침이 포함되어 있으며 Python 가상 환경을 설정하는 방법이 포함되어 있습니다.
공식 릴리스 전에 최신 Kedro 버전에 액세스하려면 main
브랜치에서 설치하십시오.
pip install git+https://github.com/kedro-org/kedro@main
특징 | 이게 뭔가요? |
---|---|
프로젝트 템플릿 | CookieCutter 데이터 과학을 기반으로 한 표준적이고 수정 가능하며 사용하기 쉬운 프로젝트 템플릿. |
데이터 카탈로그 | 로컬 및 네트워크 파일 시스템, 클라우드 객체 저장 및 HDF를 포함하여 다양한 파일 형식 및 파일 시스템에서 데이터를 저장하고로드하는 데 사용되는 일련의 경량 데이터 커넥터. 데이터 카탈로그에는 파일 기반 시스템에 대한 데이터 및 모델 버전도 포함됩니다. |
파이프 라인 추상화 | Kedro-Viz를 사용한 순수한 파이썬 기능과 데이터 파이프 라인 시각화 간의 종속성의 자동 해상도. |
코딩 표준 | pytest 사용한 테스트 중심 개발, Sphinx를 사용하여 잘 문서화 된 코드를 생성하고 ruff 지원하여 보풀 코드를 작성하고 표준 Python Logging Library를 사용합니다. |
유연한 배포 | 단일 또는 분산 대기업 배포와 ARGO, PREFECT, KUBEFLOW, AWS BATCH 및 DATABRICKS에 배치에 대한 추가 지원을 포함하는 배포 전략. |
Kedro 문서는 먼저 Kedro를 설치하는 방법을 설명하고 주요 Kedro 개념을 소개합니다.
그런 다음 SpaceFlights 튜토리얼을 검토하여 실습 경험을위한 Kedro 프로젝트를 구축 할 수 있습니다.
신규 및 중급 Kedro 사용자의 경우 Kedro-Viz를 사용하여 Kedro 프로젝트를 시각화하는 방법에 대한 포괄적 인 섹션이 있습니다.
Kedro-Viz를 사용하여 생성 된 파이프 라인 시각화
추가 문서는 Kedro 및 Jupyter Notebooks와 함께 작업하는 방법을 설명하며 주요 Kedro 기능을위한 고급 사용자 가이드 세트가 있습니다. 자세한 내용은 API 참조 문서도 권장합니다.
Kedro는 방대한 양의 원시 미확인 데이터를 가진 실제 ML 애플리케이션을 제공하려는 집단 모범 사례 (및 실수)를 기반으로합니다. 우리는 다음을 달성하기 위해 Kedro를 개발했습니다.
관리 가능한 데이터 과학 코드 작성에 중점을두기 때문에 Jupyter 노트북, 일회성 스크립트 및 접착제 코드의 주요 단점을 해결합니다.
다른 팀원이 소프트웨어 엔지니어링 개념에 대한 노출이 다양 할 때 팀 협업을 향상시키기 위해
효율성을 높이기 위해, 모듈성 및 우려 분리와 같은 적용된 개념은 재사용 가능한 분석 코드 의 생성에 영감을줍니다.
Kedro가 Kedro 웹 사이트의 제품 FAQ에서 사용 사례에 어떻게 대답 할 수 있는지 자세히 알아보십시오.
Kedro Product 팀과 전 세계의 많은 오픈 소스 기고자들이 Kedro를 유지합니다.
예! 우리는 모든 종류의 기여를 환영합니다. Kedro에 기여한 가이드를 확인하십시오.
Kedro 주변에는 성장하는 커뮤니티가 있습니다. Slack에 대한 기술적 질문을하고 과거 토론의 Linen Archive를 북마크하는 것이 좋습니다.
우리는 Kedro 문서에 기술 FAQ 목록을 보관하며 awesome-kedro
Github 리포지토리에서 Kedro를 사용하는 블로그 게시물, 비디오 및 프로젝트 목록을 찾을 수 있습니다. Kedro로 무엇이든 만든 경우 목록에 포함시키고 싶습니다. 그것을 추가하기 위해 PR을 만드십시오!
학업 인 경우 Kedro는 예를 들어 재현 가능한 연구 문제를 해결하는 도구로 도와 줄 수 있습니다. 저장소에서 "이 저장소 인용"버튼을 사용하여 Citation.cff 파일에서 인용을 생성하십시오.
Core Kedro Framework는 Cpython Core 팀이 적극적으로 유지 관리하는 모든 Python 버전을 지원합니다. 파이썬 버전이 수명의 끝에 도달하면 해당 버전에 대한 지원이 Kedro에서 삭제됩니다. 이것은 깨진 변화로 간주되지 않습니다.
Kedro DataSets 패키지는 NEP 29 Python 버전 지원 정책을 따릅니다. 이는 kedro-datasets
일반적으로 kedro
전에 Python 버전 지원을 삭제한다는 것을 의미합니다. 이는 kedro-datasets
NEP 29를 따르는 많은 의존성을 가지고 있으며 Kedro 프레임 워크의 보수적 인 버전 지원 접근 방식으로 인해 이러한 종속성을 올바르게 관리하기가 어렵 기 때문입니다.
우리는 지역 사회에 감사하고 연결을 유지하고 싶습니다. 이를 위해, 우리는 2 주마다 한 번씩 Kedro 주변의 업데이트와 멋진 물건을 공유하고 질문을 생생하게 요청할 시간을 제공하는 공개 커피 채팅 형식을 제공합니다.
Kedro Coffee Chat Wiki 페이지에서 다가오는 데모 주제와 날짜를 확인하십시오.
Slack Coffee Chat 공지 및 액세스 데모 녹음을 확인하려면 슬랙 공지 채널을 참조하십시오.