Pachyderm은 규모 면에서 비용 효율적이므로 데이터 엔지니어링 팀이 모든 유형의 데이터에 걸쳐 정교한 데이터 변환을 통해 복잡한 파이프라인을 자동화할 수 있습니다. 우리의 고유한 접근 방식은 데이터 버전 관리 및 데이터 계보 추적을 통해 다단계, 언어에 구애받지 않는 파이프라인의 병렬 처리를 제공합니다. Pachyderm은 데이터를 위한 최고의 CI/CD 엔진을 제공합니다.
엔드 투 엔드 버전 제어 데이터 파이프라인 배포를 시작하려면 Pachyderm을 로컬로 실행하거나 약 5분 안에 AWS/GCE/Azure에 배포할 수도 있습니다.
또한 전체 문서를 참조하여 튜토리얼을 보고, 예제 프로젝트를 확인하고, Pachyderm의 고급 기능에 대해 알아볼 수도 있습니다.
몇 가지 예를 보고 Pachyderm의 핵심 사용 사례에 대해 알아보려면 다음을 수행하세요.
공식 문서
다음을 통해 최신 상태를 유지하고 Pachyderm 지원을 받으세요.
시작하려면 기여자 라이센스 계약에 서명하세요.
기여 가이드도 확인해 보세요.
우리에게 PR을 보내주세요. 우리는 당신이 무엇을 하는지 보고 싶습니다! 시작하기 좋은 곳으로 "도움 요청"이라고 표시된 항목에 대한 GH 문제를 확인할 수도 있습니다. 때때로 해당 라벨을 최신 상태로 유지하는 것이 좋지 않을 수 있으므로 라벨이 표시되지 않으면 알려주시기 바랍니다.
Pachyderm은 익명화된 사용 측정항목을 자동으로 보고합니다. 이러한 지표는 사람들이 Pachyderm을 어떻게 사용하고 있는지 이해하고 개선하는 데 도움이 됩니다. pachd 컨테이너에서 환경 변수 METRICS
false
로 설정하여 비활성화할 수 있습니다.