Pachyderm は大規模な場合でもコスト効率が高く、データ エンジニアリング チームがあらゆる種類のデータにわたる高度なデータ変換を使用して複雑なパイプラインを自動化できるようにします。当社の独自のアプローチは、データのバージョン管理とデータリネージの追跡を備えた、言語に依存しないマルチステージのパイプラインの並列処理を提供します。 Pachyderm は、データ用の究極の CI/CD エンジンを提供します。
エンドツーエンドのバージョン管理されたデータ パイプラインのデプロイを開始するには、Pachyderm をローカルで実行するか、約 5 分で AWS/GCE/Azure にデプロイすることもできます。
また、完全なドキュメントを参照してチュートリアルを参照し、サンプル プロジェクトを確認し、Pachyderm の高度な機能について学ぶこともできます。
いくつかの例を見て、Pachyderm の主要な使用例について学びたい場合:
公式ドキュメント
最新情報を入手し、次の方法で Pachyderm のサポートを受けてください。
開始するには、寄稿者ライセンス契約に署名してください。
貢献ガイドもぜひご覧ください。
PR をお送りください。ぜひご活躍をお待ちしております。開始するのに適した場所として、「ヘルプが必要」とラベル付けされた項目について GH の問題を確認することもできます。ラベルを最新の状態に保つことができない場合もありますので、ラベルが表示されない場合はお知らせください。
Pachyderm は、匿名化された使用状況メトリクスを自動的に報告します。これらの指標は、人々が Pachyderm をどのように使用しているかを理解し、それを改善するのに役立ちます。これらは、pachd コンテナーで環境変数METRICS
false
に設定することで無効にできます。