AWSプロフェッショナルサービスオープンソースイニシアチブ| [email protected]
Serverless Data Lake Framework(SDLF)は、AWSでのエンタープライズデータ湖の配信を加速し、展開時間を数ヶ月から数週間に短縮することを目的とした再利用可能なアーティファクトのコレクションです。 AWSチーム、パートナー、顧客が使用して、ベストプラクティスに続いてデータ湖の基礎構造を実装できます。
SDLFをセットアップするときは、最新の安定したリリースを使用することをお勧めします。
SDLF 1.xのユーザーの場合、バージョン1はマスターブランチで引き続き利用できます。 SDLF(2.x)の新しいバージョンの開発がBranch Mainで発生します。ワークショップには、バージョン1のセクションも含まれています。
データ湖は、組織に敏ility性を与えます。消費者が必要なデータを迅速に見つけて、ビジネスプロジェクトで使用できるリポジトリを提供します。ただし、データ湖の構築は複雑です。ファイルのストレージを超えて考えるべきことがたくさんあります。たとえば、保存したものを知るように、データをどのようにカタログ化しますか?どのような摂取パイプラインが必要ですか?データ品質をどのように管理しますか?ソースコントロールの下で変換のコードをどのように保持しますか?開発、テスト、および生産環境をどのように管理しますか?これらのユースケースに対処するソリューションを構築するには、何週間もかかる場合があり、今回はデータで革新し、ビジネス目標を達成するためにもっと適切に費やすことができます。
SDLFは、AWSでのデータレイク実装の旅を加速する生産的に耐えるベストプラクティステンプレートのコレクションであるため、ビジネスに価値を生み出すユースケースに焦点を当てることができます。
会社の名前やロゴをREADMEファイルに含めて、AWS Serverless Data Lake Frameworkを使用していることを示すようにしたい場合は、「SDLFのサポート」問題を提起してください。会社のロゴを表示したい場合は、リンクされたプルリクエストを上げて、ロゴに画像ファイルを提供してください。 SDLFの問題(および関連するプルリクエスト)をサポートすることにより、ここで説明する限られた目的のために会社の名前(およびロゴ)を使用するAWS許可を付与しており、そのような許可を付与する権限があることを確認していることに注意してください。
SDLFをすばやく開始するには、ワークショップに従ってください。
https://sdlf.workshop.aws/