aws serverless data lake framework
1.0.0
AWS专业服务开源计划| [email protected]
无服务器数据湖框架(SDLF)是可重复使用的工件的集合,旨在加速AWS上的企业数据湖泊的交付,从而将生产时间的部署时间从几个月缩短到几周。 AWS团队,合作伙伴和客户可以使用它来实施最佳实践的数据湖的基础结构。
设置SDLF时,建议使用最新的稳定版本。
对于SDLF 1.x的用户,版本1仍在主分支上可用。 SDLF(2.x)的较新版本发生在分支主机上。该研讨会仍然包含版本1的部分。
数据湖使您的组织敏捷性。它提供了一个存储库,消费者可以快速找到所需的数据并将其用于其业务项目。但是,建造数据湖可能很复杂。除了文件存储之外,还有很多事情要考虑。例如,您如何分类数据,以便知道自己存储的内容?您需要什么摄入管道?您如何管理数据质量?如何将代码保留在源控制下的转换?您如何管理开发,测试和生产环境?构建解决这些用例的解决方案可能需要数周的时间,这次可以更好地利用数据并实现业务目标。
SDLF是一系列生产硬化,最佳实践模板,可加速您对AWS的数据湖实施旅程,因此您可以专注于为业务产生价值的用例。
如果您希望我们将您公司的姓名和/或徽标包括在README文件中,以表明您的公司正在使用AWS无服务器数据湖框架,请提出“支持SDLF”问题。如果您希望我们显示公司的徽标,请提出一个链接的拉请请求,以提供徽标的图像文件。请注意,通过提出支持SDLF问题(以及相关的拉请请求),您可以授予AWS许可使用公司的姓名(和徽标)作为此处描述的有限目的,并且您确认您有权授予此类许可。
要快速开始使用SDLF,请关注我们的研讨会:
https://sdlf.workshop.aws/