安装| 文档 | 支持| 示例 | 如何贡献
oneAPI 数据分析库 (oneDAL) 是一个功能强大的机器学习库,可帮助您加速各个阶段的大数据分析:预处理、转换、分析、建模、验证和决策。
该库实现了经典的机器学习算法。它们的性能提升是通过利用英特尔® 硬件的功能来实现的。
oneDAL 是 UXL 基金会的一部分,是 oneDAL 组件的 oneAPI 规范的实现。
您可以通过多种方式构建利用 oneDAL 优势的高性能数据科学应用程序:
安装前检查系统要求,以确保与您的系统兼容。
有多种选项可用于安装 oneDAL:
二进制分发:您可以从以下来源下载预构建的二进制包:
英特尔® oneAPI:
蟒蛇:
渠道 | 版本 |
---|---|
英特尔 | |
康达锻造公司 |
努格特
源代码分发:您可以从源代码构建库。为此,请从官方 GitHub 存储库下载特定版本的 oneDAL,并按照 INSTALL.md 中的说明进行操作。
C++ 示例:
Python 示例:
oneDAL 文档:
其他相关文档:
oneDAL 库作为 OAP MLlib 项目的一部分用于 Spark MLlib 加速,与默认的 Apache Spark MLlib 相比,性能可提高3-18 倍。
技术细节: FP类型:双;硬件:7 个 m5.2xlarge AWS 实例;软件:英特尔 DAAL 2020 金牌版、Apache Spark 2.4.4、emr-5.27.0; Spark 配置执行器数量 12,执行器核心 8,执行器内存 19GB,任务 CPU 8
oneDAL 支持分布式计算模式,在强缩放和弱缩放方面都显示出优异的结果:
oneDAL K-Means 拟合,缩放效果强 | oneDAL K-Means 拟合,缩放结果较弱 |
---|---|
技术细节: FPType:float32;硬件:Intel Xeon 处理器 E5-2698 v3 @2.3GHz,2 个插槽,每个插槽 16 个内核;软件:英特尔® DAAL (2019.3)、MPI4Py (3.0.0)、英特尔® Python 分发版 (IDP) 3.6.8;详细信息请参阅文章 https://arxiv.org/abs/1909.11822
oneDAL 项目由 UXL 基金会管理,您可以通过多种方式参与该项目。可以参加人工智能特别兴趣小组 (SIG) 会议,该小组讨论并演示使用该项目的工作。成员还可以参加开源和规范工作组会议。
您还可以加入 UXL 基金会的邮件列表,以了解会议何时举行并接收最新信息和讨论。
您可以为本项目做出贡献,也可以为本项目的规范做出贡献,请阅读贡献页面以获取更多信息。
通过以下渠道提出问题并与 oneDAL 开发者、贡献者和其他用户进行讨论:
您可以通过 [email protected] 私下联系项目维护人员。
要报告漏洞,请参阅英特尔漏洞报告政策。
我们欢迎社区贡献。查看我们的贡献指南以了解更多信息。您还可以使用 #onedal 频道通过 UXL Foundation Slack 联系 oneDAL 团队。
oneDAL 根据 Apache License 2.0 许可证分发。请参阅许可证了解更多信息。
oneMKL FPK microlibs 根据英特尔简化软件许可证分发。有关详细信息,请参阅thirdparty-programs-mkl.txt。