简单来说,集算器SPL是一门有趣的编程语言,也是一个强大的数据计算中间件,同时也可以作为一个高效的数据仓库:从三个方面了解SPL。
与基于文本的编程语言不同,SPL 在网格中编写代码:可以在网格中的编程语言编码中找到更多信息; SPL作为数据计算引擎,能够以更低的成本产生高效率:集算器SPL,一款降低应用成本N倍的数据分析引擎。
集算器SPL是一个基于JVM的数据计算类库:SPL: The Open-source Java Library to Process Structured Data。它比其他基于 JVM 的数据处理语言(如 Kotlin 和 Scala)拥有更多更好的功能: JVM 上数据处理语言的竞争:Kotlin、Scala 和 SPL。它可以在没有数据库的情况下执行SQL式计算:开源SPL,可以在没有RDB的情况下执行SQL,提供多源混合计算能力:哪种工具最适合多源混合计算,并支持对文件直接计算:计算开放格式文件和 WEB 上的引擎:WEB 上的计算引擎。特别是,集算器SPL使微服务更加灵活:开源SPL让微服务更“微”,方便报表查询的数据准备处理:开源SPL优化报表应用,应对无尽的报表开发需求。集算器还可以嵌入到应用程序中,作为内置数据库:集算器SPL,SQLite的挑战者。
集算器SPL丰富了中间件的概念:DCM:中间件家族的新成员。
作为数据仓库时,集算器SPL不采用基于关系代数的SQL语法。它发明了一种称为离散数据集的代数系统:SPL:一种易于编写和快速运行的数据库语言(文档:离散数据集论文)来解决难以编写复杂 SQL 的问题(为什么 SQL 语句通常包含数百行,以KB为单位?)。
SPL可以方便地实现高性能算法,从而获得比传统关系型数据仓库高得多的计算性能:数量级的性能提升是如何发生的。在 SPL 性能测试中查找测试报告。通过创造性的算法,可以最大限度地利用硬件资源。根据很多实际实例,集算器在单机上可以达到甚至超过分布式数据库的性能。
作为数据仓库,集算器抛弃了“房子”的概念,打破了传统数据库的封闭性,打造了一个开放的计算系统:“无房子”的数据仓库比有“房子”的数据仓库性能更好,符合条件以更低的资源成本和更轻的框架取代大多数 MPP 数据仓库:有了轻量级 SPL,MPP 的必要性有多大? 。
这本书:SPL 编程是学习 SPL 语法的良好开端。本书适合没有任何编程经验的初学者。如果你是老手,请快速浏览一遍,但 4.4 节中解释的对象理解值得学习。第五章也很重要。它解释了SPL面向集合的思维方式,这与其他语言有很大不同。但是一旦理解并掌握了 SPL,您就可以编写优雅的代码。第 8-10 章是 SPL 学习的主要内容。它从与 SQL 不同的角度看待结构化数据计算。即使对于专业程序员来说,这也很重要!从SPL的角度来看,由于世界是复杂的,SQL在理解结构化数据方面有点简单。你在各种数据库课程中获得的知识还不够广泛和深刻!你需要复习和温习!
在这篇文章中查找基本的 SPL 概念:初学者的 SPL 概念。对于初学者,您可以在初学者的 SPL 操作中找到 SPL 的特征基本计算。有经验的程序员可以很快理解SPL和SQL之间的差异。软件架构师通过阅读集算器架构问答,可以了解SPL与传统数据库的区别。
在 SPL 学习材料中查找全面的 SPL 文档。一般来说,应用程序员可以从数据库连接开始处理基本操作: SPL:连接数据库和数据库读/写 SPL:读写数据库数据或文件访问和计算 SPL:读写结构化文本文件。然后您可以学习如何在 Java 应用程序中集成 SPL 如何在 Java 中调用 SPL 脚本。这些构成了一个简单的学习循环。
高性能计算相对困难,但是有一本关于算法的系统书籍:性能优化。性能优化算法并不是 SPL 所独有的。学习这些算法后,您可以使用其他编程语言(SQL除外)实现高性能计算。关键在于算法而不是语法。然而,您需要很好地掌握 SPL 概念和语法,才能更好地理解算法。
上面的SPL学习帖子还包含性能优化算法的应用。
存储是高性能计算的基石。下面这篇文章为初学者介绍了SPL中常用的专有存储模式:初学者如何使用SPL存储。通常,性能优化的第一步是设计合适的存储架构。
欢迎您将您在尝试实现高性能计算时遇到的麻烦和问题发表出来,与我们一起讨论寻找解决方案:诚征!查询和批处理作业速度慢得难以忍受。
集算器采用Apache 2.0许可。有关详细信息,请参阅许可证文件。