spark下載 - spark源代碼下載

spark

其他源碼

1.0.0

下載

Apache Spark

Spark是用於大規模數據處理的統一分析引擎。它在Scala，Java，Python和R中提供高級API，以及支持用於數據分析的一般計算圖的優化引擎。它還支持一組豐富的高級工具集，包括用於SQL的SPARK SQL和DataFrames，Pandas api in Spark for Pandas工作負載，用於機器學習的MLLIB，用於圖形處理的GraphX以及用於流處理的結構化流媒體。

官方版本：https：//spark.apache.org/
開發版本：https：//apache.github.io/spark/

在線文檔

您可以在項目網頁上找到最新的Spark文檔，包括編程指南。此讀數文件僅包含基本的設置指令。

建築火花

Spark是使用Apache Maven構建的。要構建Spark及其示例程序，請運行：

./build/mvn -DskipTests clean package

（如果您下載了預製套件，則無需執行此操作。）

在“建築Spark”的項目網站上可以找到更詳細的文檔。

有關一般開發技巧，包括使用IDE開發Spark的信息，請參閱“有用的開發人員工具”。

交互式scala殼

開始使用Spark的最簡單方法是通過Scala shell：

./bin/spark-shell

嘗試以下命令，該命令應返回1,000,000,000：

scala > spark.range( 1000 * 1000 * 1000 ).count()

交互式python殼

另外，如果您喜歡Python，則可以使用Python Shell：

./bin/pyspark

並運行以下命令，該命令還應返回1,000,000,000：

 >> > spark . range ( 1000 * 1000 * 1000 ). count ()

示例程序

SPARK還帶有examples目錄中的幾個示例程序。要運行其中一個，請使用./bin/run-example <class> [params] 。例如：

./bin/run-example SparkPi

將在本地運行PI示例。

在運行示例時，您可以將主環境變量設置為群集。這可以是火花：// URL，“紗”可以在紗線上運行，而“本地”可以用一個線程在本地運行，或者“ local [n]”以N線程在本地運行。如果類在examples軟件包中，您也可以使用縮寫的類名稱。例如：

MASTER=spark://host:7077 ./bin/run-example SparkPi

如果沒有給出參數，則許多示例程序打印使用情況有所幫助。

運行測試

測試首先需要建造火花。一旦建立了火花，就可以使用：

./dev/run-tests

請查看有關如何運行模塊測試或單個測試的指南。

還有一個Kubernetes集成測試，請參閱資源經理/Kubernetes/Integration-Tests/readme.md

關於Hadoop版本的註釋

Spark使用Hadoop Core庫與HDFS和其他Hadoop支持的存儲系統進行對話。由於協議在不同版本的Hadoop中發生了變化，因此您必須針對群集運行的相同版本構建火花。

請通過“指定Hadoop版本並啟用紗線”的構建文檔，以獲取有關Hadoop特定分佈的詳細指南，包括為特定的Hive和Hive Thriftserver分佈構建。

配置

請參閱在線文檔中的配置指南，以獲取有關如何配置Spark的概述。

貢獻

請查看有關Spark指南的貢獻，以獲取有關如何開始為該項目做出貢獻的信息。

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2025-02-18
大小 59.58MB
來自於 Github

相關應用

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
waymo open dataset

其他源碼

December 2023 Update
SmartTube

其他源碼

24.71 Stable
Sunamu

其他源碼

Release 2.2.0
waymo open dataset

其他源碼

December 2023 Update
wp functions

其他類別

1.0.0
termwind

其他類別

v2.3.0

相關資訊全部

spark

Apache Spark

在線文檔

建築火花

交互式scala殼

交互式python殼

示例程序

運行測試

關於Hadoop版本的註釋

配置

貢獻

spark數位藏品app

火花光纖

變形金剛：黑暗火花崛起

chat.petals.dev

GPT Prompt Templates

GPTyped

waymo open dataset

SmartTube

Sunamu

waymo open dataset

wp functions

termwind