摘要:Spark作為新一代大數(shù)據(jù)計算引擎,因為內(nèi)存計算的特性,具有比hadoop更快的計算速度。這里總結(jié)下對Spark的認識、虛擬機Spark安裝、Spark開發(fā)環(huán)境搭建及編寫第一個scala程序、運行第一個Spark程序。
1.Spark是什么
Spark是一個快速且通用的集群計算平臺
2.Spark的特點
1)Spark是快速的
Spark擴充了流行的Mapreduce計算模型
Spark是基于內(nèi)存的計算
2)Spark是通用的
Spark的設(shè)計容納了其它分布式系統(tǒng)擁有的功能
批處理,迭代式計算,交互查詢和流處理等