- 軟件大?。?span>287.00M
- 軟件語言:中文
- 軟件類型:國產軟件
- 軟件類別:免費軟件 / 其他行業(yè)
- 更新時間:2021-10-23 11:51
- 運行環(huán)境:WinAll, Win7
- 軟件等級:
- 軟件廠商:
- 官方網站:http://spark.apache.org/
53.78M/中文/10.0
170.00M/中文/10.0
144.69M/中文/10.0
144.69M/中文/10.0
19.52M/中文/10.0
spark大數據分析軟件為你提供了一個全新的平臺,你可以使用該平臺來進行大數據學習、計算等等,支持的行業(yè)也是相當的廣泛。軟件中的內容豐富,而且還有相當多的功能。歡迎下載!
Apache Spark 是一種多語言引擎,用于在單節(jié)點機器或集群上執(zhí)行數據工程、數據科學和機器學習。
1、機器學習
在筆記本電腦上訓練機器學習算法,并使用相同的代碼擴展到由數千臺機器組成的容錯集群。
2、SQL 分析
為儀表板和臨時報告執(zhí)行快速、分布式的 ANSI SQL 查詢。運行速度快于大多數數據倉庫。
3、批處理/流數據
使用您的首選語言:Python、SQL、Scala、Java 或 R,統(tǒng)一批量和實時流式處理數據。
4、大規(guī)模數據科學
對 PB 級數據執(zhí)行探索性數據分析 (EDA),而不必求助于下采樣
1、速度快
基于內存進行計算(當然也有部分計算基于磁盤,比如shuffle)。
2、集成Hadoop
并不是要成為一個大數據領域的“獨裁者”,一個人霸占大數據領域所有的“地盤”,而是與Hadoop進行了高度的集成,兩者可以完美的配合使用。Hadoop的HDFS、Hive、HBase負責存儲,YARN負責資源調度;復雜大數據計算。實際上,Hadoop+的組合,是一種“double win”的組合。
3、極高的活躍度
目前是Apache基金會的頂級項目,全世界有大量的優(yōu)秀工程師是的committer。并且世界上很多頂級的IT公司都在大規(guī)模地使用。
4、容易上手開發(fā)
的基于RDD的計算模型,比Hadoop的基于Map-Reduce的計算模型要更加易于理解,更加易于上手開發(fā),實現(xiàn)各種復雜功能,比如二次排序、topn等復雜操作時,更加便捷。
5、超強的通用性
提供了 RDD、SQL、Streaming、MLlib、GraphX等技術組件,可以一站式地完成大數據領域的離線批處理、交互式查詢、流式計算、機器學習、圖計算等常見的任務。
請描述您所遇到的錯誤,我們將盡快予以修正,謝謝!
*必填項,請輸入內容