RaeV管理员
文章 1946 篇 | 评论 3720 次

作者 Rae 发布的文章

Spark系列(七)Spark技术栈之SparkR

首先我们上一张spark的技术栈框架图结合上面的图,这篇文章我们主要介绍spark的sparkR技术栈。我们知道,在数据分析的场景里面,很多都是使用python或者R语言的,因此基于python和R语言有很多开源库供...

Spark系列(五)Spark技术栈之Spark MLlib

首先我们上一张spark的技术栈框架图结合上面的图,这篇文章我们主要介绍spark的spark mllib技术栈。这是一个在spark之上构建的机器学习库,也就是我们可以利用spark做机器学习,算法实现等应用。在s...

Spark系列(一)Spark是什么?

Apache Spark 是一个用于快速、通用、大规模数据处理的开源项目。它类似于 Hadoop 的 MapReduce,但对于执行批处理来说速度更快、更高效。Apache Spark 可以部署在大量廉价的硬件设备上...