RaeV管理员
文章 1948 篇 | 评论 3725 次

作者 Rae 发布的文章

Spark系列(九)Spark应用程序介绍

在spark的开发中,我们一般会开发对应的应用程序,这里我们一般把他称为是一个application或者job。一个应用程序里面包含自己当前应用程序所需要操作的所有逻辑。在应用程序开发完毕之后,我们需要把这个应用程序...

Spark系列(七)Spark技术栈之SparkR

首先我们上一张spark的技术栈框架图结合上面的图,这篇文章我们主要介绍spark的sparkR技术栈。我们知道,在数据分析的场景里面,很多都是使用python或者R语言的,因此基于python和R语言有很多开源库供...

Spark系列(五)Spark技术栈之Spark MLlib

首先我们上一张spark的技术栈框架图结合上面的图,这篇文章我们主要介绍spark的spark mllib技术栈。这是一个在spark之上构建的机器学习库,也就是我们可以利用spark做机器学习,算法实现等应用。在s...

Spark系列(一)Spark是什么?

Apache Spark 是一个用于快速、通用、大规模数据处理的开源项目。它类似于 Hadoop 的 MapReduce,但对于执行批处理来说速度更快、更高效。Apache Spark 可以部署在大量廉价的硬件设备上...