首先我们上一张spark的技术栈框架图
结合上面的图,这篇文章我们主要介绍spark的spark Graphx技术栈。
在spark中Spark Graphx是spark提供的一个图计算框架,他是一种嵌入式的图处理API,它的主要原理也还是使用算法,例如:PageRank,k-core,三角技术,LDA,链接组建,最短路径等等。
我们会在后面详细的列举这个图计算框架。
备注:
1、图计算一般应用于一些关系网络,例如我们常见的社交网络分析等业务常见
2、图计算目前也在逐步使用DataFrame的数据结构。
3、图计算这块是做大数据开发业务中经常会涉及到的,所以这内容也比较重要。
还没有评论,来说两句吧...