最近在工作中会涉及到相关的知识图谱的内容。所以记录下这个系列相关的情况。
对于知识图谱来说,他主要是一张关系网络图。在如今的大数据相关行业,数据越来越多,单独的数据不能再成为数据孤岛了,所以企业对于数据来说,我们需要充分的把这些数据关联起来,进一步的挖掘数据的价值。我所经历的几个大数据需求阶段主要如下:
1、如果把各个数据源的数据采集起来。 2、如何把各个数据源的数据整合在一起,做一些类似统计等需求,满足基本的BI需求。 3、如何把这些数据源的数据进行分类。 4、如何把这些数据源的数据分类好了之后串联起来。 5、如果在大海里找到A数据与B数据的关联。 6、如何把通过A,B数据推导出C数据。
上面条目中1-2是以前大数据的主要使用方向,这也是目前大部分小企业会涉及到的,由于企业规模小,开发人员少,但是产品呈井喷式发展,所以积累的数据越来越多,就需要使用一些大数据相关的框架来处理这些数据,包括不仅限于:数据采集,数据清洗,数据存储,离线ETL,在线ETL,BI报表等。
现如今如果涉及到应用场景的话,特别是一些toC或者toG的场景,一般对于这种大数据场景来说,追求的方向主要就是人工智能了。所以就目前来说,大家看相关的一些招聘岗位来说,趋势都是AI相关的。
与AI相关的趋近的技术,目前我的了解主要就是知识图谱。目前涉及到知识图谱相关的技术非常多,例如neo4j,openspg等。这里我们暂时整理出neo4j系列供大家学习。后续有需要的话再整理openspg的相关内容。
Neo4j主要是一个图数据库,对他的理解,我们可以看作是一个空间数据库,在这个空间里面,主要由一些实体(可以看作是java的pojo类)及实体之间的关系组成。然后这些关系我们最后可以使用空间关系网络图标来进行展示,形如:
知识图谱其实也是和上图是一模一样的。所以对于初学者来说,学习neo4j也就是踏进了知识图谱的大门,学好了neo4j,也算半只脚踏进了目前的AI领域了。
还没有评论,来说两句吧...