DataHub开源数据治理实战(九)DataHub数据治理之构建血缘关系 到这里介绍到重点了,数据治理比较重要的点就有血缘关系的构建,同时会带有Graph图。方便我们了解哪些实体与哪些实体有关联,并且这些关联关系的有向图是什么样子的。在网上大多介绍DataHub都是使用代码的方式来构建实体... Rae数据仓库系列2024-02-18617 阅读0 评论
DataHub开源数据治理实战(八)DataHub数据治理之名称空间 上文《DataHub开源数据治理实战(七)DataHub数据治理之商业术语》我们介绍了DataHub的商业术语(也叫共享词汇)。这里的话我们介绍名称空间,也就是Domain。这里的domain的话其实主要是根据实际的... Rae数据仓库系列2024-02-18596 阅读0 评论
DataHub开源数据治理实战(七)DataHub数据治理之商业术语 前面我们已经把数据源的元数据给摄入进来了,此时我们修改下users表,给users表添加注释并且添加两个字段,分别是:sex和school_id,示例图如下:同样的我们给school表添加上注释,示例图如下:我们在d... Rae数据仓库系列2024-02-18493 阅读0 评论
DataHub开源数据治理实战(六)DataHub数据分析 前面我们介绍了DataHub上的元数据摄入,这里的话我们来看看Datahub上的Analytics图表。示例图如下:这里的Analytics图表主要是统计用户行为的。这里的用户是指datahub上的用户,也就是比如一... Rae数据仓库系列2024-02-18613 阅读0 评论
DataHub开源数据治理实战(五)DataHub元数据摄入之yaml操作 上文《DataHub开源数据治理实战(四)DataHub元数据摄入之可视化操作》我们介绍了直接在datahub的dashboard可视化操作元数据的摄入,这里我们再介绍一种元数据摄入的方式,即使用yaml的方式进行元... Rae数据仓库系列2024-02-18614 阅读0 评论
DataHub开源数据治理实战(四)DataHub元数据摄入之可视化操作 这里我们开始介绍DataHub的主要功能之元数据摄入,这里的元数据摄入有两种方式,分别是:1、通过dashboard可视化的设置元数据摄入基础信息。2、通过yaml文件的形式创建元数据摄入基础信息。本文我们主要演... Rae数据仓库系列2024-02-18512 阅读0 评论
DataHub开源数据治理实战(三)DataHub dashboard介绍 上文《DataHub开源数据治理实战(二)DataHub安装部署》我们使用quickstart的方式快速的部署了一个Datahub。最后我们可以看到可视化的dashboard。本文我们对dashboard进行一下简单... Rae数据仓库系列2024-02-18630 阅读0 评论
DataHub开源数据治理实战(二)DataHub安装部署 本文我们介绍下DataHub的安装部署。对于DataHub来说,安装部署非常简单,直接使用docker即可,所以这里我们部署DataHub之前需要准备必要的环境:1、python32、docker3、dock... Rae数据仓库系列2024-02-18940 阅读0 评论
DataHub开源数据治理实战(一)DataHub介绍 在之前我们介绍了atlas的血缘关系,详见《Apache Atlas血缘关系实战》。由于服务器配置比较低,无法演示,所以Atlas相关的系列没有写完,在实际的业务中,其实我们也没有使用atlas,主要的原因是:1、比... Rae数据仓库系列2024-02-18640 阅读0 评论