前面我们已经把数据源的元数据给摄入进来了,此时我们修改下users表,给users表添加注释并且添加两个字段,分别是:sex和school_id,示例图如下:
同样的我们给school表添加上注释,示例图如下:
我们在datahub上配置的元数据同步时间是每一分钟,所以我们稍微等1分钟,然后去datahub的实体里面查看对应的实体,示例图如下:
可以看到这里的datahub已经自动把我们的新增字段和注释同步过来了。
既然是数据治理,那么我们进入到datahub的Govern模块里面:
可以看到这里有两个选项,分别是:
1、Glossary(术语) 2、Domains(名称空间,这个本来是域名的意思,我把他理解成名称空间,相当于可以把不同的库表关联到同一个名称空间里面,形成一套业务)
首先我们进入到Glossary里面。示例图如下:
这里的术语我们在前面介绍过,就是各个库表共同建立的商业术语。例如:我们在a数据源里面有sex这个字段,1代表男,2代表女,同时在b数据源里面也有sex这个字段,1代表男,2代表女,此时这个sex的值就是对应的商业术语。
所以这里我们创建一个名称为性别的商业术语,示例如下:
1)点击这里的Add Term Group
这里我们创建一个user的group,代表的是人,后面我们在名称为user的group下创建人对应的商业术语。
创建完成之后,左侧列表就会出现一个名称为user的文件夹,示例图如下:
2)创建性别商业术语
接着我们在名称为user的group下创建性别的商业术语,点击Add Term:
创建完成后,我们就可以看到性别这个商业术语:
定义好了商业术语之后,我们就可以去实体里面进行商业术语的关联了,我们进入到刚才的users实体里面去,找到对应的字段,添加刚才的词汇即可:
然后我们把刚才的性别商业术语给关联上,就可以看到users这个entity的sex字段有性别的标记了,此时我们回到商业术语里面,找到刚才的性别,就可以看到关联的Entities里面有关联的表了,示例图如下:
这里我们在多个实体里面关联某个商业术语,这个列表就会展示关联的所有实体。
当然在商业术语里面还有关联词汇,也就是某个商业术语包含哪些商业术语,或者某个商业术语是某个商业术语的子集,也就是商业术语的继承和包含的关系,在这里都可以设置,如下图:
以上就是DataHub数据治理之商业术语的案例
还没有评论,来说两句吧...