数据仓库中做模型设计的时候需要注意哪些?

提问者:帅平 问题分类:大数据
数据仓库中做模型设计的时候需要注意哪些?
3 个回答
美到拖网速
美到拖网速
需要注意以下几点:
1、高内聚和低耦合
将业务相近或者相关的数据、粒度相同数据设计为一个逻辑或者物理模型;将高概率同时访问的数据放一起,将低概率同时访问的数据分开存储。
2、核心模型和扩展模型要分离
建立核心模型与扩展模型体系,核心模型包括的字段支持常用核心的业务,扩展模型包括的字段支持个性化或是少量应用的需要。在必须让核心模型与扩展模型做关联时,不能让扩展字段过度侵入核心模型,以免破坏了核心模型的架构简洁性与可维护性。
3、公共处理逻辑下沉及单一
底层公用的处理逻辑应该在数据调度依赖的底层进行封装与实现,不要让公用的处理逻辑暴露给应用层实现,不要让公共逻辑在多处同时存在。
4、成本与性能平衡
适当的数据冗余可换取查询和刷新性能,不宜过度冗余与数据复制。
5、数据可回滚
处理逻辑不变,在不同时间多次运行数据结果确定不变。
6、一致性
相同的字段在不同表中的字段名必须相同。
7、命名清晰可理解
表命名规范需清晰、一致,表命名需易于下游的理解和使用。
8、其他
一个模型无法满足所有的需求。需合理选择数据模型的建模方式。通常,设计顺序依次为:概念模型->逻辑模型->物理模型。
发布于:4周前 (06-24) IP属地:
我来回答