全部面试刷题微服务数据库消息队列搜索引擎大数据运维 go语言人工智能

数据仓库中做模型设计的时候需要注意哪些？

提问者：帅平问题分类：大数据

数据仓库

发布于：2年前 (2024-06-24) IP属地：

3 个回答

美到拖网速

需要注意以下几点：
1、高内聚和低耦合

将业务相近或者相关的数据、粒度相同数据设计为一个逻辑或者物理模型；将高概率同时访问的数据放一起，将低概率同时访问的数据分开存储。

2、核心模型和扩展模型要分离

建立核心模型与扩展模型体系，核心模型包括的字段支持常用核心的业务，扩展模型包括的字段支持个性化或是少量应用的需要。在必须让核心模型与扩展模型做关联时，不能让扩展字段过度侵入核心模型，以免破坏了核心模型的架构简洁性与可维护性。

3、公共处理逻辑下沉及单一

底层公用的处理逻辑应该在数据调度依赖的底层进行封装与实现，不要让公用的处理逻辑暴露给应用层实现，不要让公共逻辑在多处同时存在。

4、成本与性能平衡

适当的数据冗余可换取查询和刷新性能，不宜过度冗余与数据复制。

5、数据可回滚

处理逻辑不变，在不同时间多次运行数据结果确定不变。

6、一致性

相同的字段在不同表中的字段名必须相同。

7、命名清晰可理解

表命名规范需清晰、一致，表命名需易于下游的理解和使用。

8、其他

一个模型无法满足所有的需求。需合理选择数据模型的建模方式。通常，设计顺序依次为：概念模型->逻辑模型->物理模型。

发布于：2年前 (2024-06-24) IP属地：

我来回答