什么样的数仓模型可以被称之为一个良好的数据模型?

提问者:帅平 问题分类:面试刷题
什么样的数仓模型可以被称之为一个良好的数据模型?
5 个回答
你我这辈子最的依靠
你我这辈子最的依靠
高效性:
1、表模型可以覆盖绝大多数指标,可以做到dws和ads指标直取
2、尽可能的去避免重复计算
发布于:1个月前 (02-08) IP属地:四川省
你我这辈子最的依靠
你我这辈子最的依靠
通用型:
1、表定义、字段定义等符合通用规范,便于不同平台之间的数据交换和共享。
2、避免SQL方言,做到当前SQL任务放到其他平台亦可运行
3、建立通用的数据接口和数据格式,方便不同系统之间进行数据传输和交互。
发布于:1个月前 (02-08) IP属地:四川省
冷心丿玫瑰
冷心丿玫瑰
数据血源耦合的纯粹性:
1、清晰的数据血缘关系,追踪数据从源头到目标的转换过程,保证数据的准确性和一致性。
2、遵循数据仓库的规范和标准,避免产生无关数据或冗余数据,确保数据的纯粹性和高质量。
3、数据质量管理机制,对数据进行完整性、一致性和准确性等方面的检查和校验,及时发现并处理数据质量问题。
发布于:1个月前 (02-08) IP属地:四川省
旧梦难醒
旧梦难醒
高可用性:
1、服务高可用:重要的组件配置HA,例如Yarn的RM、HDFS的NN,数据高可用,重要的指标字段可以冗余到多张表,如若单表不小心被删掉不影响重要指标的产出
2、自动化的负载均衡和容错机制,提高服务的可靠性和稳定性。
3、建立监控和告警机制,及时发现和解决问题,确保系统始终保持高可用状态。
发布于:1个月前 (02-08) IP属地:四川省
羡风不停留
羡风不停留
数据的可追溯性:
1、需要建立完善的数据备份和恢复机制,保证数据丢失后能够快速找回。
2、建立数据审计机制,记录数据的操作历史,以便追溯数据流向和确保数据安全。
3、通过数据版本控制等手段,跟踪数据的变化过程,确保数据的完整性和正确性。
发布于:1个月前 (02-08) IP属地:四川省
我来回答