数据仓库与数据湖有什么区别?

提问者:帅平 问题分类:面试刷题
数据仓库与数据湖有什么区别?
2 个回答
那句晚安你听了吗
那句晚安你听了吗
数据处理模式上的区别是:
在我们可以加载到数据仓库中的数据,我们首先需要定义好它,这叫做写时模式(Schema-On-Write)。而对于数据湖,您只需加载原始数据,然后,当您准备使用数据时,就给它一个定义,这叫做读时模式(Schema-On-Read)。这是两种截然不同的数据处理方法。因为数据湖是在数据使用时再定义模型结构,因此提高了数据模型定义的灵活性,可满足更多不同上层业务的高效率分析诉求。
发布于:4个月前 (01-10) IP属地:四川省
吹南风
吹南风
存储数据类型上的区别是:
数据仓库是存储数据,进行建模,存储的是结构化数据;数据湖以其本源格式保存大量原始数据,包括结构化的、半结构化的和非结构化的数据,主要是由原始的、混乱的、非结构化的数据组成。在需要数据之前,没有定义数据结构和需求。
发布于:4个月前 (01-10) IP属地:未知
我来回答