什么是湖仓(数据湖+数据仓库)一体?

提问者:帅平 问题分类:面试刷题
什么是湖仓(数据湖+数据仓库)一体?
1 个回答
つ浅笑嫣然
つ浅笑嫣然
数据湖仓一体是一种现代数据架构,它结合了数据湖(原始形式的大型原始数据存储库)和数据仓库(经过整理的结构化数据集)的主要优势来创建单一平台。具体来说,数据湖仓一体让组织可以使用低成本存储空间来存储大量原始数据,同时提供结构和数据管理功能。
过去,数据仓库和数据湖必须作为单独的孤立架构来实现,以避免底层系统过载并对同一资源造成争用。公司使用数据仓库来存储用于商业智能 (BI) 的结构化数据,并使用报告和数据湖存储用于机器学习 (ML)工作负载的非结构化和半结构化数据。但是,若需要将任一架构中的数据一起处理,这种方法需要定期在两个独立系统之间转移数据,从而产生复杂性,导致成本增加,并带来数据新鲜度、重复和一致性方面的问题。
数据湖仓一体旨在打破这些孤岛,提供所需的灵活性、可伸缩性和敏捷性,以确保您的数据为业务创造价值,而不会导致效率低下
发布于:4个月前 (12-16) IP属地:四川省
我来回答