1 个回答
数据湖的本质是由 数据存储架构 + 数据处理工具组成的存储计算框架。不依赖于HDFS,可以支持多种存储介质和任意结构的数据,高效更新机制、文件组织形式、统一的开放的表格上(定位是在计算引擎之下,又在存储之上,将其称之为table format),灵活的元数据管理。用来帮助解决解决hive常见的痛点问题,如更新问题,结构变更,acid,小文件问题,性能问题。数据湖并非数据仓库的替代方案,而是补充和完善。
发布于:8个月前 (06-17) IP属地:四川省
我来回答
您需要 登录 后回答此问题!