全部面试刷题微服务数据库消息队列搜索引擎大数据运维 go语言人工智能

请教下大家公司生产环境中湖仓一体是怎么构建的？

提问者：帅平问题分类：大数据

数据湖数据仓库

发布于：12个月前 (08-20) IP属地：四川省

9 个回答

つ浅笑嫣然

我们湖仓一体主要基于iceberg+starrocks构建，iceberg构建分钟级准实时数仓和小时级离线数仓，starrocks构建秒级实时数仓和复杂即席查询，采用存算分离架构，iceberg的数据放到对象存储，基于alluxio做为缓存，spark，flink，starrocks on k8s。大体是这样

发布于：12个月前 (08-20) IP属地：四川省

得治

iceberg使用spark计算引擎，starrocks使用flink计算引擎？

发布于：12个月前 (08-20) IP属地：四川省

久碍

iceberg使用spark计算引擎，starrocks使用flink计算引擎？

starrocks混合部署，有be和cn，cn部署到k8s上，be和fe是存算一体部署方式，共用fe，be主要做秒级实时数仓计算，cn是做一些复杂冷热数据的即席查询。iceberg既使用spark也使用flink，由于iceberg对changlog支持不好，我们进行底层实现，生成changlog，使用flink读取iceberg，达到分钟级计算。

发布于：12个月前 (08-20) IP属地：四川省