正文

数据湖系列（十八）Iceberg介绍

Rae V管理员 /2024-01-23/820阅读/0评论

0123

此篇文章发布距今已超过896天，您需要注意文章的内容或图片是否可用！

前面我们介绍了hudi相关的数据湖信息，介绍的算是比较少的，主要是因为hudi我用的不多，并且hudi主要和spark的兼容性会比较强一点，个人感觉使用局限性比较大。所以hudi相关的信息介绍确实比较少一点，这里的话我们推荐一个其他比较好用的数据湖-iceberg。

Iceberg作为数据湖，他使用起来也比较方便，主要是table fromat形式。他的底层文件存储目前我们大多使用的还是hdfs，而且不管是和哪个组件（hive，flink，spark等）结合起来使用都非常的简单。所以Iceberg和Paimon是目前我们主推大家使用的数据湖。

关于Iceberg相关的基础信息，大家可以查看如下的文章：

IceBerg有哪些特点？

Iceberg有哪些术语？

Iceberg底层文件的存储形式是什么样的？

Iceberg的data files支持哪些文件格式？

Iceberg支持哪些粒度划分分区？

Iceberg修改分区需要迁移数据吗？

Iceberg的分区与Hive的分区有什么区别？

Iceberg支持哪些schema的调整？

Iceberg表支持的数据类型有哪些？

真正的成长, 源于内心的觉醒和不懈的努力, 你的信念和行动, 将铺就通往更好的自己的道路

-- 展开阅读全文 --

继续看这个主题

数据仓库 Iceberg

相关阅读

发表评论取消回复

评论列表（暂无评论，820人围观）

还没有评论，来说两句吧...

目录[+]