Doris中表分桶的方式有哪些?

提问者:帅平 问题分类:面试刷题
Doris中表分桶的方式有哪些?
2 个回答
细腻长发姐
细腻长发姐
Random 分桶:数据会被随机分配到不同的分片中,当处理小规模数据时,可以使用load_to_single_tablet参数来优化写入速度。
在以下场景中,建议使用 Random 分桶:
1、在任意维度分析的场景中,业务没有特别针对某一列频繁进行过滤或关联查询时,可以选择 Random 分桶;
2、当经常查询的列或组合列数据分布极其不均匀时,使用 Random 分桶可以避免数据倾斜。
3、Random 分桶无法根据分桶键进行剪裁,会扫描命中分区的所有数据,不建议在点查场景下使用;
4、只有 DUPLICATE 表可以使用 Random 分区,UNIQUE 与 AGGREGATE 表无法使用 Random 分桶;
发布于:1个月前 (03-21) IP属地:
那句晚安你听了吗
那句晚安你听了吗
Hash 分桶:系统会对分桶列的值计算哈希值,然后根据分桶数量取模,将数据均匀地分布到各个分片中。这种方式适用于 JOIN 或者聚合查询的场景。
推荐在以下场景中使用 Hash 分桶:
1、业务需求频繁基于某个字段进行过滤时,可将该字段作为分桶键,利用 Hash 分桶提高查询效率。
2、当表中的数据分布较为均匀时,Hash 分桶同样是一种有效的选择。
发布于:1个月前 (03-21) IP属地:
我来回答