1 个回答
设置分桶的个数的时候可以参考如下的因素:
1、当表或者分区数据量超过50GB的时候按照每个桶1GB预估
2、当表或者分区数据量小于50GB的时候按照每个桶500MB预估
3、当按照以上策略估算出来的分桶个数小于be个数的时候,最终分桶个数以be个数为准,例如6个be节点,按照500MB每个桶预估分桶个数为1,最终分桶个数取6
4、单个桶按照500MB~1GB预估,原始数据按照5GB~10GB(导入doris后,压缩比7:1~10:1)预估
5、非分区表不要使用动态分桶,按照实际数据量估算分桶个数
6、如果分区表的各个分区的数据差异很大,建议不要使用动态分桶策略
发布于:6个月前 (04-19) IP属地:四川省
我来回答
您需要 登录 后回答此问题!