clickhouse有哪些优化技巧?

提问者:帅平 问题分类:大数据
clickhouse有哪些优化技巧?
13 个回答
帅的很低调
帅的很低调
尽量不使用final
发布于:4个月前 (02-27) IP属地:未知
一生的爱意
一生的爱意
使用分布式表进行join或者in时,可以优先考虑使用global,例如:
select a.id,a.name,b.score from a global join b on a.id = b.id
发布于:4个月前 (02-27) IP属地:未知
我怕我伸手不及松手为空
我怕我伸手不及松手为空
当多表关联查询时,查询的数据仅来源于一张表时,可考虑用IN代替JOIN,速度会更快。
发布于:4个月前 (02-27) IP属地:未知
有个笨蛋住进我心
有个笨蛋住进我心
如一些聚合类的查询场景,建议使用物化视图。
发布于:4个月前 (02-27) IP属地:未知
一闪一闪亮晶晶べ
一闪一闪亮晶晶べ
使用uniqCombined(${列})代替count(distinct ${列})查询,性能快10倍以上。
发布于:4个月前 (02-27) IP属地:未知
宁愿短发披肩
宁愿短发披肩
尽量不使用select * 的方式查询数据,减少不必要的字段I/O扫描
发布于:4个月前 (02-27) IP属地:未知
冷清°
冷清°
查询数据总量的时候使用count()查询替代count(${列})查询。
发布于:4个月前 (02-27) IP属地:四川省
丢一地的真心、没人珍惜
丢一地的真心、没人珍惜
尽量大批量写入数据,避免小批量或者使用jdbc做简单的insert业务,因为会产生很多小文件,给合并带来压力。
发布于:4个月前 (02-27) IP属地:未知
下个站口、等迩
下个站口、等迩
如果没有必要存储所有的全量数据,尽量设置ttl。
发布于:4个月前 (02-27) IP属地:未知
芄粗
芄粗
clickhouse的分区数据量尽量控制在每个分区800-1000W左右的数据量。
发布于:4个月前 (02-27) IP属地:未知
忆雪
忆雪
尽量不要使用null值,选择其他无意义的值替代都可以。
发布于:4个月前 (02-27) IP属地:未知
天然纯勋勋
天然纯勋勋
时间类型使用Datetime,不要使用String存储。
发布于:4个月前 (02-27) IP属地:未知
我来回答