1 个回答
Doris 是一款基于 MPP(大规模并行处理)架构的分布式分析型数据库,其行列混存模式允许在同一数据存储中,针对不同数据部分采用行式存储和列式存储两种方式。简单来说,就是可以根据数据的使用特点,将适合按行处理的数据按行存储,适合按列处理的数据按列存储。Doris 默认采用列式存储,在分析场景(如聚合,过滤,排序等)中有出色性能,因为只需读取所需列,减少了不必要的 I/O。但在点查场景(如SELECT *)下,若列数众多,每个列都需一次 I/O,会导致 I/OPS 成为瓶颈,尤其是宽表(上百列)情况更为突出。为解决此问题,Doris 从 2.0.0 版本开始支持行列混存。用户在建表时指定开启行存后,点查操作每一行仅需一次 I/O,在宽表且列数多的场景下,性能有数量级提升。
发布于:1个月前 (03-21) IP属地:
我来回答
您需要 登录 后回答此问题!