1 个回答
数据划分是将数据划分为较小、更易管理的部分的过程。doris对数据划分主要体现在:
1、Doris作为专注于高效的OLAP(联机分析处理)场景的分布式数据库,首先其数据的存储是基于列的,即将同一列的值存储在一起,而不是按行存储(也可以开启行存,但需要额外的存储空间)。这种存储方式使得只需要加载和处理需要的列数据,避免了无关列数据的处理耗时,从而提高了查询性能。
2、然后是每个表都被水平划分成多个数据分片,这个数据分片在Doris里面被称为tablet(也叫数据分桶),每个分片包含不交叉的多行数据,其是数据移动、复制等操作的最小物理存储单元。
3、这些数据分片又根据特定的逻辑定义被划分为不同的部分,这在Doris里面被称为分区,其是逻辑上最小的管理单元。这使得数据的操作可以只针对特定的分区,从而减少了需要扫描和处理的数据量,有助于提高查询性能和高效管理大规模数据集。
发布于:1个月前 (02-08) IP属地:四川省
我来回答
您需要 登录 后回答此问题!