1 个回答
HBase默认建表时只有一个region,这个region的rowkey是没有边界的,即没有startkey和endkey,在数据写入时,所有数据都会写入这个默认的region,而随着数据量的不断增加,此region已经不能承受不断增长的数据量,会进行split,分成2个region。在此过程中,会产生两个问题:
1、数据只往一个region上写,会有写热点问题。
2、region split会消耗集群I/O的资源。
所以在我们建表的时候,可以预先创建多个空region,并确定每个region的起始和终止rowkey, 这样只要我们的rowkey设计能均匀的命中各个region,就能避免写热点问题, 也能大大降低split的几率。发布于:3个月前 (01-24) IP属地:四川省
我来回答
您需要 登录 后回答此问题!