HBase Region分裂以及预分区

本文详细介绍了HBase的Region分裂过程,包括Region分裂的触发条件、步骤及元数据更新。同时,讨论了预分区策略,以解决写热点和减少Region分裂对I/O的影响。预分区通过在建表时设定多个region的起始和结束rowkey,确保数据分布均匀,降低split操作的频率。文中还给出了预分区的实现代码示例。

Region分裂

  当MemStore的数据超过阈值时,将数据溢写磁盘,生成一个StoreFile文件。当Region中最大Store的大小超过阈值时,Region分裂,等分成两个Region,实现数据访问的负载均衡。新的Region的位置由HMaster来确定在哪个RegionServer中。

  1. RegionServer决定本地的region分裂,并准备分裂工作。第一步是,在zookeeper的/hbase/region-in-transition/region-name下创建一个znode,并设为SPLITTING状态
  2. Master通过父region-in-transition znode的watcher监测到刚刚创建的znode
  3. RegionServer在HDFS中父region的目录下创建名为“.split”的子目录
  4. RegionServer关闭父region,并强制刷新缓存内的数据,之后在本地数据结构中将标识为下线状态
  5. RegionServer在.split目录下为子regionA和B创建目录和相关的数据结构。然后RegionServer分割store文件,为父region的每个store文件创建两个Reference文件,这些Reference文件将指向父region中的文件
  6. RegionServer在HDFS中创建实际的region目录,并移动每个子region的Reference文件
  7. RegionServer向.META.表发送Put请求,并在.META.中将父region改为下线状态,添加子region的信息。如果Put请求成功,那么父region将被有效地分割。如果在这条RPC成功之前RegionServer死掉了,那么Master和打开region的下一个RegionServer会清理关于该region分裂的脏状态。在.META.更新之后,region的分裂将被Master回滚到之前的状态
  8. RegionServer打开子region,并行地接受写请求
  9. RegionServer将子region A和B的相关信息写入.META.。此后,Client便可以扫描到新的region并且可以向其发送请求
  10. RegionServer将zookeeper中的znode /hbase/region-in-transition/region-name更改为SPLIT状态,以便Master可以监测到。如果子Region被选中了,Balancer可以自由地将子region分派到其他RegionServer上
  11. 分裂之后,元数据和HDFS中依然包含着指向父region的Reference文件。这些Reference文件将在子region发生紧缩操作重写数据文件时被删除掉。Master的垃圾回收工会周期性地检测是否还有指向父region的Reference,如果没有,将删除父region

预分区

  HBase默认建表时有一个region,这个region的rowkey是没有边界的,即没有start key和end key,在数据写入时,所有数据都会写入这个默认的region,随着数据量的不断增加,region的size越来越大时,大到一定的阀值,hbase认为再往这个region里塞数据已经不合适了,就会找到一个midKey将region一分为二,成为2个region,这个过程称为分裂(region-split).而midKey则为这二个region的临界,左为N无下界,右为M无上界。< midKey则被塞到N区,> midKey则会被塞到M区。
  在此过程中,会产生两个问题:【1】热点写,总是会往最大的start-key所在的region写东西,因为rowkey总是会比之前的大,并且HBase的是按升序方式排序的。所以写操作总是被定位到无上界的那个region中。之前分裂出来的region不会再被写数据,会处于半满状态,这样的分布是不利的。【2】region split会消耗宝贵的集群I/O资源。
  基于此可以控制在建表的时候,创建多个空region,并确定每个region的起始和终止rowkey,这样只要rowkey设计能均匀的命中各个region,就不会存在写热点问题,split的几率也会大大降低。当然随着数据量的不断增长,该split的还是要进行split。像这样预先创建hbase表分区的方式,称之为 预分区
  要进行预分区,首先要明确rowkey的取值范围或构成逻辑,以rowkey组成为例:两位随机数+时间戳+客户号,两位随机数的范围从00-99,于是划分了10个region来存储数据,每个region对应的rowkey范围如下:
-10,10-20,20-30,30-40,40-50,50-60,60-70,70-80,80-90,90-
  在使用HBase API建表的时候,需要产生splitkeys二维数组,这个数组存储的rowkey的边界值。代码实现:

private byte[][] getSplitKeys() {
		String[] keys = new String[] { "10|", "20|", "30|", "40|", "50|",
				"60|", "70|", "80|", "90|" };
		byte[][] splitKeys=new byte[keys.length][];
		TreeSet<byte[]> rows = new TreeSet<byte[]>(Bytes.BYTES_COMPARATOR);//升序排序
		for (int i = 0; i < keys.length; i++) {
			rows.add(Bytes.toBytes(keys[i]));
		}
		Iterator<byte[]> rowKeyIter = rows.iterator();
		int i=0;
		while (rowKeyIter.hasNext()) {
			byte[] tempRow = rowKeyIter.next();
			rowKeyIter.remove();
			splitKeys[i] = tempRow;
			i++;
		}
		return splitKeys;
}

这里treeset对rowkey进行排序,必须要对rowkey排序,否则在调用admin.createTable(tableDescriptor,splitKeys)的时候会出错。创建表的代码如下:

/**
	 * 创建预分区hbase表
	 * @param tableName 表名
	 * @param columnFamily 列簇
	 * @return
	 */
	@SuppressWarnings("resource")
	public boolean createTableBySplitKeys(String tableName, List<String> columnFamily) {
		try {
			if (StringUtils.isBlank(tableName) || columnFamily == null
					|| columnFamily.size() < 0) {
				log.error("===Parameters tableName|columnFamily should not be null,Please check!===");
			}
			HBaseAdmin admin = new HBaseAdmin(conf);
			if (admin.tableExists(tableName)) {
				return true;
			} else {
				HTableDescriptor tableDescriptor = new HTableDescriptor(
						TableName.valueOf(tableName));
				for (String cf : columnFamily) {
					tableDescriptor.addFamily(new HColumnDescriptor(cf));
				}
				byte[][] splitKeys = getSplitKeys();
				admin.createTable(tableDescriptor,splitKeys);//指定splitkeys
				log.info("===Create Table " + tableName
						+ " Success!columnFamily:" + columnFamily.toString()
						+ "===");
			}
		} catch (MasterNotRunningException e) {
			// TODO Auto-generated catch block
			log.error(e);
			return false;
		} catch (ZooKeeperConnectionException e) {
			// TODO Auto-generated catch block
			log.error(e);
			return false;
		} catch (IOException e) {
			// TODO Auto-generated catch block
			log.error(e);
			return false;
		}
		return true;
	}

在hbase shell中输入命令san 'hbase:meta’查看建表结果,可看出10个region均匀的分布在了3台regionserver上(集群就3台机器regionserver),达到预期效果。
再看看写数据是否均匀的命中各个region,是否能够做到对写请求的负载均衡:

public class TestHBasePartition {
public static void main(String[] args) throws Exception{
   HBaseAdmin admin = new HBaseAdmin(conf);
   HTable table = new HTable(conf, "testhbase");
   table.put(batchPut());
}
private static String getRandomNumber(){
		String ranStr = Math.random()+"";
		int pointIndex = ranStr.indexOf(".");
		return ranStr.substring(pointIndex+1, pointIndex+3);
	}
	
	private static List<Put> batchPut(){
		List<Put> list = new ArrayList<Put>();
		for(int i=1;i<=10000;i++){
			byte[] rowkey = Bytes.toBytes(getRandomNumber()+"-"+System.currentTimeMillis()+"-"+i);
			Put put = new Put(rowkey);
			put.add(Bytes.toBytes("info"), Bytes.toBytes("name"), Bytes.toBytes("zs"+i));
			list.add(put);
		}
		return list;
	}

除了上面的方法还可以通过HBase Shell(通过读取split文件)进行预分区操作。split文件内容如下:
在这里插入图片描述
在HBase Shell中:执行如下命令,创建表user2,添加额外参数SPLITS_FILE =>并指定split文件绝对路径

create ‘user2’,{NAME => ‘info’ },{NAME => ‘desc’},SPLITS_FILE =>/data/hbaseSplits.txt’
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值