Hbase是hadoop大数据集系列的一个重要组成模块,官网上关于hbase的介绍是:
HBase是一个基于Java,开源,NoSQL,非关系型、面向列的、构建在Hadoop分布式文件系统( HDFS )上的仿照谷歌的BigTable 的论文开发的分布式列式数据库。
对于hbase来说,他是一个面向列存储的数据库,非传统的面向行的数据库,我们日常使用的mysql就是一个面向行的数据库,这种数据库需要完整的定义每一行的数据结构,然后再进行数据的存放。而像hbase这种列式的数据库他是面向列的方式存储数据。他不需要提前定义完整的每行的数据库结构,而是可以在实际存储中动态定义列,并且定义新的列时,对原有的数据存储没有任何影响的列式数据库。
对于hbase来说,原则上来说,他的存储是构建在hdfs上的,因此我们如果要使用hbase的话,需要首先部署一个hadoop系统。但是有时候我们也可以不部署hadoop系统,也可以做一些简单的使用,例如我们前面介绍的atlas就是使用hbase,但是不需要安装hdfs系统。
备注:
1、如果想要完整的使用hbase的功能,建议还是需要搭建一套hadoop环境。
Hbase的优点:
1、线性扩展,随着数据量增多可以通过节点扩展进行支撑 2、数据存储在hdfs上,备份机制健全 3、通过zookeeper协调查找数据,访问速度块 4、提供非常低延迟的近实时的随机读取和随机写入
在大数据建设领域,一般我们常使用Hbase,在后面的文章中我们会对hbase相关的内容做介绍。
备注:
1、在本系列中我们将不再介绍hbase的相关安装,具体的安装文档可参考:《Hbase安装配置篇(一)Hbase2.5.3单机版安装教程》
还没有评论,来说两句吧...