ITPub博客

首页 > 大数据 > 数据分析 > HBase表的特点介绍

HBase表的特点介绍

原创 数据分析 作者:chenfeng 时间:2017-03-03 14:21:00 0 删除 编辑
HBase是一个在HDFS上开发的面向列的分布式数据库。从逻辑上来讲,HBase将数据按照表、行和列进行存储。与HDFS一样,HBase主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力。HBase表的特点如下:
 • 容量大:一个表可以有数十亿行,上百万列。当关系型数据库的单个表的记录在亿级时,则查询和写入的性能都会呈现指数级下降,而HBase对于单表存储百亿或
          更多的数据都没有性能问题。
 • 无固定模式(表结构不固定):每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然并的列。
 • 面向列:面向列的存储和权限控制,支持列独立检索。关系型数据库是按行存储的,在数据量大的时候,关系型数据库依赖索引来提高查询速度,而建立索引和更新
          索引需要大量的时间和空间。对于HBase而言,因为数据是按照列存储,每一列都单独存放,所以数据及索引,在查询时可以只访问所涉及的列的数据,大大
          降低了系统的I/O性能。
 • 稀疏性:空(null)列并不占用存储空间,表可以设计的非常稀疏。
 • 数据多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳。
 • 数据类型单一:HBase中的数据都是字符串,没有类型。
 • 高性能:针对Rowkey的查询能够达到毫秒级别。 

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/15498/viewspace-2134652/,如需转载,请注明出处,否则将追究法律责任。

请登录后发表评论 登录
全部评论
交流MySQL,MongoDB和Redis技术。 微信或QQ:410294

注册时间:2015-12-07

 • 博文量
  691
 • 访问量
  1485758