失效链接处理 |
HBase分布式数据库 PDF 下载
本站整理下载:
相关截图:
主要内容:
5.1.1 BigTable
一个结构化数据的分布式存储系统
利用谷歌提出的MapReduce分布式并行计算模型
来处理海量数据
使用谷歌分布式文件系统GFS作为底层数据存储
采用Chubby提供协同服务管理
特性:支持大规模少量数据、分布式并发数据处
理效率极高、易于扩展且支持动态伸缩、适用于
廉价设备、适合于读操作不适合写操作
5.1
概述
5.1.2 HBase简介
HBase是一个分布式的、面向列的开源数据库;
HBase在Hadoop之上提供了类似于Bigtable的能力;。
HBase是Apache的Hadoop项目的子项目;
HBase不同于一般的关系数据库,它是一个适合于非
结构化数据存储的数据库;
HBase是基于列的而不是基于行的模式。
5.1
概述
5.1.3 HBase与传统数据库对比
数据类型:字符串
数据操作:无表连接
存储模式:列存储
数据索引:行键
数据维护:不覆盖
可伸缩性:硬件数量灵活
5.2
HBase
访问接口
1. Native Java API
最常规和高效的访问方式,适合Hadoop MapReduce Job并行批处理HBase
表数据
2. HBase Shell
HBase的命令行工具,最简单的接口,适合HBase管理使用
3. Thrift Gateway
利用Thrift序列化技术,支持C++,PHP,Python等多种语言,适合其他
异构系统在线访问HBase表数据
5. REST Gateway
支持REST 风格的Http API访问HBase, 解除了语言限制
5. Pig
可以使用Pig Latin流式编程语言来操作HBase中的数据,和Hive类似,
本质最终也是编译成MapReduce Job来处理HBase表数据,适合做数据统
计 6. Hive
当前Hive的Release版本尚没有加入对HBase的支持,但在下一个版本
Hive 0.7.0中将会支持HBase,可以使用类似SQL语言来访问HBase
|