失效链接处理 |
大数据技术之Phoenix PDF 下载
本站整理下载:
相关截图:
主要内容:
1.1 Phoenix 定义
Phoenix 最早是 saleforce 的一个开源项目,后来成为 Apache 的顶级项目。
Phoenix 构建在 HBase 之上的开源 SQL 层. 能够让我们使用标准的 JDBC API 去建表, 插入数据和查询 HBase 中的数据, 从而可以避免使用 HBase 的客户端 API.
在我们的应用和 HBase 之间添加了 Phoenix, 并不会降低性能, 而且我们也少写了很多代码.
1.2 Phoenix 特点
1.将 SQl 查询编译为 HBase 扫描
2.确定扫描 Rowkey 的最佳开始和结束位置
3.扫描并行执行
4.将 where 子句推送到服务器端的过滤器
5.通过协处理器进行聚合操作
6.完美支持 HBase 二级索引创建
7.DML命令以及通过DDL命令创建和操作表和版本化增量更改。
8.容易集成:如Spark,Hive,Pig,Flume和Map Reduce。
1.3 Phoenix 架构
1.4 Phoenix 数据存储
Phoenix 将 HBase 的数据模型映射到关系型世界
第 2 章 Phoenix 快速入门
2.1 安装部署
步骤 1: 下载 Phoenix
http://archive.apache.org/dist/phoenix/apache-phoenix-4.14.2-HBase-1.3/
步骤 2: 解压 jar 包
tar -zxvf apache-phoenix-4.14.2-HBase-1.3-bin.tar.gz -C /opt/module
mv apache-phoenix-4.14.2-HBase-1.3-bin phoenix
步骤 3: 复制 jar 包
复制 HBase 需要用到 server 和 client 2 个 jar 包
cp phoenix-4.14.2-HBase-1.3-server.jar /opt/module/hbase/lib
cp phoenix-4.14.2-HBase-1.3-client.jar /opt/module/hbase/lib
步骤 4: 分发 jar 包
需要把刚才 copy 的 2个jar 包分发到其他 HBase 节点
步骤 5: 配置环境变量
export PHOENIX_HOME=/opt/module/phoenix
export PHOENIX_CLASSPATH=$PHOENIX_HOME
export PATH=$PATH:$PHOENIX_HOME/bin
步骤 6: 启动 hadoop, zookeeper, HBase
步骤 7: 启动 Phoenix
/opt/module/phoenix » bin/sqlline.py hadoop101,hadoop102,hadoop103:2181
2.2 Phoenix 表操作
2.2.1 显示所有表
!tables
# 或者
!table
2.2.2 创建表
CREATE TABLE IF NOT EXISTS us_population1 (
state CHAR(2) NOT NULL,
city VARCHAR NOT NULL,
population BIGINT
CONSTRAINT my_pk PRIMARY KEY (state, city));
说明:
1.char类型必须添加长度限制
2.varchar 可以不用长度限制
3.主键映射到 HBase 中会成为 Rowkey. 如果有多个主键(联合主键), 会把多个主键的值拼成 rowkey
4.在 Phoenix 中, 默认会把表名,字段名等自动转换成大写.
2.2.3 插入记录
upsert into us_population values('NY','NewYork',8143197);
upsert into us_population values('CA','Los Angeles',3844829);
upsert into us_population values('IL','Chicago',2842518);
说明: upsert可以看成是update和insert的结合体.
|