Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > 大数据云计算 >

Elasticsearch集成Hadoop最佳实践 PDF 下载


分享到:
时间:2018-02-06 21:48来源:https://download.csdn.net/ 作者:转载  侵权举报
Elasticsearch集成Hadoop最佳实践 PDF 下载
失效链接处理
Elasticsearch集成Hadoop最佳实践 PDF 下载

转载自:http://download.csdn.net/download/liufeng_lc/10188176
 
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
 
 
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/25089830.html
  
相关截图:


资料简介:
ElasticSearch是一个开源的分布式搜索引擎,具有高可靠性,支持非常多的企业级搜索用例。Elasticsearch Hadoop作为一个完美的工具,用来连接 Elasticsearch 和 Hadoop 的生态系统。通过Kibana技术,Elasticsearch Hadoop很容易从Hadoop 生态系统中获得大数据分析的结果。 本书全面介绍Elasticsearch Hadoop技术用于大数据分析以及数据可视化的方法。内容共分7章,包括Hadoop、Elasticsearch、 Marvel和 Kibana 安装;通过编写 MapReduce 作业,把Hadoop数据导入 Elasticsearch;全面分析 Elasticsearch本质,如全文本搜索分析、 查询、 筛选器和聚合;使用 Kibana创建各种可视化和交互式仪表板,并使用Storm和 Elasticsearch分类现实世界的流数据以及相关的其他主题。 本书适合从事大数据分析人员、大数据应用开发的人员参考,也适合高等院校及培训机构相关专业的师生教学参考。

资料目录:

1章  环境部署 1

1.1  安装部署Hadoop集群 1

Java安装和配置 2

用户添加和配置 2

SSH认证配置 3

Hadoop下载 4

环境变量配置 4

Hadoop配置 5

配置core-site.xml 6

配置hdfs-site.xml 6

配置yarn-site.xml 6

配置mapred-site.xml 7

格式化HDFS 7

启动Hadoop进程 8

1.2  安装Elasticsearch及相关插件 8

下载Elasticsearch 9

配置Elasticsearch 9

安装Head插件 11

安装Marvel插件 11

启动Elasticsearch 12

1.3  运行WordCount示例 13

下载编译示例程序 13

将示例文件上传到HDFS 13

运行第一个作业 14

1.4  使用Head 和 Marvel浏览数据 16

使用Head浏览数据 16

初识Marvel 18

使用Sense浏览数据 19

小结 21

2章  初识ES-Hadoop 22

2.1  理解WordCount程序 23

理解Mapper 23

理解Reducer 24

理解Driver 25

使用旧的API——org.apache.hadoop.mapred 28

2.2  实际案例——网络数据监控 28

获取并理解数据 28

明确问题 29

解决方案 30

解决方案1——预聚合结果 30

解决方案2——直接查询聚合结果 32

2.3  开发MapReduce作业 33

编写Mapper类 34

编写Driver 37

编译作业 38

上传数据到HDFS 41

运行作业 41

查看TOP N结果 42

2.4  将数据从Elasticsearch写回HDFS 44

了解Twitter数据集 44

导入Elasticsearch 45

创建MapReduce作业 46

编写Tweets2HdfsMapper 46

运行示例 50

确认输出 50

小结 52

3章  深入理解Elasticsearch 53

3.1  理解搜索 53

观念转换 54

索引 54

类型 55

文档 55

字段 55

3.2  Elasticsearch交互 56

ElasticsearchCRUD 56

创建文档 56

获取文档 57

更新文档 58

删除文档 58

创建索引 58

映射 59

数据类型 60

创建映射 61

索引模板 62

3.3  控制索引过程 63

什么是反转索引 63

输入数据分析 64

停止词 64

大小写 65

词根 65

同义词 65

分析器 65

3.4  Elastic查询 67

编写查询语句 68

URI查询 68

match_all查询 68

term查询 68

boolean查询 70

match查询 71

range查询 72

wildcard查询 73

过滤器 73

3.5  聚合查询 75

执行聚合查询 76

terms聚合 76

histogram聚合 78

range聚合 78

geo distance聚合 79

嵌套聚合 81

自测题 82

小结 82

4章  利用Kibana进行大数据可视化 83

4.1  安装部署 83

Kibana安装 84

准备数据 84

自测题 85

启动Kibana 86

4.2  数据发现 87

4.3  数据可视化 90

饼图 91

堆积柱状图 94

使用堆积柱状图完成日期直方图 96

面积图 97

饼图组图 98

环形图 98

瓦片地图 99

自测题 100

4.4  动态图表 101

小结 104

5章  实时分析 105

5.1  了解Twitter趋势分析器 105

实现目标 106

Apache Storm安装 107

5.2  将流式数据接入Storm 107

编写Storm spout 108

编写Storm bolt 110

创建Storm topology 112

编译运行Storm作业 113

5.3  趋势分析 114

significant term聚合 114

使用Kibana分析趋势 116

5.4  使用Percolator对推文分类 117

Percolator 118

Percolator优化 120

推文分类 121

小结 124

6章  ES-Hadoop配置 125

6.1  分布式环境中的Elasticsearch 125

集群和节点 126

节点类型 126

节点发现 128

数据分布 129

分片 129

副本 129

分片分配 130

6.2  ES-Hadoop架构 132

动态并行 132

写入Elasticsearch 133

Elasticsearch中读取 134

失败捕获 134

数据本地化 135

6.3  生产环境配置 135

硬件 135

内存 135

CPU 135

磁盘 136

网络 136

集群安装 137

集群拓扑结构 137

设置名称 138

设置路径 138

设置内存 139

脑裂问题 140

设置恢复参数 141

预设配置 142

数据导入 142

全文检索 144

快速聚合 144

生产环境部署检查列表 145

6.4  集群管理 146

监控集群健康 146

备份和恢复 149

数据备份 149

数据恢复 150

小结 151

7章  与Hadoop生态系统集成 152

7.1  Pig集成 152

Pig安装 154

Elasticsearch中导入数据 155

JSON源写数据 157

类型转换 157

Elasticsearch中读取数据 158

7.2  Hive集成 158

安装Apache Hive 158

Elasticsearch中导入数据 159

JSON源写数据 161

类型转换 161

Elasticsearch中读取数据 162

7.3  Cascading集成 163

Elasticsearch中导入数据 163

编写一个Cascading作业 163

运行作业 164

Elasticsearch中读取数据 165

编写一个reader作业 165

使用Lingual 165

7.4  Spark集成 167

安装Spark 168

Elasticsearch中导入数据 168

使用SparkSQLElasticsearch中导入数据 169

Elasticsearch中读取数据 170

使用SparkSQLElasticsearch中读取数据 170

7.5  YARN集成 171

小结 172

附录  配置 174

 


 

------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐