Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > 大数据云计算 >

Hadoop大数据解决方案 PDF 下载


分享到:
时间:2022-07-11 09:58来源:http://www.java1234.com 作者:转载  侵权举报
Hadoop大数据解决方案 PDF 下载
失效链接处理
Hadoop大数据解决方案  PDF 下载


下载地址:
版权归出版社和原作者所有,链接已删除,请购买正版

用户下载说明:

电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/11151176219.html
 

相关截图:


资料目录:

章 Hadoop概述 1
1.1 商业分析与大数据 2
1.1.1Hadoop的组件 3
1.1.2Hadoop分布式文件系统(HDFS) 3
1.1.3MapReduce是什么 4
1.1.4YARN是什么 5
1.2ZooKeeper是什么 6
1.3Hive是什么 7
1.4 与其他系统集成 8
1.4.1Hadoop生态系统 9
1.4.2数据集成与Hadoop 11
1.5 小结 16
第2章 存储 19
2.1Hadoop HDFS的基础知识 20
2.1.1概念 21
2.1.2架构 25
2.1.3接口 29
2.2 在分布式模式下设置HDFS群集 35
2.3HDFS的高级特性 40
2.3.1快照 41
2.3.2离线查看器 44
2.3.3分层存储 52
2.3.4纠删码 55
2.4 文件格式 59
2.5 云存储 63
2.6 小结 64
第3章 计算 65
3.1Hadoop MapReduce的基础 66
3.1.1概念 66
3.1.2架构 69
3.2 如何启动MapReduce作业 76
3.2.1编写Map任务 77
3.2.2编写reduce任务 79
3.2.3编写MapReduce作业 80
3.2.4配置 83
3.3MapReduce的高级特性 85
3.3.1分布式缓存 85
3.3.2计数器 87
3.3.3作业历史服务器 89
3.4 与Spark作业的区别 91
3.5 小结 92
第4章 用户体验 93
4.1Apache Hive 94
4.1.1安装Hive 96
4.1.2HiveQL 97
4.1.3UDF/SerDe 103
4.1.4Hive调优 105
4.2Apache Pig 106
4.2.1安装Pig 107
4.2.2Pig Latin 108
4.3UDF 110
4.4Hue 111
4.5Apache Oozie 114
4.5.1安装Oozie 115
4.5.2Oozie的工作原理 118
4.5.3工作流/协调器 119
4.5.4Oozie CLI 124
4.6 小结 124
第5章 与其他系统集成 125
5.1Apache Sqoop 126
5.2Apache Flume 130
5.3Apache Kafka 136
5.3.1工作原理 138
5.3.2Kafka Connect 141
5.3.3流处理 143
5.4Apache Storm 144
5.4.1工作原理 145
5.4.2Trident 148
5.4.3Kafka集成 149
5.5 小结 152
第6章 Hadoop安全 153
6.1 提升Hadoop群集安全性 154
6.1.1边界安全 154
6.1.2Kerberos认证 156
6.1.3Hadoop中的服务级授权 162
6.1.4用户模拟 167
6.1.5提升HTTP信道的安全性 170
6.2 提升数据安全性 174
6.2.1数据分类 175
6.2.2将数据传到群集 176
6.2.3保护群集中的数据 182
6.3 增强应用程序安全性 189
6.3.1YARN架构 189
6.3.2YARN中的应用提交 190
6.4 小结 195
第7章 自由的生态圈:Hadoop与ApacheBig97
7.1 基础概念 198
7.1.1软件栈 199
7.1.2测试栈 200
7.1.3在我的笔记本电脑上工作 201
7.2 开发定制的软件栈 201
7.2.1Apache Bigtop:历史 201
7.2.2Apache Bigtop:概念和哲学思想 202
7.2.3项目结构 204
7.2.4谈谈构建系统 205
7.2.5工具链和开发环境 206
7.2.6BOM定义 207
7.3 部署 208
7.3.1Bigtop Provisioner 208
7.3.2群集的无主节点Puppet部署 209
7.3.3使用Puppet进行配置管理 213
7.4 集成验证 215
7.4.1iTests和验证应用程序 216
7.4.2栈集成测试开发 217
7.4.3栈的验证 220
7.4.4群集故障测试 221
7.4.5栈的冒烟测试 222
7.5 将所有工作组合在一起223
7.6 小结 224
第8章 Hadoop软件栈的In-Memory计算 227
8.1In-Memory计算简介 229
8.2Apache Ignite:内存优先 231
8.2.1Apache Ignite的系统体系架构 232
8.2.2数据网格 233
8.2.3高可用性讨论 236
8.2.4计算网格 237
8.2.5服务网格 238
8.2.6内存管理 238
8.2.7持久化存储 240
8.3 使用Ignite加速旧式Hadoop240
8.3.1In-Memory存储的好处 241
8.3.2内存文件系统:HDFS缓存 242
8.3.3In-Memory MapReduce 243
8.4Apache Ignite的高级用法 247
8.4.1Spark和Ignite 247
8.4.2共享状态 249
8.4.3Hadoop上的In-Memory SQL 251
8.4.4使用Ignite的SQL 252
8.4.5使用Apache Ignite进行流处理 255
8.5 小结 256
术语表 259
 
------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐