失效链接处理 |
Hadoop应用开发技术详解 PDF 下载
转载自:http://download.csdn.net/detail/jiangsucsdn/9791363
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://e.dangdang.com/products/1900396101.html
相关截图:
资料简介: 本书由资深Hadoop技术专家撰写,系统、全面、深入地讲解了Hadoop开发者需要掌握的技术和知识,包括HDFS的原理和应用、Hadoop文件I/O的原理和应用、MapReduce的原理和高级应用、MapReduce的编程方法和技巧,以及Hive、HBase和Mahout等技术和工具的使用。并且提供大量基于实际生产环境的案例,实战性非常强。 全书一共12章。第1~2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置;第3章是MapReduce的使用入门,让读者了解整个开发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了MapReduce的工作原理;第7章讲解了如何利用Eclipse来编译Hadoop的源代码,以及如何对Hadoop应用进行测试和调试;第8~9章细致地讲解了MapReduce的开发方法和高级应用;第10~12章系统地讲解了Hive、HBase和Mahout。 本书由资深Hadoop技术专家撰写,系统、全面、深地讲解了Hadoop发者需要掌握的技术和知识,包括HDFS的原理和应用、Hadoop文件I/O的原理和应用、MapReduce的原理和高级应用、MapReduce的编程方法和技巧,以及Hive、HBase和Mahout等技术和工具的使用。并且提供大量基于实际生产环境的案例,实战性非常强。 全书一共12章。第1~2章详细地介绍了Hadoop的生态系统、关键技术以及安装和配置;第3章是MapReduce的使用门,让读者了解整个发过程;第4~5章详细讲解了分布式文件系统HDFS和Hadoop的文件I/O;第6章分析了MapReduce的工作原理;第7章讲解了如何利用Eclipse来编译Hadoop的源代码,以及如何对Hadoop应用行测试和调试;第8~9章细致地讲解了MapReduce的发方法和高级应用;第10~12章系统地讲解了Hive、HBase和Mahout。 资料目录: 前言 第1章 Hadoop概述 1.1 Hadoop起源 1.2 Hadoop生态系统 1.3 Hadoop常用项目介绍 1.4 Hadoop在国内的应用 1.5 本章小结 第2章 Hadoop安装 2.1 Hadoop环境安装配置 2.2 Hadoop安装模式 2.3 如何使用Hadoop 2.4 本章小结 第3章 MapReduce快速入门 3.1 WordCount实例准备开发环境 3.2 MapReduce代码的实现 3.3 打包、部署和运行 3.4 本章小结 第4章 Hadoop分布式文件系统详解 4.1 认识HDFS 4.2 HDFS架构 4.3 Hadoop的RPC机制 4.4 HDFS的HA机制 4.5 HDFS的Federation机制 4.6 Hadoop文件系统的访问 4.7 Java API接口 4.8 维护HDFS 4.9 HDFS权限管理 4.10 本章小结 第5章 Hadoop文件I/O详解 5.1 Hadoop文件的数据结构 5.2 HDFS数据完整性 5.3 文件序列化 5.4 Hadoop的Writable类型 5.5 文件压缩 5.6 本章小结 第6章 MapReduce工作原理 6.1 MapReduce的函数式编程概念 6.2 MapReduce框架结构 6.3 MapReduce运行原理 6.4 MapReduce容错 6.5 Shuffle阶段和Sort阶段 6.6 任务的执行 6.7 作业调度器 6.8 自定义Hadoop调度器 6.9 YARN介绍 6.10 本章小结 第7章 Eclipse插件的应用 7.1 编译Hadoop源码 7.2 Eclipse安装MapReduce插件 7.3 MapReduce的Debug调试 7.4 单元测试框架MRUnit 7.5 本章小结 第8章 MapReduce编程开发 8.1 WordCount案例分析 8.2 输入格式 8.3 输出格式 8.4 压缩格式 8.5 MapReduce优化 8.6 辅助类 8.7 Streaming接口 8.8 本章小结 第9章 MapReduce高级应用 9.1 计数器 9.2 MapReduce二次排序 9.3 MapReduce中的Join算法 9.4 MapReduce从MySQL读写数据 9.5 Hadoop系统调优 9.6 本章小结 第10章 数据仓库工具Hive 10.1 认识Hive 10.2 Hive架构 10.3 Hive文件格式 10.4 Hive操作 10.5 Hive 复合类型 10.6 Hive的JOIN详解 10.7 Hive优化策略 10.8 Hive内置操作符与函数 10.9 Hive用户自定义函数接口 10.10 Hive的权限控制 10.11 应用实例:使用JDBC开发Hive程序 10.12 本章小结 第11章 开源数据库HBase 11.1 认识HBase 11.2 HBase设计 11.3 关键算法和流程 11.4 HBase安装 11.5 HBase的Shell操作 11.6 HBase客户端 11.7 本章小结 第12章 Mahout算法 12.1 Mahout的使用 12.2 Mahout数据表示 12.3 认识Taste框架 12.4 Mahout推荐器 12.5 推荐系统 12.6 本章小结 附录A Hive内置操作符与函数 A.1 关系运算 A.2 逻辑运算与数学运算 A.3 Hive逻辑运算 A.4 数值运算 A.5 日期函数 A.6 条件函数 A.7 字符串函数 A.8 集合统计函数 A.9 符合类型构建操作 A.10 复杂类型访问操作 A.11 复杂类型长度统计函数 附录B HBase默认配置解释 附录C Hadoop三个配置文件的参数含义说明 C.1 常用的端口配置
C.2 集群目录配置 |