Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > 大数据云计算 >

Spark 原理、机制及应用 PDF 下载


分享到:
时间:2021-01-18 09:24来源:http://www.java1234.com 作者:转载  侵权举报
Spark 原理、机制及应用 PDF 下载
失效链接处理
Spark 原理、机制及应用 PDF 下载


本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
 
 
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/23918745.html
  
相关截图:




资料简介:
本书是一本以Spark1.4为基础,详细介绍了Spark技术的概况、内部机制和企业界的应用情况。作者结合国内外众多资料和项目经验,力求深入浅出地讲解Spark技术的生态应用和发展状况,此外还选取了SparkSummit中的典型案例进行解析,为读者全面展现Spark技术在企业界的应用情况。本书适合Spark技术初学者、Spark技术爱好者、Spark运维工程师和开源软件爱好者,也可以作为相关培训学校和大专院校相关专业的教学用书


资料目录:

前言

第一篇   

1 Spark概述2

1.1 Spark
初见2

1.1.1 Spark
的发展史及近况2

1.1.2 Spark
的特点5

1.1.3 Spark
的作用6

1.1.4 Spark
的体系结构6

1.1.5 Spark
的发展趋势6

1.2 Spark
框架7

1.2.1 
批处理框架7

1.2.2 
流处理框架8

1.3 Spark
的生态系统8

1.4 Spark
的数据存储11

1.5 
本章小结11

2 Spark环境配置12

2.1 Spark
运行环境配置12

2.1.1 
先决条件12

2.1.2 
下载与运行 Spark13

2.1.3 
使用交互式 Shell14

2.1.4 
搭建SparkStandalone集群16

2.2 Spark
开发环境配置18

2.2.1 Spark
独立应用程序18

2.2.2 
构建IDE开发环境24

2.3 Spark
编译环境配置29

2.3.1 
使用Maven编译项目源码30

2.3.2 
使用IDEA搭建源码编译与

阅读环境31

2.4 
本章小结35



第二篇   



3 Spark核心开发37

3.1 Spark
编程模型概述37

3.2 SparkContext38

3.2.1 SparkContext
的作用38

3.2.2 SparkContext
的创建38

3.2.3 
使用Shell41

3.2.4 
应用实践41

3.3 RDD
简介42

3.3.1 RDD
创建42

3.3.2 RDD
转换操作43

3.3.3 RDD
动作操作44

3.3.4 RDD
惰性计算44

3.3.5 RDD
持久化44

3.3.6 RDD
检查点45

3.4 
共享变量45

3.4.1 
广播变量45

3.4.2 
累加器46

3.5 Spark
核心开发实践46

3.5.1 
单值型Trasnformation算子46

3.5.2 
键值对型Transformation算子58

3.5.3 Action
算子64

3.6 
本章小结72

4 Spark四大应用技术框架73

4.1 Spark SQL73

4.1.1 Spark SQL
入门73

4.1.2 
数据源75

4.1.3 
性能调优81

4.1.4 
分布式SQL引擎82

4.1.5 Shark
迁移至SparkSQL指南82

4.1.6 Hive
的兼容性83

4.1.7 Spark SQL
数据类型85

4.2 Spark Streaming86

4.2.1 Spark Streaming
简介87

4.2.2 
入门实例87

4.2.3 
基本概念89

4.3 Spark GraphX97

4.3.1 Spark GraphX
简介97

4.3.2 
属性图98

4.3.3 
图操作100

4.3.4 Pregel API108

4.3.5 
图构造器110

4.3.6 
顶点与边相关RDD111

4.3.7 
最优化表示113

4.3.8 
图算法114

4.3.9 Example116

4.4 Spark MLlib116

4.4.1 Spark MLlib
简介116

4.4.2 
数据类型117

4.4.3 
基本统计分析121

4.4.4 
分类与回归123

4.4.5 
协同过滤136

4.4.6 
聚类138

4.4.7 
降维139

4.4.8 
特征提取与转换141

4.4.9 
频繁模式挖掘146

4.4.10 
最优化算法147

4.4.11 
导出PMML模式149

4.5 SparkR150

4.5.1 SparkR DataFrame150

4.5.2 DataFrame
的相关操作152

4.5.3 
SparkR运行SQL查询153

5 Spark系统配置与调优154

5.1 Spark
运行监控154

5.2 Spark
配置参数158

5.2.1 
应用属性159

5.2.2 
运行环境属性159

5.2.3 Shuffle
操作


 
------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐