Java知识分享网 - 轻松学习从此开始!    

Java知识分享网

Java1234官方群25:java1234官方群17
Java1234官方群25:838462530
        
SpringBoot+SpringSecurity+Vue+ElementPlus权限系统实战课程 震撼发布        

最新Java全栈就业实战课程(免费)

springcloud分布式电商秒杀实战课程

IDEA永久激活

66套java实战课程无套路领取

锋哥开始收Java学员啦!

Python学习路线图

锋哥开始收Java学员啦!
当前位置: 主页 > Java文档 > 大数据云计算 >

Spark大数据编程基础 Scala版 PDF 下载


分享到:
时间:2021-01-15 09:28来源:http://www.java1234.com 作者:转载  侵权举报
Spark大数据编程基础 Scala版 PDF 下载
失效链接处理
Spark大数据编程基础 Scala版  PDF 下载


本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
 
 
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/27847419.html
  
相关截图:



资料简介:

大数据被称为未来的新石油,那么如何开采新石油是各个领域处理大数据面临的核心问题。工欲善其事,必先利其器。大数据编程为处理大数据提供了*有效的,本书将全面的介绍大数据编程基础。大数据处理技术发展迅速,Spark已经成为大数据处理的*平台,因此本书的大数据编程将针对Spark平台进行。

本书成体系的介绍了Spark大数据编程技术。本书分为三个部分共10章,从“Spark环境介绍”开始,以“Spark编程入门基础”为承接、*后具体到每一个“Spark编程组件”。这三部分内容从浅入深自成体系,可以方便的学习Spark编程的每个具体知识点。

*部分包含第12章,讲述了Spark的环境。其中,第1章对Spark的背景和运行架构进行了概述;第2章对Spark开发环境的搭建进行了详细介绍。这是学习后续章节的基础。

第二部分包含了第35章,讲述了“Spark编程入门基础”部分,重点介绍了Scala编程基础和RDD编程。本书采用Scala编程语言,因此第3章和第4章分别介绍了Scala语言基础和Scala面向对象编程。弹性分布式数据集(Resilient Distributed DatasetRDD)是Spark对数据的核心抽象,因此第5章介绍了RDD编程。

第三部分包含了第610章,讲述了“Spark编程组件”部分,重点介绍了Spark SQLSpark StreamingSpark GraphXSpark ML四个组件的编程。其中,第6章介绍了Spark SQL,可以高效的处理结构化数据;第7章介绍了Spark Streaming,可以高效的流式数据;第8章介绍了Spark GraphX,可以高效的图数据;第9章和第10章介绍了Spark ML,分别以Spark机器学习原理和Spark机器学习模型为重点。

本书在编写过程中力求深入浅出、重点突出、简明扼要,尽可能方便不同专业背景和知识层次的读者阅读。本书编写过程中,中南大学研究生杜宏亮、田玲、熊帆、高俊、吕腾飞、蒋志怡、应晓婷等做了大量的资料收集整理、书稿校对等工作,在此,对这些同学的辛勤工作表示感谢。

本书配套的官方网站是http://aibigdata.csu.edu.cn,免费提供全部课件资源、源代码和数据。相关资料也可以到中南大学出版社的网站下载。

另外,本书部分内容参考了大量的公开资料和网络上的资源,对他们的工作致以深切的感谢。需要指出的是,数据科学与大数据技术是一个全新的专业,因此编写一本完美的大数据编程教材绝非易事。由于水平有限,书中难免存在疏漏或者错误,希望广大读者不吝赐教。如有任何建议、意见或者疑问,请及时联系作者,以期在后续版本中改进和完善



资料目录:

1Spark概述   1

1.1 Spark的背景  (1

1.1.1 Spark发展史   (1

1.1.2 Spark的特点   (2

1.2 Spark生态系统  (3

1.2.1 Spark Core  3

1.2.2 Spark SQL   4

1.2.3 Spark Streaming   4

1.2.4 GraphX   5

1.2.5 MLBase/MLlib   5

1.2.6 SparkR   5

1.3 Spark运行架构  (6

1.3.1相关术语   (6

1.3.2 Spark架构   (7

1.3.3执行步骤   (8

1.3.4 Spark运行模式   (10

1.4 WordCount示例  (13

1.4.1三种编程语言的示例程序   (13

1.4.2 Scala版本WordCount运行分析   (16

1.4.3 WordCount中的类调用关系   (18

1.5本章小结  (19

思考与习题  (19)  

2章 搭建Spark开发环境   20

2.1 Spark开发环境所需软件  (20) 

2.2安装Spark  21

2.2.1 spark-shell下的实例   (25)        

2.2.2 SparkWEB的使用   (26

2.3 IDEA  28

2.3.1安装IDEA   28

2.3.2 IDEA的实例(Scala)   (32

2.3.3 IDEA打包运行   (37

2.4 Eclipse  40

2.4.1安装Eclipse   40)         

2.4.2 Eclipse的实例(Scala)   (41

2.5本章小结  (46

思考与习题  (47)  

3Scala语言基础   48

3.1 Scala简介  (48

3.1.1 Scala特点   (48

3.1.2 Scala运行方式   (48

3.2变量与类型  (50

3.2.1变量的定义与使用   (50

3.2.2基本数据类型和操作   (56

3.2.3 Range操作   (61

3.3程序控制结构  (62

3.3.1 if条件表达式   (62

3.3.2循环表达式   (66

3.3.3匹配表达式   (70

3.4集合  (73

3.4.1数组   (73

3.4.2列表   (78

3.4.3集   (81

3.4.4映射   (85)         

3.4.5 Option   90

3.4.6迭代器与元组   (92

3.5函数式编程  (95)         

3.5.1函数   (95

3.5.2占位符语法   (97)         

3.5.3递归函数   (99

3.5.4嵌套函数   (101)         

3.5.5高阶函数   (102)         

3.5.6高阶函数的使用   (104

3.6本章小结  (108

思考与习题  (108

4Scala面向对象编程   110

4.1类与对象  (110

4.1.1定义类   (110)        

4.1.2创建对象   (111

4.1.3类成员的访问   (112

4.1.4构造函数   (113)         

4.1.5常见对象类型   (116)         

4.1.6抽象类与匿名类   (118

4.2继承与多态  (120

4.2.1类的继承   (121

4.2.2构造函数执行顺序   (124)         

4.2.3方法重写   (125)         

4.2.4多态   (127

4.3特质(trait)  (128)         

4.3.1特质的使用   (129

4.3.2特质与类   (132

4.3.3多重继承   (135

4.4导入和包  (137)         

4.4.1包   (137

4.4.2 import高级特性   (138

4.5本章小结  (141

思考与习题  (141)  

5RDD编程   143

5.1 RDD基础  (143

5.1.1 RDD的基本特征   (143

5.1.2依赖关系   (144

5.2创建RDD  148)         

5.2.1从已有集合创建RDD   148

5.2.2从外部存储创建RDD   149

5.3 RDD操作  (150

5.3.1 Transformation操作   (151

5.3.2 Action操作   (159

5.3.3不同类型RDD之间的转换   (166

5.4数据的读取与保存  (168

5.5 RDD缓存与容错机制  (170

5.5.1 RDD的缓存机制(持久化)   (170

5.5.2 RDD检查点容错机制   (173

5.6综合实例  (174

5.7本章小结  (179

思考与习题  (180)  

6Spark SQL   181

6.1 Spark SQL概述  (181

6.1.1 Spark SQL架构   (181

6.1.2程序主入口SparkSession   182

6.1.3 DataFrameRDD   184

6.2创建DataFrame  185

6.2.1从外部数据源创建DataFrame   185

6.2.2 RDD转换为DataFrame   199

6.3 DataFrame操作  (203

6.3.1 Transformation操作   (204

6.3.2 Action操作   (216

6.3.3保存操作   (219

6.4 Spark SQL实例  (220

6.5本章小结  (226

思考与习题  (226


 

------分隔线----------------------------

锋哥公众号


锋哥微信


关注公众号
【Java资料站】
回复 666
获取 
66套java
从菜鸡到大神
项目实战课程

锋哥推荐