失效链接处理 |
R并行编程实战 PDF 下载
转载自:https://download.csdn.net/download/waiyu995/10385141
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/25192671.html
相关截图:
资源简介: 本书是一本构建大规模高效算法的综合性实用书籍,介绍各种并行技术,从R语言的并行版本lapply()的简单应用到基于Hadoop和ApacheSpark框架的高级AWS云。在本书的后,你将了解到影响并行效率的因素,包括:评估代码性能和实现负载平衡;要避免的陷阱,包括死锁和数值不稳定问题;对于你的项目,如何为适合的并行类型构建代码和数据;如何在各种计算机系统中运行R代码获取佳性能。本书针对那些想要超越单线程和内存限制的R程序员,使其从中学习如何实现高效大规模算法,这是对大数据高性能处理的必要条件。 资源目录: 目录 Contents 译者序 前言 关于作者 第1章 简单的R并行性1 1.1 亚里士多德数谜2 1.1.1 求解程序的实现2 1.1.2 改进求解程序6 1.1.3 将问题分解为多个任务10 1.2 R的并行包14 1.2.1 使用mclapply()15 1.2.2 使用parLapply()19 1.2.3 并行负载均衡21 1.3 segue包23 1.3.1 安装segue24 1.3.2 设置AWS账户25 1.3.3 运行segue27 1.3.4 求解亚里士多德数谜32 1.4 总结34 第2章 消息传递入门36 2.1 为MPI设置系统环境36 2.1.1 为MPI选择R包37 2.1.2 选择MPI子系统37 2.1.3 安装OpenMPI38 2.2 MPI标准39 2.2.1 MPI的世界39 2.2.2 安装Rmpi40 2.2.3 安装pbdMPI41 2.3 MPI API43 2.3.1 点对点阻塞通信44 2.3.2 点对点非阻塞通信56 2.3.3 集体通信60 2.4 总结65 第3章 高级消息传递66 3.1 网格并行性66 3.1.1 创建网格集群68 3.1.2 边界数据交换70 3.1.3 中值滤波73 3.1.4 平铺分配图像74 3.1.5 中值滤波网格程序76 3.2 检查和管理通信84 3.3 lapply()的函数变体87 3.4 总结89 第4章 开发SPRINT—超级计算机的基于MPI的R包90 4.1 关于ARCHER91 4.2 从R中调用MPI代码92 4.2.1 MPI Hello World92 4.2.2 从R中调用C94 4.3 建立一个MPI R包—SPRINT97 4.3.1 简单的并行R接口(SPRINT)包97 4.3.2 SPRINT包的体系结构99 4.4 将一个新函数添加到SPRINT包中100 4.4.1 下载SPRINT源代码101 4.4.2 在R中创建一个存根—phello.R102 4.4.3 添加接口函数—phello.c103 4.4.4 添加实现函数—hello.c105 4.4.5 连接存根、接口和实现106 4.4.6 编译并运行SPRINT代码110 4.5 基因组学分析案例研究112 4.5.1 基因组学113 4.5.2 基因组数据115 4.6 基因组学与超级计算机116 4.6.1 目标116 4.6.2 ARCHER超级计算机116 4.6.3 随机森林120 4.6.4 基因组分析案例研究的数据122 4.6.5 ARCHER中的随机森林性能122 4.6.6 排名产品127 4.6.7 ARCHER中的排名产品性能128 4.6.8 结论131 4.7 总结132 第5章 笔记本中的超级计算机133 5.1 OpenCL133 5.2 ROpenCL包142 5.2.1 ROpenCL编程模型142 5.2.2 距离矩阵示例153 5.3 总结161 第6章 并行程序设计的艺术162 6.1 理解并行效率163 6.1.1 加速比163 6.1.2 阿姆达尔定律164 6.1.3 并行或者不并行165 6.2 数值逼近167 6.3 随机数170 6.4 死锁172 6.5 减少并行开销175 6.6 自适应负载均衡178 6.6.1 任务场178 6.6.2 有效的网格处理179 6.6.3 成功并行化的3个步骤180 6.6.4 未来将会怎样181 6.6.5 混合并行性184 6.7 总结185 |