失效链接处理 |
深入浅出深度学习:原理剖析与python实践 PDF 下载
转载自:http://www.jb51.net/books/616471.html
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/25082459.html
相关截图:
资料简介:
本书介绍了深度学习相关的原理与应用,全书共分为三大部分,*部分主要回顾了深度学习的发展历史,以及Theano的使用;第二部分详细讲解了与深度学习相关的基础知识,包括线性代数、概率论、概率图模型、机器学习和*化算法;在第三部分中,针对若干核心的深度学习模型,如自编码器、受限玻尔兹曼机、递归神经网络和卷积神经网络等进行详细的原理分析与讲解,并针对不同的模型给出相应的具体应用。本书适合有一定高等数学、机器学习和Python编程基础的在校学生、高校研究者或在企业中从事深度学习的工程师使用,书中对模型的原理与难点进行了深入分析,在每一章的*后都提供了详细的参考文献,读者可以对相关的细节进行更深入的研究。*后,理论与实践相结合,本书针对常用的模型分别给出了相应的应用,读者也可以在Github中下载和查看本书的代码(https://github.com/innovation-cat/DeepLearningBook)
资料目录:
1 绪论 1 1.1 人工智能、机器学习与深度学习的关系 2 1.1.1 人工智能——机器推理 3 1.1.2 机器学习——数据驱动的科学 4 1.1.3 深度学习——大脑的仿真 7 1.2 深度学习的发展历程 7 1.3 深度学习技术概述 9 1.3.1 从低层到高层的特征抽象 10 1.3.2 让网络变得更深 12 1.3.3 自动特征提取 13 1.4 深度学习框架 14 2 Theano基础 18 2.1 符号变量 19 2.2 符号计算的抽象——符号计算图模型 22 2.3 函数 25 2.3.1 函数的定义 25 2.3.2 Logistic回归 26 2.3.3 函数的复制 28 2.4 条件表达式 30 2.5 循环 31 2.6 共享变量 38 2.7 配置 38 2.7.1 通过THEANO_FLAGS配置 39 2.7.2 通过.theanorc文件配置 40 2.8 常用的Debug技巧 41 2.9 小结 42 3 线性代数基础 43 3.1 标量、向量、矩阵和张量 43 3.2 矩阵初等变换 44 3.3 线性相关与向量空间 45 3.4 范数 46 3.4.1 向量范数 46 3.4.2 矩阵范数 49 3.5 特殊的矩阵与向量 52 3.6 特征值分解 53 3.7 奇异值分解 55 3.8 迹运算 56 3.9 样例:主成分分析 57 4 概率统计基础 61 4.1 样本空间与随机变量 62 4.2 概率分布与分布函数 62 4.3 一维随机变量 63 4.3.1 离散随机变量和分布律 63 4.3.2 连续随机变量和概率密度函数 64 4.4 多维随机变量 65 4.4.1 离散型二维随机变量和联合分布律 66 4.4.2 连续型二维随机变量和联合密度函数 66 4.5 边缘分布 67 4.6 条件分布与链式法则 68 4.6.1 条件概率 68 4.6.2 链式法则 70 4.7 多维随机变量的独立性分析 70 4.7.1 边缘独立 71 4.7.2 条件独立 71 4.8 数学期望、方差、协方差 72 4.8.1 数学期望 72 4.8.2 方差 73 4.8.3 协方差 73 4.8.4 协方差矩阵 75 4.9 信息论基础 78 4.9.1 信息熵 78 4.9.2 条件熵 80 4.9.3 互信息 81 4.9.4 交叉熵与相对熵 81 5 概率图模型 84 5.1 生成模型与判别模型 86 5.2 图论基础 87 5.2.1 图的结构 87 5.2.2 子图 88 5.2.3 路径、迹、环与拓扑排序 89 5.3 贝叶斯网络 93 5.3.1 因子分解 93 5.3.2 局部马尔科夫独立性断言 96 5.3.3 I-Map与因子分解 97 5.3.4 有效迹 101 5.3.5 D-分离与全局马尔科夫独立性 105 5.4 马尔科夫网络 106 5.4.1 势函数因子与参数化表示 106 5.4.2 马尔科夫独立性 108 5.5 变量消除 112 5.6 信念传播 113 5.6.1 聚类图 113 5.6.2 团树 117 5.6.3 由变量消除构建团树 121 5.7 MCMC采样 124 5.7.1 随机采样 124 5.7.2 随机过程与马尔科夫链 126 5.7.3 MCMC采样 129 5.7.4 Gibbs采样 131 5.8 参数学习 134 5.8.1 最大似然估计 134 5.8.2 期望最大化算法 135 5.9 小结 137 6 机器学习基础 140 6.1 线性模型 141 6.1.1 线性回归 141 6.1.2 Logistic回归 146 6.1.3 广义的线性模型 148 6.2 支持向量机 149 6.2.1 最优间隔分类器 150 6.2.2 对偶问题 153 6.2.3 核函数 154 6.3 朴素贝叶斯 158 6.4 树模型 160 6.4.1 特征选择 161 6.4.2 剪枝策略 163 6.5 聚类 164 6.5.1 距离度量 165 6.5.2 层次聚类 166 6.5.3 K-means聚类 169 6.5.4 谱聚类 170 7 数值计算与最优化 176 7.1 无约束极小值的最优化条件 176 7.2 梯度下降 178 7.2.1 传统更新策略 180 7.2.2 动量更新策略 182 7.2.3 改进的动量更新策略 183 7.2.4 自适应梯度策略 186 7.3 共轭梯度 187 7.4 牛顿法 191 7.5 拟牛顿法 193 7.5.1 拟牛顿条件 193 7.5.2 DFP算法 194 7.5.3 BFGS 195 7.5.4 L-BFGS 196 7.6 约束最优化条件 199 8 前馈神经网络 204 8.1 生物神经元结构 205 8.2 人工神经元结构 206 8.3 单层感知机 207 8.4 多层感知机 210 8.5 激活函数 214 8.5.1 激活函数的作用 215 8.5.2 常用的激活函数 217 9 反向传播与梯度消失 224 9.1 经验风险最小化 225 9.2 梯度计算 227 9.2.1 输出层梯度 227 9.2.2 隐藏层梯度 229 9.2.3 参数梯度 233 9.3 反向传播 234 9.4 深度学习训练的难点 235 9.4.1 欠拟合——梯度消失 236 9.4.2 过拟合 239 10 自编码器 242 10.1 自编码器 242 10.2 降噪自编码器 244 10.3 栈式自编码器 246 10.4 稀疏编码器 249 11 玻尔兹曼机 255 11.1 玻尔兹曼机 255 11.2 能量模型 258 11.2.1 能量函数 258 11.2.2 从能量函数到势函数 259 11.2.3 从势函数到概率分布 260 11.3 推断 261 11.3.1 边缘分布 262 11.3.2 条件分布 264 11.4 学习 267 11.4.1 最大似然估计 268 11.4.2 对比散度 271 11.5 应用:个性化推荐 273 11.5.1 个性化推荐概述 273 11.5.2 个性化推荐架构与算法 276 11.5.3 RBM与协同过滤 282 12 递归神经网络 288 12.1 Elman递归神经网络 289 12.2 时间反向传播 292 12.3 长短时记忆网络 296 12.4 结构递归神经网络 299 12.5 应用:语言模型 304 12.5.1 N元统计模型 305 12.5.2 基于递归网络的语言模型 309 参考文献: 312 13 卷积神经网络 314 13.1 卷积运算 315 13.2 网络结构 318 13.3 卷积层 320 13.4 池化层 325 13.5 应用:文本分类 329 |