失效链接处理 |
解析深度学习 语音识别实践 PDF 下载
转载自:http://www.jb51.net/books/611168.html
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/23983230.html
相关截图:
资料简介: 本书是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。本书适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读,所有的算法及技术细节都提供了详尽的参考文献,给出了深度学习在语音识别中应用的全景。 资料目录: 译者序 iv 序 vii 前言 ix 术语缩写 xxii 符号 xxvii 第 1 章 简介 1 1.1 自动语音识别:更好的沟通之桥 . . . . . . . . . . . . . . . . . . . . . . . 1 1.1.1 人类之间的交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.1.2 人机交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 语音识别系统的基本结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 全书结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.3.1 第一部分:传统声学模型 . . . . . . . . . . . . . . . . . . . . . . 6 1.3.2 第二部分:深度神经网络 . . . . . . . . . . . . . . . . . . . . . . 6 1.3.3 第三部分:语音识别中的 DNN-HMM 混合系统 . . . . . . . . . . 7 1.3.4 第四部分:深度神经网络中的表征学习 . . . . . . . . . . . . . . 7 1.3.5 第五部分:高级的深度模型 . . . . . . . . . . . . . . . . . . . . . 7 第一部分 传统声学模型 9 第 2 章 混合高斯模型 11 2.1 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 2.2 高斯分布和混合高斯随机变量 . . . . . . . . . . . . . . . . . . . . . . . . 12 2.3 参数估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.4 采用混合高斯分布对语音特征建模 . . . . . . . . . . . . . . . . . . . . . 16 第 3 章 隐马尔可夫模型及其变体 19 3.1 介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.2 马尔可夫链 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 3.3 序列与模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 3.3.1 隐马尔可夫模型的性质 . . . . . . . . . . . . . . . . . . . . . . . . 23 3.3.2 隐马尔可夫模型的仿真 . . . . . . . . . . . . . . . . . . . . . . . . 24 3.3.3 隐马尔可夫模型似然度的计算 . . . . . . . . . . . . . . . . . . . . 24 3.3.4 计算似然度的高效算法 . . . . . . . . . . . . . . . . . . . . . . . . 26 3.3.5 前向与后向递归式的证明 . . . . . . . . . . . . . . . . . . . . . . 27 3.4 期望最大化算法及其在学习 HMM 参数中的应用 . . . . . . . . . . . . . 28 3.4.1 期望最大化算法介绍 . . . . . . . . . . . . . . . . . . . . . . . . . 28 3.4.2 使用 EM 算法来学习 HMM 参数——Baum-Welch 算法 . . . . . . 30 3.5 用于解码 HMM 状态序列的维特比算法 . . . . . . . . . . . . . . . . . . . 34 3.5.1 动态规划和维特比算法 . . . . . . . . . . . . . . . . . . . . . . . . 34 3.5.2 用于解码 HMM 状态的动态规划算法 . . . . . . . . . . . . . . . . 35 3.6 隐马尔可夫模型和生成语音识别模型的变体 . . . . . . . . . . . . . . . . 37 3.6.1 用于语音识别的 GMM-HMM 模型 . . . . . . . . . . . . . . . . . 38 3.6.2 基于轨迹和隐藏动态模型的语音建模和识别 . . . . . . . . . . . . 39 3.6.3 使用生成模型 HMM 及其变体解决语音识别问题 . . . . . . . . . 40 第二部分 深度神经网络 43 第 4 章 深度神经网络 45 4.1 深度神经网络框架 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2 使用误差反向传播来进行参数训练 . . . . . . . . . . . . . . . . . . . . . 48 4.2.1 训练准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.2.2 训练算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3 实际应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.3.1 数据预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.3.2 模型初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.3.3 权重衰减 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.3.4 丢弃法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 4.3.5 批量块大小的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.3.6 取样随机化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.3.7 惯性系数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.3.8 学习率和停止准则 . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.3.9 网络结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.3.10 可复现性与可重启性 . . . . . . . . . . . . . . . . . . . . . . . . . 62 第 5 章 高级模型初始化技术 65 5.1 受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 5.1.1 受限玻尔兹曼机的属性 . . . . . . . . . . . . . . . . . . . . . . . . 67 5.1.2 受限玻尔兹曼机参数学习 . . . . . . . . . . . . . . . . . . . . . . 70 5.2 深度置信网络预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 5.3 降噪自动编码器预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 5.4 鉴别性预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.5 混合预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 5.6 采用丢弃法的预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 第三部分 语音识别中的深度神经网络–隐马尔可夫混合模型 81 第 6 章 深度神经网络–隐马尔可夫模型混合系统 83 6 |