失效链接处理 |
机器学习在线:解析阿里云机器学习平台 PDF 下载
转载自:https://download.csdn.net/download/chenyao1994/11197188
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/25141839.html
相关截图:
资料简介:
以机器学习中的典型案例为主线,条分缕析梳理阿里云的平台功能,讲解如何用阿里云的机器学习平台来实现各类应用,包括商家作弊检测、生存预测、信用风险预测、用户购买行为预测等,并完整地介绍了机器学习的基本原理与实践技巧。
资料目录:
第1章 阿里云机器学习 1 1.1 产品特点 1 1.2 名词解释 2 1.3 构建机器学习实验 3 1.3.1 新建实验 3 1.3.2 使用组件搭建工作流 4 1.3.3 运行实验、查看结果 5 1.3.4 模型部署、在线预测 6 第2章 商家作弊行为检测 7 2.1 数据探索 8 2.2 建模、预测和评估 15 2.3 尝试其他分类模型 19 2.4 判断商家作弊 24 第3章 生存预测 27 3.1 数据集一 27 3.1.1 特征分析 28 3.1.2 生存预测 33 3.2 数据集二 36 3.2.1 随机森林模型 39 3.2.2 朴素贝叶斯模型 47 第4章 信用风险预测 50 4.1 整体流程 53 4.1.1 特征哑元化 54 4.1.2 特征重要性 57 4.2 模型效果评估 61 4.3 减少模型特征的个数 62 第5章 用户购买行为预测 65 5.1 数据探索 66 5.2 思路 68 5.2.1 用户和品牌的各种特征 69 5.2.2 二分类模型训练 71 5.3 计算训练数据集 71 5.3.1 原始数据划分 72 5.3.2 计算特征 74 5.3.3 计算标签 89 5.4 二分类模型训练 90 5.4.1 正负样本配比 90 5.4.2 逻辑回归算法 92 5.4.3 随机森林算法 94 第6章 聚类与分类 96 6.1 数据可视化 97 6.2 K-Means聚类 98 6.2.1 聚类、评估流程 100 6.2.2 聚成两类 101 6.2.3 聚成三类 103 6.3 K最近邻算法 104 6.3.1 使用KNN算法进行分类 105 6.3.2 算法比较 108 6.4 多分类模型 109 6.4.1 使用朴素贝叶斯算法 109 6.4.2 使用逻辑回归多分类算法 112 6.4.3 使用随机森林算法 115 6.4.4 各多分类模型效果对比 118 第7章 葡萄酒品质预测 119 7.1 数据探索 120 7.2 线性回归 123 7.3 GBDT回归 125 第8章 文本分析 127 8.1 分词 128 8.2 词频统计 130 8.3 单词的区分度 131 8.4 字符串比较 133 8.5 抽取关键词、关键句 139 8.5.1 原理简介 139 8.5.2 完整流程 141 8.6 主题模型 146 8.6.1 LDA模型 147 8.6.2 新闻的主题模型 149 8.6.3 数据预处理 150 8.6.4 主题与原始分类的关系 153 8.7 单词映射为向量 160 8.7.1 相近单词 162 8.7.2 单词聚类 165 8.8 组件使用小结 168 第9章 基于用户退货描述的赔付预测 170 9.1 思路 171 9.2 训练集的特征生成 173 9.3 测试集的特征生成 180 9.4 模型训练、预测、评估 181 9.5 提高召回率 185 第10章 情感分析 189 10.1 词袋模型 190 10.1.1 训练集的特征生成 192 10.1.2 测试集的特征生成 196 10.1.3 模型训练、预测、评估 197 10.2 词向量模型 200 10.2.1 特征生成 201 10.2.2 模型训练 206 第11章 影片推荐 211 11.1 协同过滤 212 11.2 整体流程 213 11.3 预处理,过滤出好评信息 215 11.4 计算影片间的相似度 215 11.5 计算用户可能喜欢的影片 221 11.6 查看推荐效果 224 第12章 支持深度学习框架 227 12.1 TensorFlow组件简介 227 12.2 Softmax模型 231 12.3 深度神经网络 234 附录A 237 |