数据挖掘 你必须知识的32个经典案例 PDF 下载
时间:2021-03-18 09:53
来源:http://www.java1234.com
作者:转载
侵权举报
数据挖掘 你必须知识的32个经典案例 PDF 下载
失效链接处理 |
数据挖掘 你必须知识的32个经典案例 PDF 下载
本站整理下载:
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/1878659255.html
相关截图:
资料简介:
本书是为广大数据分析师量身定制的入门读物,它旨在帮助读者站在大数据时代的制高点。数据分析处于统计学、计算机信息科学、运筹学、数据库等多个领域的交叉地带,大数据时代的到来大大丰富了数据分析的内涵,数据分析师的职责与以往相比发生了巨大的改变。 本书全面介绍了经典数据分析、模式识别、机器学习、深度学习、数据挖掘、商务智能等多个领域的数据分析算法,将大数据时代的数据分析热点技术一网打尽。本书为每个数据分析算法都搭配了一个经典案例,并按照由易到难的原则构建知识框架,充分照顾了不同水平读者的阅读习惯。 通过阅读本书,读者将对大数据时代下的数据分析有一个全面的认识。无论是入门级的数据分析员还是有一定基础的数据分析师,都能通过本书完善、加深对数据分析的认识。
资料目录:
第1章 经典的探索性数据分析案例t1
1.1 探索性数据分析综述t2
1.2 数据巧收集――红牛的大数据营销案例t4
1.2.1 状况百出的红牛企业t4
1.2.2 红牛企业巧妙收集消费者数据t6
1.2.3 数据收集小结t8
1.3 数据可视化――数据新闻促使英军撤军t9
1.3.1 维基解密带来的海量数据t9
1.3.2 百花齐放的数据新闻t11
1.3.3 数据可视化小结t15
1.4 异常值分析――Facebook消灭钓鱼链接t16
1.4.1 Facebook和广告商之间的拉锯战t17
1.4.2 异常值分析指导排名算法工作t18
1.4.3 异常值分析小结t22
1.5 对比分析――TrueCar指导购物者寻找最合算的车价t24
1.5.1 火中取栗的TrueCar网站t24
1.5.2 数据对比赢得消费者信赖t26
1.5.3 对比分析小结t29
第2章 经典的相关分析与回归分析案例t31
2.1 相关回归综述t32
2.2 皮尔逊相关值――纽约市政府利用相关分析监控违法建筑t34
2.2.1 简约而不简单的消防检测系统t34
2.2.2 使用相关分析洞察60个变量的关系t36
2.2.3 相关分析小结t39
2.3 时间序列分析――人寿保险的可提费用预测t41
2.3.1 人寿保险公司和可提费用t41
2.3.2 使用四种时间序列回归预测模型解决问题t43
2.3.3 时间序列分析小结t46
2.4 线性回归分析――梅西百货公司的十二项大数据策略t48
2.4.1 从“一亿豪赌”说起的零售商困境t48
2.4.2 SAS公司帮助梅西百货构建模型t50
2.4.3 线性回归分析小结t53
2.5 Logistic回归分析――大面积流感爆发的预测分析t56
2.5.1 究竟谁才是流感预测算法之王t56
2.5.2 向Logistic算法中引入更多变量t58
2.5.3 Logistic回归分析小结t61
第3章 经典的降维数据分析案例t63
3.1 降维分析算法综述t64
3.2 粗糙集算法――协助希腊工业发展银行制定信贷政策t66
3.2.1 银行信贷政策的制定原则t66
3.2.2 粗糙集算法原理和应用t67
3.2.3 粗糙集算法小结t71
3.3 因子分析――基于李克特量表的应聘评价法t73
3.3.1 源于智力测试的因子分析t73
3.3.2 使用因子分析解构问卷t75
3.3.3 因子分析小结t78
3.4 最优尺度分析――直观评估消费者倾向的分析方法t80
3.4.1 市场调查问题催生的最优尺度分析t80
3.4.2 六种经典的最优尺度分析解读方法t82
3.4.3 最优尺度分析小结t86
3.5 PCA降维算法――智能人脸识别的应用与拓展t88
3.5.1 刷脸的时代来了t88
3.5.2 使用PCA算法完成降维工作t90
3.5.3 PCA算法小结t93
第4章 经典的模式识别案例t95
4.1 模式识别综述t96
4.2 图像分析――谷歌的超前自动驾驶技术t98
4.2.1 以安全的名义呼吁自动驾驶技术t98
4.2.2 快速成熟的无人驾驶技术t100
4.2.3 图像分析小结t103
4.3 遗传算法――经典的人力资源优化问题t105
4.3.1 使用有限资源实现利益最大化t105
4.3.2 遗传算法的计算过程t107
4.3.3 遗传算法小结t110
4.4 决策树分析――“沸腾时刻”准确判断用户健康水平t111
4.4.1 打造我国最大健身平台t111
4.4.2 信息增益和决策树t113
4.4.3 决策树小结t116
4.5 K均值聚类分析――HSE24通过为客户分类降低退货率t118
4.5.1 在电子商务市场快速扩张的HSE24t119
4.5.2 使用K均值聚类为客户分类t120
4.5.3 K均值聚类小结t123
第5章 经典的机器学习案例t127
5.1 机器学习综述t128
5.2 语义搜索――沃尔玛搜索引擎提升15%销售额t130
5.2.1 注重用户体验的沃尔玛公司t130
5.2.2 语义搜索引擎的底层技术和原理t132
5.2.3 语义搜索技术小结t135
5.3 顺序分析――搜狗输入法的智能纠错系统t137
5.3.1 搜狗输入法的王牌词库和智能算法t137
5.3.2 频繁树模式和顺序分析算法t140
5.3.3 顺序分析小结t143
5.4 文本分析――经典的垃圾邮件过滤系统t144
5.4.1 大数据时代需要文本分析工作t145
5.4.2 垃圾邮件过滤中的分词技术和词集模型t146
5.4.3 文本分析小结t149
5.5 协同过滤――构建个性化推荐系统的经典算法t151
5.5.1 协同过滤算法为什么这么流行t151
5.5.2 基于用户和基于产品的协同过滤t153
5.5.3 协同过滤算法小结t155
第6章 经典的深度学习案例t159
6.1 深度学习综述t160
6.2 支持向量机――乔布斯利用大数据对抗癌症t162
6.2.1 乔布斯和胰腺癌的八年抗战t162
6.2.2 医学统计学和支持向量机t164
6.2.3 支持向量机小结t168
6.3 感知器神经网络――最佳的房产价格预测算法t169
6.3.1 如何在我国预测房价t170
6.3.2 多层感知器和误差曲面t171
6.3.3 感知器神经网络小结t175
6.4 自组织神经网络――如何又快又好地解决旅行商问题t177
6.4.1 最优路径问题的典型模式和解决方法t177
6.4.2 自组织神经网络的拓扑结构和权值调整t178
6.4.3 自组织神经网络小结t182
6.5 RBM算法――为新闻报道智能分类t183
6.5.1 新闻报道智能分类的难与易t183
6.5.2 RBM算法的学习目标和学习方法t185
6.5.3 RBM算法小结t188
第7章 经典的数据挖掘案例t191
7.1 数据挖掘综述t192
7.2 判别分析――美国运通构建客户流失预测模型t194
7.2.1 美国运通公司的旧日辉煌t194
7.2.2 判别分析的假设条件和判别函数t196
7.2.3 判别分析小结t200
7.3 购物篮分析――找出零售业的最佳商品组合t201
7.3.1 名动天下的“啤酒和尿布”案例t202
7.3.2 购物篮分析的频繁模式t203
7.3.3 购物篮分析小结t207
7.4 马尔可夫链――准确预测客运市场占有率t208
7.4.1 复杂的客运市场系统t209
7.4.2 概率转移矩阵的求解方法t210
7.4.3 马尔可夫链小结t213
7.5 AdaBoost元算法――有效侦测欺诈交易的复合算法t215
7.5.1 弱分类器和强分类器之争t215
7.5.2 AdaBoost元算法的分类器构建方法t217
7.5.3 AdaBoost元算法小结t220
第8章 经典的商业智能分析案例t223
8.1 商业智能分析综述t224
8.2 KXEN分析软件――构建欧洲博彩业下注预测平台t226
8.2.1 现代博彩业背后的黑手t226
8.2.2 集体智慧和庄家赔率的联系t228
8.2.3 KXEN软件小结t231
8.3 数据废气再利用――物流公司数据成功用于评估客户信用t233
8.3.1 数据废气和黑暗数据的异同t234
8.3.2 论如何充分利用物流公司数据t235
8.3.3 数据废气再利用小结t239
8.4 必应预测――使用往期信息预测自然灾害t240
8.4.1 预测自然灾害的必要性t241
8.4.2 微软大数据预测的优与劣t242
8.4.3 必应预测小结t245
8.5 点球成金――助力NBA大数据分析的多种神秘软件t246
8.5.1 NBA的有效球员数据t247
8.5.2 有关点球成金的靠谱方法t249
8.5.3 点球成金小结t251
|
------分隔线----------------------------