失效链接处理 |
数据科学实战 PDF 下载
转载自:https://download.csdn.net/download/sinat_22510827/10224210
本站整理下载:
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/23661274.html
相关截图:
资料简介:
本书脱胎于哥伦比亚大学“数据科学导论”课程的教学讲义,它界定了数据科学的研究范畴,是一本注重人文精神,多角度、全方位、深入介绍数据科学的实用指南,堪称大数据时代的实战宝典。本书旨在让读者能够举一反三地解决重要问题,内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。另外,本书还将带领读者展望数据科学未来的发展。
资料目录:
作者介绍 关于封面图 前言 第1章简介:什么是数据科学 1.1大数据和数据科学的喧嚣 1.2冲出迷雾 1.3为什么是现在 1.4数据科学的现状和历史 1.5数据科学的知识结构 1.6思维实验:元定义 1.7什么是数据科学家 1.7.1学术界对数据科学家的定义 1.7.2工业界对数据科学家的定义 第2章统计推断、探索性数据分析和数据科学工作流程 2.1大数据时代的统计学思考 2.1.1统计推断 2.1.2总体和样本 2.1.3大数据的总体和样本 2.1.4大数据意味着大胆的假设 2.1.5建模 2.2探索性数据分析 2.2.1探索性数据分析的哲学 2.2.2练习:探索性数据分析 2.3数据科学的工作流程 2.4思维实验:如何模拟混沌 2.5案例学习:RealDirect 2.5.1RealDirect是如何赚钱的 2.5.2练一练:RealDirect公司的数据策略 第3章算法 3.1机器学习算法 3.2三大基本算法 3.2.1线性回归模型 3.2.2足近邻模型(k-NN) 3.2.3I(均值算法 3.3练习:机器学习算法基础 3.4总结 3.5思维实验:关于统计学家的自动化 第4章垃圾邮件过滤器、朴素贝叶斯与数据清理 4.1思维实验:从实例中学习 4.1.1线性回归为何不适用 4.1.2l(近邻效果如何 4.2朴素贝叶斯模型 4.2.1贝叶斯法则 4.2.2个别单词的过滤器 4.2.3直通朴素贝叶斯 4.3拉普拉斯平滑法 4.4对比朴素贝叶斯和k近邻 4.5Bash代码示例” 4.6网页抓取:APl和其他工具 4.7Jake的练习题:文章分类问题中的朴素贝叶斯模型 第5章逻辑回归 5.1思维实验 5.2分类器 5.2.1运行时间 5.2.2你自己 5.2.3模型的可解释性 5.2.4可扩展性 …… 第6章时间戳数据与金融建模 第7章从数据到结论 第8章构建面向大量用户的推荐引擎 第9章数据可视化与欺诈侦测 第10章社交网络与数据新闻学 第11章因果关系研究 第12章流行病学 第13章从竞赛中学到的:数据泄漏和模型评价 第14章数据工程:Mapreduce pregel、Hadoop 第15章听听学生学们怎么说 第16章下一代数据科学家、自大狂和职业道德 |