失效链接处理 |
Python全栈数据工程师养成攻略 PDF 下载 转载自:https://download.csdn.net/download/baidu_29099401/10509699
本站整理下载:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://e.dangdang.com/products/1900783015.html
相关截图:
图书简介: 本书首先介绍了数据工程和Python语法,随后讲解如何获取和存储数据,并实现简单的静态可视化。文本作为一种极其重要的数据类型,也单独列出一章行讨论。之后读者将学习到关于Web建站的一些基础和阶知识,并基于多种工具完成丰富的动态可视化。这本书选取了机器学习和深度学习两大热门领域的核心内容,为读者一步实现数据价值的深度分析和挖掘下坚实基础。 本书首先介绍了数据工程和Python语法,随后讲解如何获取和存储数据,并实现简单的静态可视化。文本作为一种极其重要的数据类型,也单独列出一章行讨论。之后读者将学习到关于Web建站的一些基础和阶知识,并基于多种工具完成丰富的动态可视化。这本书选取了机器学习和深度学习两大热门领域的核心内容,为读者一步实现数据价值的深度分析和挖掘下坚实基础。 【推荐语】 1.上海交通大学机器学习、人工智能专家亲笔力作。 2.超过900分钟的全程视频讲解,扫一扫二维码,跟着视频轻松学。 3.网易云课堂同名人气课程,全部五星好评。 【作者】 张宏伦 上海交通大学电子系,研究方向为机器学习、人工智能和自然语言理解,宏伦工作室创始人。 爱好数据,具有金融、交通、气象、新闻、法律等多个领域的数据分析和项目发经验。业余时间热衷参加各类数据赛事,曾获得首届拍拍贷魔镜杯数据产品大赛金奖、天池公益云图数据可视化大赛铜奖、上海BOT大数据应用大赛二等奖等。 乐于分享,自制的《全栈数据工程师养成攻略》系列视频教程,在网易云课堂和好大学在线等多家慕课平台上获得了广泛肯定和好评。 图书目录: 内容提要 前言 第1章 写在前面 1.1 数据工程和编程语言 1.1.1 如何玩转数据 1.1.2 关于编程语言 1.2 带好装备——Python和Sublime 1.2.1 Python 1.2.2 Sublime 1.2.3 运行Python代码的方法 1.2.4 Hello World 1.3 数据结构和常见类型 1.3.1 数据的结构 1.3.2 数据的类型 第2章 学会Python 2.1 Python基础语法 2.1.1 Python的特点 2.1.2 中文编码 2.1.3 变量 2.1.4 注释 2.1.5 保留名 2.1.6 行和缩进 2.1.7 运算符 2.1.8 条件 2.1.9 循环 2.1.10 时间 2.1.11 文件 2.1.12 异常 2.1.13 函数 2.1.14 补充内容 2.2 实战:西游记用字统计 2.2.1 数据 2.2.2 目标 2.2.3 步骤 2.2.4 总结 第3章 获取数据 3.1 HTTP请求和Chrome 3.1.1 访问一个链接 3.1.2 Chrome浏览器 3.1.3 HTTP 3.1.4 URL类型 3.2 使用Python获取数据 3.2.1 urllib2 3.2.2 GET请求 3.2.3 POST请求 3.2.4 处理返回结果 3.3 实战:爬取豆瓣电影 3.3.1 确定目标 3.3.2 通用思路 3.3.3 寻找链接 3.3.4 代码实现 3.3.5 补充内容 第4章 存储数据 4.1 使用XAMP搭建Web环境 4.1.1 Web环境 4.1.2 偏好设置 4.1.3 Hello World 4.2 MySQL使用方法 4.2.1 基本概念 4.2.2 命令行 4.2.3 Web工具 4.2.4 本地软件 4.3 使用Python操作数据库 4.3.1 MySQLdb 4.3.2 建立连接 4.3.3 执行操作 4.3.4 关闭连接 4.3.5 扩展内容 第5章 静态可视化 5.1 在R中进行可视化 5.1.1 下载和安装 5.1.2 R语言基础 5.1.3 ggplot2 5.1.4 R语言学习笔记 5.2 掌握ggplot2数据可视化 5.2.1 图形种类 5.2.2 基本语法 5.2.3 条形图 5.2.4 折线图 5.2.5 描述数据分布 5.2.6 分面 5.2.7 R语言数据可视化 5.3 实战:Diamonds数据集探索 5.3.1 查看数据 5.3.2 价格和克拉 5.3.3 价格分布 5.3.4 纯净度分布 5.3.5 价格概率分布 5.3.6 不同切工下的价格分布 5.3.7 坐标变换 5.3.8 标题和坐标轴标签 第6章 自然语言理解 6.1 走近自然语言理解 6.1.1 概念 6.1.2 内容 6.1.3 应用 6.2 使用jieba分词处理中文 6.2.1 jieba中文分词 6.2.2 中文分词 6.2.3 关键词提取 6.2.4 词性标注 6.3 词嵌入的概念和实现 6.3.1 语言的表示 6.3.2 训练词向量 6.3.3 代码实现 第7章 Web基础 7.1 网页的骨骼:HTML 7.1.1 HTML是什么 7.1.2 基本结构 7.1.3 常用标签 7.1.4 标签的属性 7.1.5 注释 7.1.6 表单 7.1.7 颜色 7.1.8 DOM 7.1.9 HTML5 7.1.10 补充内容 7.2 网页的血肉:CSS 7.2.1 CSS是什么 7.2.2 基本结构 7.2.3 使用CSS 7.2.4 常用选择器 7.2.5 常用样式 7.2.6 CSS3 7.2.7 CSS实例 7.2.8 补充学习 7.3 网页的关节:JS 7.3.1 JS是什么 7.3.2 使用JS 7.3.3 JS基础 7.3.4 补充学习 第8章 Web进阶 8.1 比JS更方便的JQuery 8.1.1 引入JQuery 8.1.2 语法 8.1.3 选择器 8.1.4 事件 8.1.5 直接操作 8.1.6 AJAX请求 8.1.7 补充学习 8.2 实战:你竟是这样的月饼 8.2.1 项目简介 8.2.2 首页实现 8.2.3 月饼页实现 8.2.4 项目总结 8.3 基于ThinkPHP的简易个人博客 8.3.1 ThinkPHP是什么 8.3.2 个人博客 8.3.3 下载和初始化 8.3.4 MVC 8.3.5 数据库配置 8.3.6 控制器、函数和渲染模板 8.3.7 U函数和页面跳转 8.3.8 表单实现和数据处理 8.3.9 读取数据并渲染 8.3.10 项目总结 8.4 基于Flask的简易个人博客 8.4.1 Flask是什么 8.4.2 项目准备 8.4.3 渲染模板 8.4.4 操作数据库 8.4.5 完善其他页面 8.4.6 项目总结 第9章 动态可视化 9.1 使用ECharts制作交互图形 9.1.1 ECharts是什么 9.1.2 引入Echarts 9.1.3 准备一个画板 9.1.4 绘制ECharts图形 9.1.5 使用其他主题 9.1.6 配置项手册 9.1.7 开始探索 9.2 实战:再谈豆瓣电影数据分析 9.2.1 项目成果 9.2.2 数据获取 9.2.3 数据清洗和存储 9.2.4 数据分析 9.2.5 数据可视化 9.2.6 项目总结 9.3 数据可视化之魅D3 9.3.1 D3是什么 9.3.2 D3核心思想 9.3.3 一个简单的例子 9.3.4 深入理解D3 9.3.5 开始探索 9.4 实战:星战电影知识图谱 9.4.1 项目成果 9.4.2 数据获取 9.4.3 数据分析 9.4.4 数据可视化 9.4.5 项目总结 9.5 艺术家爱用的Processing 9.5.1 Processing是什么 9.5.2 一个简单的例子 9.5.3 Processing基础 9.5.4 更多内容 9.6 实战:上海地铁的一天 9.6.1 项目成果 9.6.2 项目数据 9.6.3 项目思路 9.6.4 项目实现 9.6.5 项目总结 第10章 机器学习 10.1 明白一些基本概念 10.1.1 机器学习是什么 10.1.2 学习的种类 10.1.3 两大痛点 10.1.4 学习的流程 10.1.5 代码实现 10.2 常用经典模型及实现 10.2.1 线性回归 10.2.2 Logistic回归 10.2.3 贝叶斯 10.2.4 K近邻 10.2.5 决策树 10.2.6 支持向量机 10.2.7 K-Means 10.2.8 神经网络 10.2.9 代码实现 10.3 调参比赛大杀器XGBoost 10.3.1 为什么要调参 10.3.2 XGBoost是什么 10.3.3 XGBoost安装 10.3.4 XGBoost模型参数 10.3.5 XGBoost调参实战 10.3.6 总结 10.4 实战:微额借款用户人品预测 10.4.1 项目背景 10.4.2 数据概况 10.4.3 缺失值处理 10.4.4 特征工程 10.4.5 特征选择 10.4.6 模型设计 10.4.7 项目总结 第11章 深度学习 11.1 初探Deep Learning 11.1.1 深度学习是什么 11.1.2 神经元模型 11.1.3 全连接层 11.1.4 代码实现 11.2 用于处理图像的CNN 11.2.1 CNN是什么 11.2.2 CNN核心内容 11.2.3 CNN使用方法 11.2.4 CNN模型训练 11.2.5 代码实现 11.3 用于处理序列的RNN 11.3.1 RNN是什么 11.3.2 RNN模型结构 11.3.3 LSTM 11.3.4 RNN使用方法 11.3.5 代码实现 11.4 实战:多种手写数字识别模型 11.4.1 手写数字数据集 11.4.2 全连接层 11.4.3 CNN实现 11.4.4 RNN实现 11.4.5 实战总结 第12章 数据的故事 12.1 如何讲一个好的故事 12.1.1 为什么要做PPT 12.1.2 讲一个好的故事 12.1.3 用颜值加分 12.1.4 总结 12.2 实战:有内容有颜值的分享 12.2.1 SODA 12.2.2 公益云图 12.2.3 上海BOT
12.2.4 总结 |