失效链接处理 |
深入浅出Pandas:利用Python进行数据处理与分析 李庆辉 PDF 下载
下载地址:
版权归出版社和原作者所有,链接已删除,请购买正版
用户下载说明:
电子版仅供预览,下载后24小时内务必删除,支持正版,喜欢的请购买正版书籍:
http://product.dangdang.com/677213782.html
相关截图: 资料简介:
如果你想充分发挥Python的强大作用,如果你想成为一名好的Python工程师,你应该先学好Pandas。
资料目录: 前言 第一部分 Pandas入门 第1章 Pandas简介及快速入门2 1.1 Pandas是什么2 1.1.1 Python简介2 1.1.2 Python的应用3 1.1.3 为什么不选择R4 1.1.4 Pandas简介4 1.1.5 Pandas的使用人群5 1.1.6 Pandas的基本功能5 1.1.7 Pandas的学 方法6 1.1.8 小结6 1.2 环境搭建及安装6 1.2.1 Python环境安装7 1.2.2 Anaconda简介7 1.2.3 安装miniconda8 1.2.4 多Python版本环境9 1.2.5 安装编辑器10 1.2.6 Jupyter Notebook10 1.2.7 用pip安装三方库11 1.2.8 安装Jupyter Notebook12 1.2.9 启动Jupyter Notebook12 1.2.10 使用Jupyter Notebook13 1.2.11 安装Pandas14 1.2.12 小结14 1.3 Pandas快速入门14 1.3.1 安装导入14 1.3.2 准备数据集15 1.3.3 读取数据15 1.3.4 查看数据16 1.3.5 验证数据17 1.3.6 建立索引17 1.3.7 数据选取18 1.3.8 排序19 1.3.9 分组聚合19 1.3.10 数据转换20 1.3.11 增加列21 1.3.12 统计分析21 1.3.13 绘图21 1.3.14 导出24 1.3.15 小结24 1.4 本章小结24 第2章 数据结构25 2.1 数据结构概述25 2.1.1 什么是数据25 2.1.2 什么是数据结构26 2.1.3 小结26 2.2 Python的数据结构26 2.2.1 数字27 2.2.2 字符串27 2.2.3 布尔型28 2.2.4 列表29 2.2.5 元组30 2.2.6 字典30 2.2.7 集合31 2.2.8 小结32 2.3 NumPy32 2.3.1 NumPy简介33 2.3.2 数据结构33 2.3.3 创建数据34 2.3.4 数据类型34 2.3.5 数组信息35 2.3.6 统计计算35 2.3.7 小结35 2.4 Pandas的数据结构35 2.4.1 Series36 2.4.2 DataFrame36 2.4.3 索引37 2.4.4 小结38 2.5 Pandas生成数据38 2.5.1 导入Pandas38 2.5.2 创建数据38 2.5.3 生成Series40 2.5.4 生成DataFrame41 2.5.5 小结43 2.6 Pandas的数据类型43 2.6.1 数据类型查看43 2.6.2 常见数据类型44 2.6.3 数据检测44 2.6.4 小结45 2.7 本章小结45 第二部分 Pandas数据分析基础 第3章 Pandas数据读取与输出48 3.1 数据读取48 3.1.1 CSV文件49 3.1.2 Excel49 3.1.3 JSON 50 3.1.4 HTML50 3.1.5 剪贴板51 3.1.6 SQL51 3.1.7 小结52 3.2 读取CSV52 3.2.1 语法52 3.2.2 数据内容53 3.2.3 分隔符53 3.2.4 表头54 3.2.5 列名54 3.2.6 索引54 3.2.7 使用部分列54 3.2.8 返回序列55 3.2.9 表头前缀55 3.2.10 处理重复列名55 3.2.11 数据类型55 3.2.12 引擎55 3.2.13 列数据处理56 3.2.14 真假值转换56 3.2.15 跳过指定行56 3.2.16 读取指定行57 3.2.17 空值替换57 3.2.18 保留默认空值57 3.2.19 日期时间解析58 3.2.20 文件处理59 3.2.21 符号60 3.2.22 小结61 3.3 读取Excel61 3.3.1 语法61 3.3.2 文件内容62 3.3.3 表格62 3.3.4 表头62 3.3.5 列名62 3.3.6 其他62 3.3.7 小结63 3.4 数据输出63 3.4.1 CSV63 3.4.2 Excel63 3.4.3 HTML64 3.4.4 数据库(SQL)64 3.4.5 Markdown65 3.4.6 小结65 3.5 本章小结65 第4章 Pandas基础操作66 4.1 索引操作66 4.1.1 认识索引66 4.1.2 建立索引67 4.1.3 重置索引68 4.1.4 索引类型68 4.1.5 索引对象69 4.1.6 索引的属性70 4.1.7 索引的操作70 4.1.8 索引重命名72 4.1.9 修改索引内容72 4.1.10 小结73 4.2 数据的信息73 4.2.1 查看样本73 4.2.2 数据形状74 4.2.3 基础信息74 4.2.4 数据类型74 4.2.5 行列索引内容75 4.2.6 其他信息75 4.2.7 小结75 4.3 统计计算76 4.3.1 描述统计76 4.3.2 数学统计77 4.3.3 统计函数78 4.3.4 非统计计算79 4.3.5 小结80 4.4 位置计算80 4.4.1 位置差值diff()80 4.4.2 位置移动shift()81 4.4.3 位置序号rank()81 4.4.4 小结82 4.5 数据选择82 4.5.1 选择列83 4.5.2 切片[]83 4.5.3 按轴标签.loc84 4.5.4 按数字索引.iloc86 4.5.5 取具体值.at/.iat86 4.5.6 获取数据.get86 4.5.7 数据截取.truncate87 4.5.8 索引选择器87 4.5.9 小结87 4.6 本章小结88 第5章 Pandas高级操作89 5.1 复杂查询89 5.1.1 逻辑运算89 5.1.2 逻辑筛选数据91 5.1.3 函数筛选92 5.1.4 比较函数92 5.1.5 查询df.query()93 5.1.6 筛选df.filter()93 5.1.7 按数据类型查询93 5.1.8 小结94 5.2 数据类型转换94 5.2.1 推断类型94 5.2.2 指定类型95 5.2.3 类型转换astype()95 5.2.4 转为时间类型96 5.2.5 小结96 5.3 数据排序96 5.3.1 索引排序97 5.3.2 数值排序98 5.3.3 混合排序100 5.3.4 按值大小排序101 5.3.5 小结101 5.4 添加修改101 5.4.1 修改数值101 5.4.2 替换数据103 5.4.3 填充空值103 5.4.4 修改索引名104 5.4.5 增加列104 5.4.6 插入列df.insert()105 5.4.7 指定列df.assign()106 5.4.8 执行表达式df.eval()108 5.4.9 增加行109 5.4.10 追加合并109 5.4.11 删除110 5.4.12 删除空值111 5.4.13 小结111 5.5 高级过滤111 5.5.1 df.where()111 5.5.2 np.where()113 5.5.3 df.mask()115 5.5.4 df.lookup()116 5.5.5 小结116 5.6 数据迭代116 5.6.1 迭代Series116 5.6.2 df.iterrows()117 5.6.3 df.itertuples()117 5.6.4 df.items()118 5.6.5 按列迭代119 5.6.6 小结119 5.7 函数应用120 5.7.1 pipe()120 5.7.2 apply()121 5.7.3 applymap()123 5.7.4 map()124 5.7.5 agg()124 5.7.6 transform()125 5.7.7 copy()126 5.7.8 小结126 5.8 本章小结126 第三部分 数据形式变化 第6章 Pandas分组聚合128 6.1 概述128 6.1.1 原理128 6.1.2 groupby语法129 6.1.3 DataFrame应用分组130 6.1.4 Series应用分组131 6.1.5 小结131 6.2 分组131 6.2.1 分组对象131 6.2.2 按标签分组132 6.2.3 表达式132 6.2.4 函数分组133 6.2.5 多种方法混合134 6.2.6 用pipe调用分组方法134 6.2.7 分组器Grouper135 6.2.8 索引136 6.2.9 排序136 6.2.10 小结136 6.3 分组对象的操作136 6.3.1 选择分组137 6.3.2 迭代分组138 6.3.3 选择列139 6.3.4 应用函数apply()139 6.3.5 管道方法pipe()142 6.3.6 转换方法transform()142 6.3.7 筛选方法filter()144 6.3.8 其他功能145 6.3.9 小结146 6.4 聚合统计146 6.4.1 描述统计146 6.4.2 统计函数147 6.4.3 聚合方法agg()147 6.4.4 时序重采样方法resample()149 6.4.5 组内头尾值150 6.4.6 组内分位数150 6.4.7 组内差值1 |