【内容】
基本信息






商品名称: Excel+Python轻松掌握数据分析


出版社: 人民邮电出版社


出版时间:2023-12-01




作者:曹化宇


译者:


开本: 16开




定价: 89.80


页数:383


印次: 1




ISBN号:9787115623812


商品类型:图书


版次: 1 内容提要


本书重点介绍了目前处
理数据非常有效的工具——
Excel、Python和数据库的
应用知识。本书通过一则完
整的故事讨论了如何以
Python编程为中心,结合
Excel和数据库的特点,并
以基础统计学贯穿其中,帮
助读者深入地了解数据分析
的相关知识。在本书中,首
先,讨论了如何使用Excel
整理数据,以及Excel中数
学和统计函数的应用;其次
,探讨了与Python编程相关
的数据分析内容,包括在
Python中进行数据统计工作
,以及各种格式数据的转换
等;然后,讨论SQLite和
MySQL数据库的应用,并介
绍了如何使用Python操作数
据库;Z后,介绍了如何综
合使用Excel、数据库和
Python编程等工具打造自动
化的数据处理中心。


本书架构清晰,内容深
入浅出,案例丰富,适合需
要进行数据处理和统计分析
的职场人士、计算机爱好者
等阅读。
【目录】
目录
第1章 网店开业——初识数据
1.1 清点库存——获取原始数据
1.2 数据标准化——整理Excel数据
1.2.1 二维表
1.2.2 数据完整性与正确性
1.2.3 拆分数据——分列与公式
1.2.4 数据类型和显示格式
1.2.5 分而治之,按需组合
1.3 认识数据
1.3.1 定量数据和定性数据
1.3.2 绝对量与相对量
1.4 寻找“大客户”——排序
1.5 数据挑着看——筛选
1.6 数据交换——Excel和CSV
第2章 销量的起伏——数据背后的故事
2.1 销售数据如何——简单的统计
2.1.1 算术平均数
2.1.2 几何平均数
2.1.3 众数
2.1.4 Z小值和Z大值
2.1.5 中位数、四分位数和百分位数
2.1.6 方差和标准差
2.1.7 标准分
2.1.8 分类汇总
2.1.9 数据透视表
2.2 学看统计图
2.2.1 折线图
2.2.2 饼图
2.2.3 条形图
2.3 销量下降——是时候认真分析数据了
2.3.1 转化率——访问量和销量
2.3.2 访问量-购买量=?
第3章 凌晨3点——又加班了
3.1 多销售渠道的烦恼
3.2 日报表、月报表、年度报表等
第4章 强大的信息处理工具——Python编程
4.1 创建Python环境
4.1.1 VisualStudio
4.1.2 代码文件的编码问题
4.1.3 使用ZD版本的Python
4.1.4 设置Path环境变量
4.1.5 命令行窗口
4.1.6 Python命令行环境
4.2 编写Python代码
4.3 功能实现者——函数和lambda表达式
4.3.1 函数
4.3.2 可调用类型
4.3.3 lambda表达式
4.4 “对象”是主角——面向对象编程
4.4.1 类与对象
4.4.2 继承
4.4.3 “魔术方法”
4.4.4 with语句
4.4.5 类成员和静态方法
4.5 模块化管理
4.6 向左还是向右——代码流程控制
4.6.1 条件判断和if语句
4.6.2 循环语句
4.6.3 match语句
4.7 处理运行错误
第5章 更灵活的计算——在Python中处理数据
5.1 不一样的算术运算
5.2 随机数
5.3 序列
5.3.1 列表
5.3.2 元组
5.3.3 数列
5.4 字典
5.5 集合
5.6 更自由的排列——sorted()函数
5.7 数学计算——math模块
5.8 统计资源——statistics模块
5.8.1 使用Fraction类处理分数
5.8.2 算术平均数
5.8.3 几何平均数
5.8.4 众数
5.8.5 中位数
5.8.6 方差和标准差
5.9 计算百分位数
5.10 计算标准分数
5.11 按中文拼音排序
5.12 日期和时间
5.12.1 datetime类
5.12.2 时间间隔
5.12.3 时区
5.12.4 时间戳
5.12.5 日期和时间的推算
5.12.6 格式转换
第6章 “超能熊猫”来帮忙——pandas应用
6.1 Series对象
6.2 排序
6.3 统计方法
第7章 二维表模型——DataFrame
7.1 DataFrame对象
7.2 读取数据
7.2.1 iloc和loc属性
7.2.2 读取列
7.2.3 读取行
7.3 排序
7.4 按条件查询数据
7.5 处理空值数据
7.6 处理重复数据
7.7 数据旋转
7.8 数据合并
7.9 数据连接
7.10 统计方法
7.11 分组
7.12 透视表
第8章 图形更直观——pandas绘制统计图
8.1 部分与整体的比例——饼图
8.2 数据的关系与分布——散点图与气泡图
8.3 趋势——折线图
8.4 更直观的对比——条形图
8.5 数据的“距”——箱线图
第9章 数据中转站——数据格式转换
9.1 xlwt模块写入Excel
9.2 xlrd模块读取Excel
9.3 openpyxl模块读写Excel
9.4 pandas模块读写Excel
9.5 csv模块读写CSV数据
9.6 pandas模块读写CSV数据
第10章 强大的数据仓库——SQLite数据库
10.1 使用DBBrowserforSQLite
10.2 数据类型
10.3 数据表
10.3.1 创建表
10.3.2 表的关联——主键、唯一约束和外键
10.3.3 添加字段
10.3.4 删除表
10.3.5 sqlite_master系统表
10.3.6 索引
10.4 导入CSV数据
10.5 查询与视图
10.5.1 查询条件
10.5.2 排序
10.5.3 分组与统计
10.5.4 连接
10.5.5 联合
10.5.6 limit和offset关键字
10.5.7 exists语句
10.5.8 case语句
10.5.9 视图
10.5.10 将查询结果保存到表
10.5.11 将数据保存到CSV文件
10.6 添加数据
10.7 修改数据
10.8 删除数据
10.9 日期和时间的处理方式
第11章 Python操作SQLite
11.1 应用基础
11.1.1 执行SQL语句
11.1.2 读取查询结果
11.1.3 创建tSqlite类
11.2 查询单值
11.3 查询单条记录
11.4 查询多条记录
11.5 查询单列数据
11.6 添加数据
11.7 修改数据
11.8 删除数据
11.9 扩展操作
11.9.1 自定义函数
11.9.2 聚合函数
11.9.3 排序规则
11.10 pandas读取和写入SQLite数据
第12章 更大、更快、更强——MySQL数据库
12.1 MySQL安装与配置
12.2 使用HeidiSQL
12.3 常用数据类型
12.4 数据表
12.4.1 创建表
12.4.2 主键、唯一值和外键约束
12.4.3 修改字段定义
12.4.4 复制表结构
12.4.5 表的重命名(表的移动)
12.4.6 删除表
12.4.7 索引
12.5 导入CSV数据
12.6 查询和视图
12.6.1 查询条件与排序
12.6.2 分组与统计
12.6.3 连接
12.6.4 联合
12.6.5 limit和offset关键字
12.6.6 exists语句
12.6.7 case语句
12.6.8 视图
12.6.9 查询结果保存到表
12.6.10 查询结果导出CSV
12.7 数据添加、修改和删除
12.7.1 添加数据
12.7.2 修改数据
12.7.3 删除数据
12.8 常用函数与功能
12.8.1 统计与数学计算
12.8.2 文本操作
12.8.3 日期和时间
12.8.4 if()和ifnull()函数
12.8.5 判断对象是否存在
12.9 存储过程
第13章 Python操作MySQL
13.1 应用基础
13.1.1 连接数据库
13.1.2 执行SQL并读取查询结果
13.1.3 使用参数传递数据
13.2 创建tMySql类
13.3 查询单值
13.4 查询单条记录
13.5 查询多条记录
13.6 查询单列数据
13.7 添加记录
13.8 修改数据
13.9 删除记录
13.10 pandas读取和写入MySQL数据
第14章 数据一箩筐——打造数据中心
14.1 创建数据中心
14.2 批量导入数据
14.2.1 标准化数据
14.2.2 导入Excel数据
14.3 定时导入
14.4 处理网络数据
14.4.1 HTML表格
14.4.2 JSON
14.5 从图像中识别数据OCR)
14.5.1 图像识别——EasyOCR
14.5.2 裁剪图片
14.5.3 保存到“数据中心”
第15章 更深入的数据分析
15.1 客户的抱怨——处理文本信息
15.1.1 字符串处理
15.1.2 正则表达式
15.2 关于服装的信息
15.3 “购买指数”——产品推荐算法
第16章 早上八点,一杯咖啡,一份报表
16.1 自动生成报表
16.1.1 数据计算
16.1.2 生成Excel报表
16.2 继续前进
返回顶部