【编辑推荐】

商务数据分析与应用


【内容简介】

本书包括商务数据分析的理论、方法和案例,分为三篇。篇:基础理论篇。介绍了商务数据分析的基础理论及 Python等数据分析工具。第二篇方法篇,包括数据清晰和数据预处理等方法以及近年来流行的策树、支持向量机、集成学习、等深度学习方法及其在商务数据分析中的应用。第三篇:案例篇。开发了二手车交易价格预测、电商企业商品销量预测、地区物流需求量预测3个商务数据分析的综合项目开发实例。本书注重理论联系实际,提供丰富的案例及代码,让读者可以在实践中学习和掌握**的商务数据分析方法。


【目录】

第1篇基础篇
第1章商务数据分析理论基础2
1.1商务数据类型2
1.2商务数据分析流程2
1.3商务数据分析阶段和方法3
1.3.1商务数据分析的阶段3
1.3.2商务数据分析的方法4
1.4用Python进行商务数据分析5
课后习题5
第2章Python基础知识6
2.1Python环境搭建6
2.1.1Python版本6
2.1.2安装Anaconda发行版6
2.1.3检验安装是否成功11
2.2Python解释器12
2.2.1数据类型12
2.2.2变量13
2.2.3列表13
2.2.4字典14
2.2.5布尔型15
2.2.6if语句15
2.2.7for语句16
2.2.8函数16
2.3NumPy16
2.3.1导入NumPy17
2.3.2生成NumPy数组17
2.3.3NumPy的算术运算17
2.3.4NumPy的N维数组18
2.3.5广播19
2.3.6访问元素19
2.4Pandas20
2.4.1Series21
2.4.2DataFrame25
2.4.3索引对象31
2.5Matplotlib33
2.5.1绘制简单图形33
2.5.2Pyplot的功能34
2.5.3显示图像35
课后习题35
第2篇方法篇
第3章商务数据分析方法概述37
3.1数据预处理37
3.2特征工程37
3.3机器学习方法37
3.4深度学习方法38
3.4.1深度学习简介38
3.4.2深度学习方法简介40
3.4.3深度学习框架40
课后习题47
第4章数据预处理48
4.1数据探索性分析48
4.2数据清洗50
4.2.1缺失值处理50
4.2.2异常值处理51
4.2.3泰坦尼克号数据清洗过程52
4.3数据重构53
4.4数据可视化55
4.5冰箱订单数据预处理60
4.5.1数据集信息60
4.5.2缺失值处理61
4.5.3订单分析62
课后习题73
第5章特征工程74
5.1特征缩放74
5.1.1归一化74
5.1.2正则化75
5.2特征编码75
5.2.1序号编码75
5.2.2独热编码76
5.2.3二进制编码76
5.2.4多元化77
5.2.5离散化77
5.3特征提取78
5.3.1主成分分析78
5.3.2线性判别分析79
5.3.3独立成分分析79
5.4特征选择79
5.4.1特征选择原理80
5.4.2过滤式选择81
5.4.3包裹式选择82
5.4.4嵌入式选择82
5.5特征构建83
5.6泰坦尼克号数据特征工程83
5.6.1缺失值填充83
5.6.2编码分类变量83
课后习题84
第6章决策树方法及其应用85
6.1决策树简介85
6.2决策树的构造过程86
6.2.1特征选择86
6.2.2决策树生成87
6.2.3决策树剪枝87
6.3决策树算法实现87
6.3.1结点定义88
6.3.2特征选取88
6.3.3结点分裂89
6.4基于决策树的用户购买行为预测90
课后习题94
第7章支持向量机方法及其应用95
7.1分类超平面与间隔95
7.2对偶问题与拉格朗日乘子法97
7.3核函数98
7.4软间隔与正则化100
7.5基于支持向量机的鸢尾花分类预测101
课后习题104
第8章集成学习方法及其应用106
8.1Bagging算法106
8.2Boosting算法106
8.3随机森林106
8.4XGBoost算法107
8.5基于随机森林的鸢尾花分类预测108
8.6基于随机森林的泰坦尼克号生存概率预测110
8.6.1切割训练集和测试集110
8.6.2模型创建111
8.6.3输出模型预测结果111
8.6.4模型评估112
课后习题115
第9章神经网络及其应用116
9.1前馈神经网络116
9.2反馈神经网络117
9.3激活函数118
9.4损失函数121
9.4.1回归损失121
9.4.2分类损失122
9.5基于BP神经网络的港口货物吞吐量预测125
9.5.1数据描述125
9.5.2参数介绍126
9.5.3代码实现127
课后习题130
第10章卷积神经网络及其应用131
10.1卷积神经网络的结构131
10.2卷积层132
10.2.1卷积运算132
10.2.2填充132
10.2.3步幅134
10.2.4三维数据的卷积运算135
10.2.5批处理137
10.3池化层137
10.4卷积神经网络的实现138
10.5常见卷积神经网络141
10.5.1LeNet141
10.5.2AlexNet141
10.6基于卷积神经网络的股票趋势预测142
课后习题146
第11章循环神经网络及其应用147
11.1循环神经网络的记忆能力147
11.2循环神经网络的结构148
11.2.1单向循环神经网络148
11.2.2双向循环神经网络148
11.3长短期记忆网络149
11.3.1长短期记忆网络与循环神经网络的异同149
11.3.2长短期记忆网络的结构151
11.3.3长短期记忆网络变体152
11.4基于长短期记忆网络算法的通货膨胀率预测153
11.4.1业务背景分析153
11.4.2指标选择与数据说明154
11.4.3训练方法及优化器选择156
11.4.4超参数的设定和网络结构的选择156
11.4.5动态预测过程156
11.4.6预测误差指标156
11.4.7代码实现157
课后习题164
第12章深度森林及其应用165
12.1多粒度扫描165
12.2级联森林166
12.3深度森林算法流程167
12.4基于深度森林的母婴商品销量预测168
12.4.1项目分析168
12.4.2数据探索性分析168
12.4.3模型构建181
课后习题184
第3篇案例篇
第13章二手车交易价格预测186
13.1项目分析186
13.2数据预处理187
13.3特征工程197
13.4模型构建203
13.4.1XGB模型203
13.4.2XGB和LGB融合模型207
13.5预测结果对比分析211
第14章电商企业商品销量预测212
14.1项目分析212
14.2数据探索性分析214
14.3数据预处理221
14.4特征工程228
14.5模型构建239
14.5.1随机森林模型240
14.5.2XGBoost模型242
14.5.3深度神经网络模型245
14.5.4深度森林模型251
14.5.5加权深度森林模型252
14.6预测结果对比分析256
第15章区域物流需求量预测258
15.1项目分析258
15.2数据描述258
15.3模型构建259
15.4预测结果分析264
参考文献265


【前言】


随着信息技术的快速发展,企业积累了大量的数据,同时也面对着越来越激烈的竞争,迫切需要从大量数据中分析出有用的信息以辅助决策,快速应对市场的变化。因此,企业对商务数据分析人才的需求日益增长,很多大专院校开设了相关专业。但商务数据分析是一个较新的领域,随着企业数据规模越来越大,传统的数据分析方法很难满足需求,深度学习等新兴的方法在商务数据分析领域展现出了明显优势,具有广阔的应用前景。目前市面上缺乏理论联系实际,紧跟商务数据分析应用前沿的教材和参考书。
本书理论联系实际,系统讲述了商务数据分析的原理及方法,并结合案例深入阐述面向商务大数据处理的深度学习等的数据分析方法及其应用,后结合商务数据分析的3个实战案例展示了各种方法的综合应用。本书分为三篇:基础篇、方法篇和案例篇。第1篇基础篇(第1~2章),主要介绍商务数据分析的基础理论及 Python等数据分析工具。第2篇方法篇(第3~12章),主要阐述商务数据分析中的数据清理和数据预处理方法,决策树、支持向量机、集成学习、神经网络等机器学习方法,以及近年来流行的卷积神经网络、循环神经网络、深度森林等深度学习方法在商务数据分析中的应用。第3篇案例篇(第13~15章),包括二手车交易价格预测、电商企业商品销量预测、某地区物流需求量预测3个商务数据分析的综合项目开发实例。
本书系统讲述了商务数据分析的方法和技术及其应用,提供了丰富的案例和代码(相关数据集和代码可以微信扫描本书扉页的二维码获取),可以帮助读者深入浅出地理解商务数据分析的基本理论,在实践中学习和掌握的商务数据分析方法。本书可以作为大数据管理和应用、电子商务、信息管理和信息系统等专业高年级学生和管理科学与工程研究生的教材,或商务数据分析从业者的学习指导书。
本书由袁瑞萍博士、李俊韬教授编著。其中第3~12章、第14章由袁瑞萍编写,第1~2章、第13章和第15章由李俊韬编写,全书由袁瑞萍统稿。在本书写作过程中,博士生魏辉、姜盈帆,硕士生秦振波、陈宇、刘敏、杨帆、赵焕丽、傅之家、杨雅璇、邢朝阳等参与了资料搜集整理、编写代码、校对书稿等工作,在此一并感谢。
由于编者知识与水平有限,错漏之处敬请各位读者和专家批评指正。

编者202110北京


返回顶部