重磅推荐
【产品特色】

【内容简介】
本书共分9章,主要内容有:第1章总结机器学习项目的推进流程。第2章介绍机器学习的主要功能和各种算法。第3章以垃圾邮件判别为例,介绍对学习完成后的预测模型进行离线评价的方法。第4章梳理在计算机系统里集成机器学习功能的模式,同时介绍机器学习基础的日志设计。第5章介绍机器学习分类任务里的正确答案数据的获取方法。第6章介绍用于验证实施方案是否真正有效的统计鉴定、因果推理,以及A/B试验等方法。第3章是预测模型的离线验证,本章则介绍实施过程中的实时验证。第7章以电影推荐为例,学习推荐预测系统的开发实现案例。第8章阐述搜索式分析过程及分析报告,结合在第1章的机器学习流程中出现的“不执行机器学习的例子”,介绍如何整理实际分析结果的相关心得。第9章采用所谓Uplift Modeling方法学习更有效的营销方法。
【作者简介】
Michiaki Ariga,东京工业大学计算机工程学博士毕业,现为东京大学教授、日本国立信息学研究所客座教授。主要从事机器学习的理论研究和算法开发,以及在信号和图像处理等方面的应用。2011年获日本信息处理学会长尾真纪念特别奖。著有《统计机器学习》等。
【目录】

前言 .. 1

*部分

第1章 机器学习项目流程 .11

1.1 如何利用机器学习 11

1.2 机器学习项目的流程 13

1.3 实际系统中的机器学习问题的处理方法 27

1.4 机器学习系统的成功要素 32

1.5 小结 34

第2章 机器学习的用途 35

2.1 算法选择 35

2.2 分类 37

2.3 回归 69

2.4 聚类与降维 72

2.5 其他 74

2.6 小结 76

第3章 学习结果的评价 77

3.1 分类的评价矩阵 77

3.2 回归的评价 86

3.3 机器学习系统的A/B测试 88

3.4 小结 89

第4章 机器学习系统的开发 91

4.1 机器学习系统的开发流程 91

4.2 系统设计 92

4.3 日志设计 105

4.4 小结 110

第5章 机器学习资源的收集 111

5.1 机器学习资源的获取 111

5.2 利用公开的数据集或模型 113

5.3 开发者自己创建训练数据 114

5.4 他人帮忙输入数据 116

5.5 数据创建众包 117

5.6 基于服务的用户输入 119

5.7 小结 120

第6章 效果验证 121

6.1 效果验证概述 121

6.2 假设检验的框架 125

6.3 假设检验的注意事项 131

6.4 因果效应的推断 137

6.5 A/B测试 141

6.6 小结 144

第二部分

第7章 电影推荐系统 147

7.1 概述 147

7.2 推荐系统功能 149

7.3 MovieLens的数据趋势 159

7.4 推荐系统的开发 165

7.5 小结 . 176

第8章 Kickstarter的数据分析 177

8.1 Kickstarter的API 177

8.2 Kickstarter的网络爬虫 178

8.3 数据变换 . 180

8.4 浏览Excel数据 . 181

8.5 数据透视表 185

8.6 达成目标却被取消的项目 190

8.7 国别的项目分析 192

8.8 形成分析报告 194

8.9 进一步的工作 204

8.10 小结 204

第9章 基于Uplift Modeling的营销资源效率分析207

9.1 Uplift Modeling的四象限分区 208

9.2 扩展A/B测试的Uplift Modeling的概要 210

9.3 Uplift Modeling的数据集生成 211

9.4 利用两个预测模型的Uplift Modeling . 214

9.5 Uplift Modeling的评价方法 . 218

9.6 实际应用 . 224

9.7 实际应用Uplift Modeling的相关事项 . 231

9.8 小结 . 233

参考文献 235

后记 .239

致谢 .241


返回顶部