重磅推荐
【目录】

推荐序

中文版序

译者序

前言

致谢

1章 简介 1

1.1 如何阅读本书 2

1.2 重现性 2

一部分 R与数据挖掘简介

2章 R简介 6

2.1 R起步 6

2.2 与R控制台的简单交互 8

2.3 R对象和变量 9

2.4 R函数 11

2.5 向量 14

2.6 向量化 15

2.7 因子 16

2.8 生成序列 18

2.9 数据子集 20

2.10 矩阵和数组 22

2.11 列表 25

2.12 数据框 28

2.13 数据框的扩展 31

2.14 对象、类和方法 34

2.15 管理R会话 35

3章 数据挖掘简介 37

3.1 数据挖掘鸟瞰图 37

3.2 数据收集和业务理解 38

3.2.1 数据和数据集 39

3.2.2 导入数据到R 40

3.3 数据预处理 45

3.3.1 数据清洗 45

3.3.2 变换变量 53

3.3.3 生成变量 55

3.3.4 降维 66

3.4 建模 74

3.4.1 探索性数据分析 75

3.4.2 使用关联规则的依赖建模 94

3.4.3 聚类 101

3.4.4 异常检测 112

3.4.5 预测分析 120

3.5 评估 147

3.5.1 Holdout和随机子抽样 148

3.5.2 交叉验证 150

3.5.3 Bootstrap估计 153

3.5.4 推荐程序 154

3.6 报告和部署 155

3.6.1 通过动态文档进行报告 155

3.6.2 通过Web应用程序进行部署 158

二部分 数据挖掘案例研究

4章 预测海藻数量 164

4.1 问题描述与目标 164

4.2 数据说明 164

4.3 加载数据到R 165

4.4 数据可视化和总结 167

4.5 数据缺失 173

4.5.1 将缺失部分剔除 173

4.5.2 尝试找到缺失值有可能的赋值 175

4.5.3 通过变量的相关关系填补缺失值 176


返回顶部