重磅推荐
【推荐语】
1.结合具体案例,分析Python和R的特点及适用场景;

2.利用真实案例演示如何集成Python和R;

3.提供Python和R对照翻译,方便切换语言。
【作者】
里克·J.斯卡韦塔(RickJ.Scavetta)自2012年以来,一直担任着独立研讨会的培训师、自由职业数据科学家和机构联合创始人的角色。作为Scavetta Academy运营人员,与德国的主要研究机构也有着密切且经常性的往来。自2016年以来,他发布在DataCamp 上的在线课程已被超过200,000名学生学习,同时还为O'Reilly和Manning的高级数据科学课程做出了贡献。 博扬·安格洛夫(Boyan Angelov)是一位数据科学战略家和顾问,在各种学术和行业环境中拥有十余年的经验,研究涵盖的主题包括生物信息学、临床试验、人力资源技术和管理咨询。他还是XAI领域开源科学项目的贡献者,并定期在各种学术会议和社区聚会上发言。
【内容】
本书从数据科学的角度,讲解了Python和R的语言特性以及各自的优缺点,介绍了包括包、框架和工作流在内的开源生态系统,分析了Python和R分别适用于哪些业务场景,并通过真实的案例演示如何在单个工作流中集成Python与R,使两种语言充分发挥优势,改善业务应用的效果。本书还提供了Python和R的对照翻译,帮助读者在两种语言间快速切换。
本书适合数据科学领域有一定Python或R基础的开发人员阅读,能够帮助读者探索完成数据科学任务的新方法并改善应用效果。
【目录】
前言xiii
第I部分 探索新的语言
第 1章 概述3
1.1 R的起源3
1.2 Python的起源4
1.3 语言战争的开端5
1.4 数据科学主导权之战6
1.5 合作与社区建设的融合8
1.6 最后的想法8
第II部分 两种编程语言I:新学习一门语言
第 2章 针对Python用户的R13
2.1 启动和运行R13
2.2 项目和第三方库15
2.3 Tibbles的胜利20
2.4 关于数据类型和数据探索23
2.5 关于命名(内部)25
2.6 列表27
2.7 关于因子29
2.8 如何查找30
2.9 重复迭代37
2.10 最后的想法38
第3章 针对R用户的Python40
3.1 版本和构建41
3.2 标准工具42
3.3 虚拟环境46
3.4 安装第三方库50
3.5 笔记本52
3.6 从编程语言角度对比Python和R53
3.7 导入数据集55
3.8 检查数据55
3.9 数据结构和描述性统计57
3.10 数据结构:回归基础58
3.11 索引和逻辑表达式60
3.12 绘图61
3.13 推理统计61
3.14 最后的想法62
第III部分 两种编程语言II:现代的环境
第4章 数据格式环境65
4.1 外部第三方库与基础库67
4.2 图像数据69
4.3 文本数据74
4.4 时间序列数据77
4.4.1 基础R77
4.4.2 Prophet第三方库79
4.5 空间数据80
4.6 最后的想法82
第5章 工作流程环境83
5.1 定义工作流程83
5.2 探索式数据分析85
5.2.1 统计可视化85
5.2.2 交互可视化88
5.3 机器学习89
5.4 数据工程93
5.5 报表97
5.5.1 静态报表97
5.5.2 互动式报表98
5.6 最后的想法101
第IV部分 两种编程语言III:学会协同
第6章 协同使用两种语言105
6.1 虚拟的互操作性105
6.2 互操作性107
6.3 深入互操作性112
6.3.1 在R Markdown文档中R和Python之间传递对象112
6.3.2 在R Markdown文档中调用Python113
6.3.3 使用来源命令调用Python114
6.3.4 使用REPL调用Python115
6.3.5 在交互式文档中使用动态输入调用Python115
6.4 最后的想法117
第7章 两种编程语言数据科学案例研究118
7.1 24年188万场野火118
7.2 设置和导入数据121
7.3 EDA和数据可视化122
7.4 机器学习126
7.4.1 设置Python环境126
7.4.2 特征工程127
7.4.3 模型训练128
7.5 推理和用户界面129
7.6 最后的想法131
附录 Python-R双语词典133
第三方库管理133
赋值运算符134
类型136
数学运算符137
属性137
关键字138
函数和方法138
编码风格和命名约定139
数据存储对象类比140
数据帧142
逻辑表达式145
索引147
关于作者152
关于封面152
返回顶部