在线试读

get_product_contenthtml 你可能经常听到大数据这个词,但你真的知道大数据究竟是什么吗?大数据为什么如此重要?大数据能否对你的组织造成影响,从而带来改进和竞争优势?是否存在这种可能?D?D不使用大数据会让你在竞争中处于劣势?

本书的目的在于解析“大数据”这一名词,同时向你提供用数据科学和机器学习来充分利用这些数据的实践方法。

大数据是一类新的数据,具有以下特点:数据量大,并且数据量还在持续、迅速地增长,同时,其数据结构并不符合传统的数据结构。“大”这个字眼是一种轻描淡写的说法,它并不能充分地说明实际情况的复杂程度。我们所处理的数据不仅仅是比传统的数据量大,更是与传统的数据有本质上的区别,就好比一辆摩托车并不是大一点的自行车,一片海洋也并非大一点的游泳池。大数据带来了新的挑战,创造了新的机会,模糊了传统的竞争界限,因而需要新的方法来帮助我们从数据中获取有形的价值。海量数据与为处理此类数据而开发的技术结合,提供了对大规模数据的洞察角度,由此掀起了一股机器学习的浪潮,产生了由计算机驱动汽车的无人驾驶系统、比医生更为精确的心脏病预测系统,以及比人类更精通复杂游戏(如围棋[1])的计算机系统。

为什么大数据是一个规则的改变者?正如我们将看到的,通过大数据,我们可以获得对数据更深层次的洞察力,从而理解促进消费者购买的因素以及生产线效率降低的原因。大数据不仅可以让商家实时地为全球数以百万计的用户提供高度个性化的体验,而且能够为诸如癌症研究、航天、粒子物理学等领域提供同时分析十亿量级数据的计算能力。大数据还提供了数据和计算资源,使得人工智能重新崛起,其中*代表性的就是引领全球的基于深度学习[2]的技术。

没有局限于数据本身,在过去的二十年里,研究者和工程师们还开发出了硬件和软件结合的一整套生态系统,来收集、存储、处理和分析这些丰富的数据。本书将这些硬件和软件工具统称为大数据生态系统。这一生态系统能够帮助我们从大数据中挖掘出巨大的价值并将其应用于商业、科学和健康领域。想要利用大数据,你需要将大数据生态系统中的各个部分整合在一起,并选择出适合你的应用场景的*解决方案。你还需要为这些数据提供合适的分析方法,众所周知,数据科学由此产生。

总的来说,大数据远不止简单的数据和技术。大数据应用于商业、科学和社会等领域,对你所从事的工作产生了巨大的影响。你的决策远不止购买一项技术。在本书中,我将会总结与大数据相关的工具、应用和处理方法,分析如何从多种形式的现代数据中获得价值。

大部分组织将大数据视为它们数字化转型的重要部分。许多成功的组织在运用大数据和包括深度学习在内的数据科学等方面已经做得很好了。研究表明,大数据的运用和收益增长(超过50%的收益增长)之间有着很强的联系。企业利用数据科学技术实现关键绩效指标(key performance indicators,KPI)[3]10%~20%的增长是很常见的。

对于那些尚未开始利用大数据和数据科学的组织来说,*的障碍就是不知道大数据应用所获得的收益是否值得付出与努力。我将在本书中阐明大数据应用所带来的益处,并通过案例来说明其中的价值和风险。

在本书的第二部分,我将描述在组织内确立一项数据战略和完成数据项目的实践步骤。我将讨论如何招募到合适的人,并创建一个收集和使用数据的计划。我也会讨论关于数据科学和大数据工具应用的具体领域。此外,我将对如何雇用合适的人来执行这些计划给出几点建议。
章节概述

第一部分大数据揭秘

第1章大数据的故事

本章将介绍大数据是如何发展成一个现象、大数据如何在过去的短短几年里变成一个如此重要的话题、大数据从哪里来、谁在使用大数据以及驱动人们使用大数据的原因是什么、大数据如何在今天实现了过去不可能完成的事情。

第2章人工智能、机器学习和大数据

本章将介绍人工智能(AI)发展的一段简史,阐述人工智能是如何与机器学习联系在一起的,介绍神经网络和深度学习人工智能的应用及其如何与大数据产生联系,并对人工智能领域的工作者提出一些建议。

第3章为什么大数据是有用的

本章将阐述我们的数据使用方式和思维方式是如何改变的,大数据如何创造新的机遇并改变现有的分析技术,通过成功的故事和案例来阐述数据驱动的含义。

第4章大数据分析的应用案例

本章将阐述20个大数据分析和数据科学的商业应用案例,重点阐述如何应用大数据改变现有的数据分析方式。

第5章理解大数据生态系统

本章将阐述关于大数据的主要概念,如开源代码、分布式计算和云计算。

第二部分将大数据生态系统应用到