在线试读

get_product_contenthtml

  初识大数据
  如果评选当今为火热的十大技术,大数据无疑是强有力的“种子选手”。大数据已经渗透到各行各业,无人驾驶、智能交通、智慧医疗等新兴技术在一定意义上都依托于“大数据”这一信息资产,越来越多的领域将处于这场“数据风暴”之中。虽然人人都在议论大数据,但是大多数人对其“来龙去脉”却知之甚少。
  什么是大数据
  大数据不仅是一门技术,同时也成为一种商业模式,并正在构建一种新的生态,慢慢地改变着我们的生活。对于大数据的概念众说纷纭,很多人认为“大数据”的内涵其实就在于“数据大”。为此,明确大数据的概念和特点,成了当务之急。
  大数据的定义
  对于大数据,全球的IT研究与顾问咨询公司高德纳(Gartner)曾这样描述,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
  麦肯锡全球研究所(MGI)在《大数据:创新、竞争和生产力的下一个前沿》中给出的定义则是:大数据是指其大小超出了典型数据库软件的采集、储存、管理和分析等能力的数据集。自此,大数据从经济角度得到了全球的广泛关注。
  我国信息学者涂子沛先生将大数据等同于传统的小数据(源于测量) 现代的大记录(源于记录)。其中,记录来源于图片、音频、视频等,而随着记录的逐渐增多,大数据也越来越“大”。
  2015 年8 月31 日,国务院发布《促进大数据发展行动纲要》指出:“大数据是以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态。”
  由中国信息通信研究院编写的《大数据白皮书(2016 年)》提出:“大数据是新资源、新技术和新理念的混合体。从资源视角看,大数据是新资源,体现了一种全新的资源观;从技术视角看,大数据代表了新一代数据管理与分析技术;从理念视角看,大数据打开了一种全新的思维角度。”
  至今,学界对“大数据”一词仍难以给出精确衡量的技术概念定义。既然目前对大数据并没有统一的释义,我们不妨将其理解为一种资源、一种工具、一种思考和认识世界的理念。
  用大数据说话
  在生活中,“扑面而来”的大数据,令人不知所措。大数据作为一种技术、工具、方法,对现代社会生活的影响和冲击日益凸显,在某些领域甚至是革命性与颠覆式的。纵观人类科技发展史,似乎没有哪一次科技革命像大数据这样,从酝酿萌动到蔓延爆发,仅仅经历短短数年的时间。
  用数据说话。在大数据时代,“万物皆数”,注重“量化一切”。人类生活在一个海量、动态、多样的数据世界中,数据无处不在、无时不有、无人不用,数据就像阳光、空气、水一样常见,好比放大镜、望远镜、显微镜那般重要。相较于人们过去的“凭经验办事”,如今我们必须学会“用数据说话”。
  让数据发声。在包罗万象的数据海洋中,经过“打捞”不难发现,在数据中藏着诸多熠熠生辉的珍宝,此前看似毫不相关的多件事物,通过“挑拣”,也能发现事物之间隐藏的相互关系,在帮助人们认知事物和把握局势的同时,进一步预测未来,这正是大数据的潜力与价值所在。
  在探索数据价值的过程中,我们已经不仅局限于寻求问题背后的因果关系,而是将范围进一步扩大,对普遍联系的各种事物进行一一审视。在这个过程中,相关关系成为探索的重点,“是什么”在一定程度上比“为什么”更重要。正如知名大数据专家维克托·迈尔 - 舍恩伯格(Viktor Mayer-Sch¨onberger)所言,“要相关,不要因果”成为大数据时代的一个显著特征。
  对于相关关系,生活中的很多实例都可以帮助理解。比如,在商业场景中,通过分析可知,大多数顾客在购买牛排的同时,也会顺便购买一些胡椒粉,因为两者是餐桌上的常见搭配,而商场通过将售卖两种物品的货架摆放在一起,并提供搭配销售的优惠券,将大幅提高销售收益。
  对于牛排与胡椒粉,大家比较容易将它们联想在一起,但是啤酒和尿布这两种似乎毫无关联的物品,却常同时出现在美国沃尔玛超市顾客的购物篮里。
  经过调查分析才知道,在有婴儿的美国家庭中,母亲通常在家照顾孩子,而由父亲去购买尿布。在购买过程中,父亲常常在买尿布的同时,也为自己购买几瓶啤酒,久而久之就总是出现啤酒与尿布同篮的场景。因此,发现这一规律的沃尔玛超市将啤酒与尿布摆放在相邻货架上,以提高销售收入。
  除了能用于商业场景,大数据还可以提前预测流感疫情。一般在流感肆虐前,在网上搜索相关生病症状的人会大幅增加。为此,2008 年谷歌推出了“谷歌流感趋势(GFT)”,GFT 根据汇总的谷歌搜索数据,近乎实时地对全球当前的流行疫情进行估测。2009 年,谷歌又通过疫情预测,准确预测了H1N1 在美国的传播,这就是相关关系的巨大力量。
  “用数据说话”“让数据发声”,已成为人类认知世界的一种全新方法。世界是物质的,物质是数据的,数据正在重新定义世界的物质本源,并赋予“实事求是”新的时代内涵。我们必须善于用数据说话、用数据决策、用数据管理、用数据生活。
  大数据作为一种新兴的生产要素、企业资本、社会财富,可谓取之不尽、用之不竭,而且能够重复使用、循环利用。可以说,大数据是一个信息和知识的富矿,蕴藏着无限的商机与巨大的收益,只要去深度分析和挖掘,总会有意想不到的收获。谷歌、亚马逊、Facebook、阿里巴巴、腾讯、等领军企业的成功实践和辉煌业绩,就是生动、有力的例证。
  “得数据者得天下”,除了商机与收益,大数据同时也是“未来的石油”,将成为社会创新发展的动力源泉。大数据正在推动科学研究范式、产业发展模式、社会组织形式、国家治理方式的转型与变革。“数据可以治国,还可以强国”,大数据在中国大有可为。中国是一个人口大国、制造业大国、互联网大国,这些都是活跃的数据产生主体。根据国际数据资讯公司(International DataCorporation,IDC)预计,数字宇宙规模将在2020 年达到40ZB,而中国将产生占全球21% 的数据。令人可喜的是,我国已就大数据做出战略部署,制定了发展规划和行动纲要,我们可以和发达国家在同一起跑线上赛跑,并可能实现弯道超越。
  借用维克托·迈尔- 舍恩伯格、肯尼恩·库克耶的警示:对于大数据时代,如果你是一个人,你拒绝的话,可能失去生命;如果是一个国家的话,可能会失去这个国家的未来,失去一代人的未来。