在线试读

get_product_contenthtml 还原是一个瞄准器
  数据的本质就是还原,这是收集元数据的关键方法。
  当我们在进行用户的场景还原时,必须认清数据收集的领域是什么。在不同的领域里收集到的数据,可以找到与其所在领域里不同的东西,比如,搜索引擎和社交网络(SNS)得到的数据就是不一样的。而企业首先要做的是,确认用户是不是同一个人,比如在SNS里涉及的很多信息主要都是聊天内容,如果我是做SNS的,我就会更多地去寻找这个人和其他人的关系。他今天跟张三聊了3分钟,明天跟李四聊了5分钟,这项数据在SNS领域里可以获得。但当我们要真实地还原整个人的行为的话,好要有不同领域作为互补,这会让你掌握更多更全面的信息。
  你有多大的能力知道哪些数据是同一个用户的,这是企业首先必须解决的问题。然后再去关注,收集到的数据的量这么大,广度这么?宽,价值在哪里。而当企业不清楚收集到的数据是不是同一个用户的时,那这个数据又有什么用?所以,在大数据里,重要的还是收集人的数据。
  而数据的价值,正如我们前面所分析的,必须来自场景。
  对于消费者数据的收集,其中一个瞄准器就是你能否还原用户购买行为的场景。基于科技的不断进步,如果有一天Google?眼镜成为每个人的标配,或者是有一天,我们买的每一部电脑,其本身都是跟手机捆绑的,那么这两种交叉数据是很容易获取的。
  为什么场景会变得如此重要?场景是不是被准确地表达了?场景是否会成为一件事情的背景,用来还原整件事情?有一年的“十一黄金周”,我们发现很多用户使用iPad购物,为什么?你或许不会想到,这是因为那年的“十一黄金周”次实行黄金周高速公路不收过路费的政策,很多人堵在了路上,没有其他事情做,所只能以使用iPad购物。如果企业在分析数据的时候,没有考虑到10月1日整个中国的高速公路都出现拥堵的这个场景,企业就没有办法还原整个场景,也就无法解释这个现象。
  我还发现了一个新场景。有一天,我们研究了一些无线数据——用二维码让用户到达我们预想让他到达的页面。我们可以看到,iPhone手机在扫完二维码后就到达了页面,但是安卓却没有。在中国,很多装有安卓系统的手机在扫完二维码之后都无法自动跳转到关联页面。这时,安卓手机就成为用户登陆网站购物的重要场景。不管是一部iPhone手机、一部三星手机,还是一部其他类型的手机,手机的大小和系统的兼容性本身都能对场景产生巨大的影响。而如果我们盲目地去观察数据本身,自以为是地认为用户没有进行点击,那就大错特错了。事实上,是他点不了。
  可见,有很多看似无关紧要的东西都在场景里,而在无线移动终端的世界里,这个场景又平添了很多其他的东西,这都需要我们仔细地甄别。
  当我和数据分析师们聊天时,我总是会特别提醒,在研究无线数据的时候,要特别注意的是用户在每天移动的时间点和非移动的时间点里都做了什么。从起床到睡觉,有几个时间点基本是固定的,所以基本上就可以判断每个人一天的行为走势是什么。
  我曾经在一次电商大会的圆桌论坛上提出了一个观点,当时与会者都很认同,就是我建议把一些以前用来观察用户忠诚度的框架,比如RFM模型来做收集数据的瞄准器。有什么数据能让我更好地看到R,更好地看到F,更好地看到M?RFM是一个收集维度,个人PC、手机、平板电脑是另一个终端场景维度,PC能更好地收集R,手机能更好地收集M,这样就可以通过场景的不断变换来收集更多的数据。
  现在,有一些终端的确可以收集以前收集不到的数据。以前,我们不知道一些数据的收集背景是不是移动的,但现在可以。用户做一件事情的时候是不是正在移动?他是不是在银泰百货里面?面对不同的场景,我们的框架也要相应改变。所以,现在做数据分析报告,后的一个问题变成了:“无线变了,这个报告的结果还是一样吗?你的报告应不应该也变一下?”
  我认为,数据的本质就是还原,这是收集元数据的关键方法。如果没有这个概念,你就不知道未来你需要什么数据,就更不懂得什么是重要的数据,到后只会产生越来越多的无从辨别的数据。一旦数据多到了连你的公司都没有办法处理的时候,那么其他会处理的人、公司和国家就会把你毫不留情地挤出市场。
  “未来一定是国家和国家之间的数据大战,公司与公司之间的数据大战!”信息时代催生了海量数据的出现,这个世界上每时每刻都在产生大量的数据。此时,大数据已经不再是一个单纯的概念,而是像空气一样围绕在每个人的身边,每个人都是数据的制造者。也正是因为每个人都在通过不同的设备生产着数据,使得数据更多在“量”这个维度上不断膨胀,但是,“量”的单纯膨胀却对企业真正了解一个用户的需求产生了极大的挑战。所以,如何更好地识别各个设备的使用者是否为同一个人,如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。
  在不久的将来,随着O2O的深入和穿戴式设备的兴起,企业和企业之间必须进行更多的数据融合和交换,必须进行更多的跨行业的数据交流,这样才能更好地还原用户真正的需求,让用户在任何一个场景中都能够获得由数据带来的便利。
  总而言之,更深化的数据连接使海量数据经过提炼更真实地还原了事实,也使我们运用数据科技去解码未来的需求成为可能。
  CEO们关心哪三个数据
  我在面试数据分析师的时候,必然会问他们一个问题:“假如我是一家知名电商的CEO,而今天是星期一早上9点钟,请你给我提供三个数据指标向我证明在过去的一周里,企业运营得一切正常,可以让我踏实下来。你认为,会是哪三个指标呢?”
  绝大多数应聘者对这个问题的回答比较一致:个是流量;第二个是交易量;第三个是其他,这个其他包括转化率、交易额等。
  当他们这样回答完后,我会反问他们:“刚刚我问的问题,你真的听清楚了吗?”
  这时候,有人会回答说,我听清楚了,而答案就是的真实需求这三个数据。
  往往这个时候,我会提醒应聘者说:“请注意,我要的数据是给CEO看的,而且还是电商的CEO,而且时间轴是周敏感数据。”面试进行到这一环节,我就发现大部分面试者根本听不懂“CEO”的含义。事实上,既然是CEO,就意味着他是公司里的领导层,那么给他看的东西明显要与其他人不同。
  在这个例子中,我们会发现绝大多数应聘者很少会换位思考。也就是说,事实上,他们都是从自己的角度来思考,而不是以一个数据分析师、一个要给CEO汇报三个数据指标的分析师的身份来思考问题。
  那么,什么是以数据分析师的身份来思考问题呢?通常来说,在我问出问题时,作为数据分析师的你首先要想的是CEO会关注什么数据,是长期的,还是短期的?是风险的,还是风险一般的?或者是近发生了什么事情?以及给CEO提供的数据要有什么注意事项,等等。
  所以,我要再问问应聘者:“当你坐在面试桌对面给我答案的时候,有没有想过在星期一的早上,这家知名电商的CEO真正想看的是什么?”
  再想想这个问题,你到底有没有真正听清楚“CEO”、“知名电商”、“周敏感数据”这些关键词?CEO要的是“踏实”——他听完了就可以安心地吃早饭了。
  在面试时,如果面试者不对这几个问题进行询问就贸然回答的话,满分是10分,我只会给5分。因为这个问题里面本身就有很多问题,比如,什么是踏实?踏实是一个概念,你不问清楚“踏实”的含义,就给我三个指标,无论如何都是错的。
  在正常情况下,首先不要急于回答我提出的问题,而是先问清楚什么是踏实,切勿自己先做假定。以下,我们可以假定一个相对理想的面试场景。
  你反问:“什么是踏实的状况?”
  我回答道:“近这家电商和另一家电商在打价格战,而它近又新推出了图书类目,那么CEO自然关注的是这些图书的业务做得好不好。”
  你再问:“什么是好?是否基于每天来买书的新增用户和原有用户购书的数量多少?而且,CEO是希望更多地用书来吸引新用户,还是想通过图书业务的推广让现有的用户进行交叉购买行为?”
  在这些思考结束之前,你不能给出指标。因为,在没有解决一个问题的内涵之前,任意给出的一个指标,必错无疑。所以,我才会问应聘者到底听清楚问题没有。
  在我做面试官的经历中,很多看似有经验的数据分析师,往往在我提出的问题还没有解释清楚时就抢着作答。绝大多数人在思考不到一秒钟的时间里就给出了答案,而这一秒钟的答案,我可以确定他们根本没有听清楚我的问题。
  通常这个时候,我会再给他们一次机会,问他们:“刚才你给我的这个答案,如果我给你满分10分,你会给自己打几分?”而此时,大部分人只会打6~7分。
  当应聘者给自己打7分时,我会反问:“另外3分丢的原因是什么?”他开始反思,说自己刚才给的可能并不是CEO想要的指标,因为他对这家电商的近况不是很了解……
  接下来,当我再反问:“刚才我的问题是‘假如我是一家知名电商的CEO,今天是星期一早上9点钟,你给我三个数据指标向我证明在过去的一周里,企业运营得一切正常’,你听清楚了吗?如果你确认自己清楚了,能请你再给我一次答案吗?”
  这时候,聪明的人不会再用一秒钟就给我答案了,而是重新思考,开始问问题,再给出答案。这时候的答案,当然会比个答案要好得多。后,当我再问他:“现在,10分满分你给自己打多少分?”此时,他们自己给出的分值通常都会高一些。至此,我的面试也就结束了。
  事实上,关于这个问题,我根本就不关注打分的结果。当然,如果评价是10分,那就不用面试了,因为在没有仔细考虑过答案的时候就自信满满地回答,这种人必然无法承担做数据分析师的责任。虽然,自信是对的,但是思考更重要。作为一名数据分析师如果你不把自己的分析与当下结合,是没法进步的。
  有趣的是,当我把这个问题贴在网上时,还是会有很多人追问我答案是什么、CEO关心的到底是哪三个数据。这时候,我真的很想说,答案不是结果,方法才是。

  ……