皮盼资讯网移动版

皮盼资讯网 > 潮流时尚 >

大数据给我们裂谷战争带来了哪些改变(2)

  第三是价值。我们处在数据的海洋中,四周都是数据,但是跟我个人有关,跟我企业有关的那种有价值的信息相对少了,因为数据量的分母太大了,即密度在降低,这个后面直接的隐喻就是要深度挖掘才能发现我们希望的价值。

  第四是速度。数据就像开着的水龙头一样,源源不断地出来,而不是我们上传下载图片要等很久。因此,大数据里的数据是一个流数据的概念。

  大数据的问题特征

  那么,什么样的问题才是大数据问题?这要看它的问题特征。

  第一个特征,是粒度缩放。粒度缩放是指我们碰到的这个问题的要素一定是数据化的,即这个要素不管是宏观的还是微观的,一定能通过数据表示。同时,可以像地图一样,可以在特别大的范围和特别细的范围之间缩放,能够在宏观、微观之间进行映射。

  第二个特征,是大数据外部性导致的特征,称之为跨界关联。考虑问题的时候要看视角,问题边界是在哪儿,如果考虑问题的时候这个边界到了传统边界之外,就是跨界了,而且你把这个外部的要素和内部要素联系起来了,所以你在关联。

  第三个特征,全局视图。大数据实际是希望了解全貌的,它最后是要看画像,因为前面我的每一个点、每一个环节的数据叫作粒度缩放,同时和我相关的要素我又关联了,但是我最后要干什么,要了解全貌,要有个人画像、企业画像、政府画像、社会画像等,所以这个画像本身又是全景式的,从范围来讲是全景式的,从内涵来讲,我们希望既关联又因果。

  这里,我举一个共享单车的例子,方便大家审视大数据问题的特点。有的人会认为共享单车其实就是我们的代步工具,但是这是传统的概念。现在一般每辆共享单车都有自己的感应器和定位装置,也就是说感测的数据粒度到了车和部件。这时候就不单是一个单车了,可能我走到什么地方,共享单车的App就告诉我附近有什么商圈、酒店、餐馆,我在什么地方买东西可能还可以用移动支付,当视角从单车走到了其他行业、要素时,就开始跨界关联了。可能在这个地区人特别多,共享单车不够,可能在另外的地方单车冗余了。因此,共享单车的平台应该清楚什么地方需要车,什么地方不需要车,怎样调动,这就是全局视图。当共享单车具备粒度缩放、跨界关联和全局视图时,共享单车的运营、优化,就是一个大数据问题。

  这些年来,社会上比较流行一个论断,说“大数据只讲关联不讲因果”。这个论断虽然有一定道理,但是总体来讲是误导的。特别是在重要决策的时候,如果涉及的后果可能会有严重的人财物的损失,然后我告诉你“你就这么干吧,没有为什么”,谁敢作决策?所以,在大数据环境下作管理决策,既要看关联也要看因果。另外,因果是认识论的基本诉求,我们要知道原因。

  大数据冲击各行各业

  我们作为个人不仅是数据的接收者,也是数据的生产者。一方面我们下载、阅读、浏览,因此我们在消费数据;另一方面,我们又上传、撰写、参加各种活动,各种活动就可以留下我们的很多痕迹,因此我们也在留痕,我们实际又在产生数据。在这样一个既是消费又是生产的环境中,我们从方方面面已经和数据分不开了。

  大数据已经在冲击各行各业。

  比如经济金融领域。股价的预测其实一直是个难题,传统的股价预测,实际是通过一些专业的模型来估计风险、收益、评价企业,有专门的理论和方法来估计股价。但是影响股价的除了这些因素之外还有人们的“期望”,而估计“期望”是非常难的,因为“期望”既涉及外部因素,又涉及心理预期。现在一个新视角是考虑公众关注,比如搜索。若对某些企业比较关心,可能就搜索其企业状况、新闻事件,这种搜索体现了大众对具体企业的股票价格和价值走向的关心。这是一个跟过去特别不同的角度,因为这不是特别专业的角度,它是从专业外人士的行为来估计的角度。这种关注和搜索与股价的走势有相当强的关联度。但是,要特别指出,仅用这一个因素来估计股价是不够的,还有大量的因素需要专业模型。因此,一方面能够扩展或者冲击传统的定式和视角,另外应该把其他视角引入进来,大数据的股价预测应该是包括内部与外部、专业与非专业因素的模型构建。

(责任编辑:admin)