数据空间
您当前的位置: 首页 /数据知识

大数据≠“大”的数据

发布时间:[2017-09-11] 来源:新华日报 点击量:

  中国企业数据治理联盟www.chinaedg.com/

  进入》主数据管理        企业数据治理        信息资源规划         数据安全管理

 多大的数据才叫大数据?”

  中国南京软博会的重头戏——大数据产业互联网融合创新发展高峰论坛开讲在即,记者在会场门口到加拿大工程院院士凌晓峰。问及大数据产业如何驱动未来,这位国际权威专家以一句反问作答。

大数据

  作为第一位登台演讲嘉宾,凌晓峰院士正式抛出自己的新观点:大数据≠“的数据。

  你可以去问任何一个专家,到底什么叫大数据’?多大的数据才能叫大数据’?他肯定回答不出来嘛。凌晓峰说,数据的并不是关键,重要的是从数据中挖掘价值,创造价值。

  举例而言,医学应用上研究心脏疾病,想知道病人怎么做才能更加健康,于是搜集大数据。但一个人每天产生的各类数据是海量的,大量的数据跟病理反应本质上毫无关系,你去搜集、去分析,不但做了无用功,还可能得出错误的分析结论。一个反面案例是,在美国拉斯维加斯的赌场,红黑转盘边都用一个大屏幕显示之前的开奖信息。很多人看着前面出现红色次数较多就下注黑色,这就是典型的数据噪声”——搞统计的都知道,这完全是随机的,这些所谓的大数据是无效的甚至干扰的。

  开展大数据分析一定要有应用场景,讲求数据的精准性和关联度,数据本身的并不是关键。凌晓峰说,盲目追求数据之大,产生不了有用的结果,反而容易自我迷惑,这也是当下大数据产业存在的普遍误区。

  这一观点有极强的现实针对性。当下,不少制造企业言必称大数据,无论搞什么产品,都接入光纤,加上传感器,每时每刻产生一大堆数据。问题在于,数据有了,但哪些有效哪些无效,无从辨别。不但造成硬件设备和统计计算资源的浪费,还可能因数据噪音的干扰得出错误结论,反而削弱市场竞争力。

  我们把大而无当的数据称作低价值密度的数据。中国工程院院士谭建荣告诉记者,以前专业术语就叫数据挖掘”“数据分析,现在为何要给数据加上的前缀?在他看来,所谓的大,一是强调数据的时效性,以前数据报表都是延时的,新的物联传感技术手段提供的数据更实时,也更有价值。二是强调关联化。他调研发现,长三角企业推进信息化,普遍采用生产管理软件。但这些通用软件数量多达几十上百种,不同软件产生的数据是不共享的。如果产生不了关联效应,再多的数据都只能算是小数据。三是要强调个性化。数据模型越大,越能得到个性化的特征,如何将客户模糊的个性化需求数据转化为设计技术指标,将是工业大数据应用的下一个风口

  大数据真正要义不在于大,而在于多元。大数据产业大咖、零点研究咨询集团董事袁岳说,如何使多元数据在汇聚的过程中,通过软件处理最终得到科学的分析结果,变成有用的数据源,这才是生产制造和社会管理领域建立大数据决策系统的意义。就像挖矿过程中,大数据是其中的原油,只有经过精细的提炼变成精数据才有价值。

  一场头脑风暴,历时三四个小时。唇枪舌剑中,一项项共识逐渐成型——大数据≠“的数据;大数据产业发展要应用导向”;数据将是未来发展最重要的资源,甚至驱动未来”……

  去年8月《江苏省大数据发展行动计划》发布后,大数据产业在全省蓬勃发展,应用日新月异,产业园遍地开花。南京大数据产业协会负责人说,《第三次浪潮》里早把大数据看作是继计算机、互联网之后的信息时代的第三次技术革命。但时至今日,还有人认为不过是IT、互联网业界的又一次概念炒作。此次高峰论坛厘清大数据本质,直指当前产业发展误区,既契合数据驱动未来的软博会主题,又对国内大数据产业今后发展有里程碑意义。


发表评论 共有条评论
用户名: 密码:
匿名发表