大数据有多热?
看看时下大大小小的论坛就能知道。即便是达沃斯,也不能“免俗”。不过,这个话题即便已经说过千遍,当下再来聊聊仍然相当有意义。
9月11日,世界经济论坛2013年新领军者年会(又称“夏季达沃斯论坛”)的分会场,“大数据还是大忽悠”现场的气氛很火热。
这是一场观点针锋相对的辩论。正方的观点是,大数据的机遇被过分炒作。反方则认为,大数据的机会被严重的低估了。
西装革履的嘉宾,在辩论环节,为了说服台下的听众,或者说为了“拉选票”,甚至手舞足蹈地移步到台前陈述自己的观点。
jeremy howard是“大数据的机遇被过分炒作”的拥趸,尽管他所属的kaggle公司,本届达沃斯的技术先锋公司之一,正是一家基于大数据分析的创业公司,howard是这家公司的总裁兼首席科学家。这家位于美国旧金山的初创企业,创建了一个拥有近11万名数据科学家的在线社区,是一个大数据分析的众包平台,他们的业务模式是在数据问题和数据9001cc金沙的解决方案架起了一座桥梁。
howard陈述的观点,让知道这个公司业务的人多少有些意外:
“世界上有太多的数据。我不关心数据有多大,而是关心用数据来干什么。kaggle平台解决了300多个以前没有被解决的问题。那么,数据是越大越好吗?其实我们需要了解的关系并没有我们想象得那么复杂。”
在howard看来,什么数据都需要,其实是大忽悠,是厂商、硬盘商、软件商为了生意的需要而做的说辞。
bright simons与howard是同一阵营的,他来自加纳,是mpedigree网络公司总裁,是数据开发领域的专家。在他看来,数据并不是越大越好、越庞杂越有价值,不能把所有垃圾的数据也视为有意义的,“大数据能为我们做什么事情?我们需要洞察大数据能给我们解决什么问题”。
与他们不同,来自中国的苏萌,和来自日本的yamamoto,则力挺“大数据的应用远未达到我们所需要的”。
yamamoto以日本新近成功申奥来举例,他说日本能够成功申奥,得到了大数据的支持。“利用facebook、推特等社交网络来宣传申奥,原本只有50%多的日本人支持申奥,后来支持的人群超过80%”,在yamamoto看来,大数据是申奥成功的重要平台。
其实,类似事情上,奥巴马大选的例子更为经典。奥巴马连任的背后,不仅是奥巴马团队与时俱进地利用各种新兴社交平台与选民互动,还通过大数据分析拉来更多选民。事实上美国奥巴马政府已经把“大数据”上升到了国家战略的层面。今年3月,奥巴马政府宣布投资2亿美元启动“大数据研究和发展计划”,希望增强收集海量数据、分析萃取信息的能力。
在yamamoto看来,对于大数据应用的下一步发展来说,“每天产生海量的数据我们需要一种机制、发明、流程,来处理这些海量的数据,进而让它们变得对我们的生活有用处”。
“大数据的机会被严重的低估了。大数据的应用远未达到我们所需要的。大数据的应用将从各个行业进入,现在仅仅是在电商等领域被应用,这只是大数据的冰山一角。”苏萌更是观点鲜明地力挺大数据“机会说”。苏萌是北京大学副教授、北大光华管理学院新媒体营销研究中心副主任,他也是中国国内大数据分析公司百分点的创始人。
在苏萌看来,“大数据的应用远未达到我们所需要的”,归结于以下几点:
? 没有看到数据真正流动起来,没有流动性就没有价值。现在各个企业、机构之间的数据都是孤岛状的数据。
? 没有看到整个大数据的生态产业链。从数据的采集整理挖掘应用,整套生态链并没有看到。
? 现在还很缺乏这方面的人才。他说,即便是北京大学这样的著名高校,还都没有数据科学的专业,换句话说,还需要有越来越多的数据科学人才的培养机会。
辩论会现场的火热,不仅是台上嘉宾的唇枪舌战、你来我往,还有台下听众接二连三地“发难”台上嘉宾。让我们听听这些提问吧:
提问howard:按照您的观点,我们现在还未解决、需要解决的问题,是得用小数据来解决?还是大数据没有足够好的工具来解决问题?
howard:最成功的建模,并不是把所有的数据都组织到一起,而是适合数量的数据的集合。
提问苏萌:在这个世界上有多少时间你是在收集数据,有多少时间你是在分析数据?
苏萌:不同行业情况不同。比如电商,现在需要更多的时间来分析数据,而不仅仅是数据的采集上。
提问者:“足够的时间”本身就是个问题。
联合国世界粮食计划署成员提问simons:我们从世界各地收到的反馈,大数据挽救了很多人的生命。
simons:但是我们需要的是正确的数据。
提问howard:大数据还是会存在的。据您的预测,未来五年中,能够通过大数据来解决问题的比例是?
howard:我相信数据,但我不相信我们的电脑里能存储太多的数据,或者无限制地存储数据。我们现在有很先进的算法,能够更灵敏地来搜集数据。事实上,随着时间的推移、我们的技术越来越进步,我们需要的数据就越少。
提问yamamoto:政府和国家的互联网络,集中化的数据,有个很大的威胁,被黑客攻击,这就是数据脆弱的一面,您如何看待大数据在这方面的漏洞?
yamamoto:网络恐怖威胁,对大数据而言是挑战。要对这些风险做出准备。对于政府机构的数据受到网络黑客的威胁、病毒的威胁,我们需要做的是保护数据。
究竟是大数据还是大忽悠?一场1个小时的辩论会是难以断得清的。辩论现场主持人,以略带游戏的方式来结束了这场“争论”。在辩论会开始之前,他请现场的观众投票,正方以微弱优势领先反方。辩论临近尾声时,现场观众再次投票,这次则是“大数据的机会被严重的低估了”以微弱优势领先。
苏萌的话,很适合作为这场辩论的结束语:
大数据在教育、医疗、能源、金融、传统零售等领域的潜力都还没有看到。所有新事物的发展,都会有泡沫成分。泡沫过后,价值会被沉淀。现在来看,十四五年后,互联网泡沫论被证伪,现在电商泡沫论正在被证伪,未来大数据泡沫论也是一样。
(文章来源:经理+,作者:贺文)