4月24日消息,在2014国际数据产业峰会上,中国电信云计算与大数据产品线总监杨明川表示,我们一直是把大数据比喻成一个金矿,大数据众所周知,数据是资产,数据是生产力,数据是金矿。实际上在数据是金矿到数据真正能够发挥它的价值,其实有很长的一个路径要走,这是需要有多个环节的。任何一家公司,包括中国电信在内,不太可能从头到尾把所有的环节都能做好。而实际上目前为止,中国电信很多运营商还是做得比较基础的方面,我们更多是把数据资源,能够采集,能够做一些处理,做一些汇聚,真正让数据发挥价值还有一定的路径要走。
在杨明川看来,大数据对运营商存在四个方面问题,一个是成本,一个是技术门槛,一个是商业模式的问题,一个是管理创新的问题。在这四个方面,通过大数据的一些技术,通过大数据的一些业务,能够为运营商能够带来很大的市场潜力。
首先我们来看第一方面的价值,成本和可用性方面。Hadoop是大数据的底层技术,Hadoop来自于谷歌相关的系统,它的核心理念,是用大量的廉价设备,来构建高兴能,低成本的集群。大数据对于整个运营商的系统而言,第一个价值就是能够省钱,特别是我们现在拥有海量的数据。以前海量的数据,可能绝大多数的数据可能在经过一些简单的处理之后,就全部放弃掉了,因为我们没有这么大的存储和这么大的计算资源,可以保留下来,可以进行深度的挖掘。现在通过大数据的技术,我们有可能能够使这些数据不断的挖掘,不断发现新的价值。像这种理念,就是从大数据的系统设计理念来讲,本身也是一种互联网式的。
第二个方面,大数据技术和以前用的大量的IT系统,数据库系统一个很大的区别,整个这个体系,绝大多数都是基于开源系统来做的,我们现在也在讲怎么样利用开源,怎么样去IOE,这里面给我们一个很重要的价值,就是我们现在有可能比较低的成本,在开源的基础上,根据自己的需要去研发相应的系统。
我们把大数据分为四个层次,数据存储,计算框架,数据分析,数据应用。在数据存储方面,我们现在引进到分布式文件系统。
数据库我们从光纤数据库到新的数据模型,使得我们有可能去处理一些比较复杂的,副规则的,非结构化的数据。
结构框架来讲大家讨论最多的,其实我们最早分布式计算,我们有并行高兴能计算机的,包括现在的大型机,超级计算及MPP的架构,到网格这样一种并行计算的技术,到大数据2.0,我们现在通过YARN这样一个框架,能够把不同的计算模型进行整合。
数据分析这个层面,传统的统计分析,积极学习,我们现在新的技术也在不断推动大数据体系的发展,包括数据可视化,深度学习,新的一些技术的出现,推进大数据能够向纵深进行发展。
在应用这块,大数据的应用,我觉得总结起来很简单,所有的大数据应有围绕这三个东西做文章,一个是怎么样研究人,人的行为,人的特征,人的兴趣。一个就是物,包括我们研究的各种各样的事物,比如说我们要做电子商务的,我们要做影视娱乐,我们要做其他的。还有很关键的就是研究它们的关系。
接下来我们再来看一下大数据是否能够给我们带来新的商业模式,我们一直是把大数据把它比喻成一个金矿,大数据众所周知,我们都已经达成共识,数据是资产,数据是生产力,数据是金矿。实际上在数据是金矿到数据真正能够发挥它的价值,其实有很长的一个路径要走,这是需要有多个环节的。我们从矿山里面把矿挖出来,再把它提炼出来,再进行交易,再生产加工,最后做成成品,整个一个链条,我们以这样一个挖矿的模式做一个对比,每一个环节大家可以看到,真正的大数据发挥价值,它实际上是一个产业链协同的发展。任何一家公司,包括中国电信在内,不太可能说我从头到尾把所有的环节都能做好。而实际上目前为止,中国电信很多运营商还是做得比较基础的方面,我们更多是把数据资源,能够采集,能够做一些处理,做一些汇聚,真正让数据发挥价值还有一定的路径要走。
这个商业模式在大数据未来的产业会形成数据资的提供商,数据技术的提供商,数据的处理商,数据平台的运营商,数据能力的开发商,数据应用的提供商等等,每个环节可能都有不同的公司,不同的合作伙伴在里面,大家共同能够形成一个产业链。
这是从另外一个维度来看大数据的商业模式,我们可以从三个维度来看,一个是数据来源,应用领域,应用场景。我们来看大数据的行业应用是什么样的一个方式。
从数据来源来讲,运营商有大量的数据,但其他的至于互联网公司,金融机构,互联网部门也有大量的数据,在不同的行业,互联网,电信,影视传媒等等不同的模式。这个魔方里面的任何一块,可能都能去挖掘出一些新的大数据的商业模式的点。