镜像版首页| 高级检索|繁體版
您好,欢迎来到皮书数据库!

专家视点

刘世锦:今天我们该如何应用大数据
来源:皮书说  作者:本网转载   发布时间:2017-08-31

  本文转自国务院发展研究中心原主任,中国发展基金会的副理事长刘世锦在首部《大数据应用蓝皮书》发布会上的讲话。

 

  各位下午好!首先还是祝贺《大数据应用蓝皮书》的出版,严格来讲我是外行,外行有时候说话胆子比较大,我就说点非专业的一些想法。我在想一个问题,大数据现在有个很大的矛盾,数据现在产生了很多,但应用的很少。我看咱们书里也讲了一句话,“大数据是一个富矿”,而且我觉得这个矿是在快速生成。我看今天来的很多企业、互联网公司,美团、大众点评、滴滴等等,今天就在我讲话的此时此刻产生了很多数据,但是这些数据用起来了吗?基本上没有。所以我觉得我们现在大数据面临很大的问题,数据的快速爆炸式增长和还处在朦胧状态的甚至还没有上路的应用之间的矛盾,我们这本蓝皮书在这种情况下出版了,恰逢其时。根据我粗浅的知识,大数据和结构化数据还是有区别的,大数据应该是原生出来的东西,我们通过分析以后从中想找到一些规律。其实政府的数据更多是结构化数据,本身是有秩序的,是可以用的。大家都讲了,这两个方面都有问题,都没有用起来,市场化有市场化的问题,比如说现在可能很多企业没有认为他的数据是很值钱的,他们现在正忙着开拓业务,怎么把数据用起来,有些人还没有这个意识。政府机构的问题在什么地方呢?我们是一个集中度比较高的国家,但是遇到这种事的时候,你会看到条块分割。比如说某一座大楼里面几个政府机构各有数据,你让他们互相利用,对不起,不能共用,条块分割,各有各的问题。

  但是我想说,我们往前看,看一种可能性,如果说我们把这些数据窗户打开了,让数据流出来了,他们汇集起来之后会发生什么作用呢?我就想到一个词,一个是互补性,还有一个是集成效应。我举个例子,不知道准确不准确,比如北京最初的地铁是1号线和2号线,2号线是环行的,开始很多人由于离地铁比较远,实在坐不上,所以地铁的利用率其实不高。现在北京的地铁已经连成网了,在连成网的情况下,1号线和原来2号线的利用率比过去大大提高了。在网络状况下,原来任何一个元素,你的利用率是可以大大提高的。我觉得数据也是如此,我们现在很多数据,产生数据的那个单位可能没有认识到它的价值。所以我有一个感觉,第一步要能够把数据的互补性和集成效应利用起来,逐步认识、解决我们现在面临的数据快速生成和运用不足之间的矛盾。

  第二点,现在数据实际上太多,搜索引擎,像百度、Google,实际上是在海量数据的情况下,把数据整理一下,针对有用的数据筛选出来,我们现在面临的问题是数据太多。但是即使市场的数据、政府的数据打通以后也未必用得好。这里面有个很重要的问题,你得有一个框架,或者说解决方案。你想解决什么问题,你对那个问题本身得有一个很好的理解,你形成一个理解和解决问题的框架,然后把你的数据才能放到一个合适的位置上,使那个数据能够正确地解释或者解决某一个问题。这个方面我稍微有一点点体会,我最近几年正在做宏观经济分析,包括产业分析,我们就建立了一个宏观经济的产业模型,这个模型有了以后,在中国这块土地上,不论哪个行业和经济发生的相关的数据,我都能放到合适的位置上,这个数据放到合适的位置上它才有用,否则你放歪了,不在地方上,那个数据有些反而还得出一个错误结论。所以要解决某个问题的时候,你脑子里面实际上是有一个架构的。把这个架子搭起来,把数据再装配上去,我想用一个概念,叫“数据装配”的概念,装起来以后这个数据就有意思了,特别是还有可视化的手段,最后你会发现数据一旦用某种结构化的方式装配起来以后,它一定是非常美的。凡是符合规律的东西,它都是很美的东西,都是非常对称的。

  第三点,买单的问题,其实就是付费问题,把前两个问题解决以后,第三个问题就会解决。前两个问题,数据开放了,有数据源,第二个,有好的框架能装进去,装进去以后很美,但是不光是看的,一定是能够解决问题的,创造价值以后就有人给你买单。买单是硬道理,前提是创造价值。

  第二个问题,说说咱们中国,我们在这个方面目前处在什么状态上,我特别乐观,觉得中国在这方面是有可能弯道超车的,因为中国有三个有利条件。

  第一个,中国市场很大,大数据应用没有适当多的人群推不开,就是所谓的流量。这两天网上传几个帖子,现在IT企业全球排在前十位的基本来自两个国家,一个是我国,一个是美国,两个国家有个共同的特点,就是规模大、人多。其实你一定注意到另外一个国家——以色列,以色列在这个领域中也是很厉害的,但是以色列在纳斯达克小企业板块上上市公司很多,但是真正在主板上,大企业以色列几乎没有,以色列基本上都是创业阶段出来的东西,要商业化的就拿到美国,中国的优势是市场规模大。特别是IT的东西,现在对市场依赖超过以往,所以赢者通吃,你胃口足够大,但市场小通吃也没多大意思,通吃是吃进去那块蛋糕是足够大的,中国、美国是大蛋糕。

  第二,配套。我看到一些故事,最近包括硅谷有些人也跑到深圳去了,跑到深圳干什么呢?搞个创新中心,买零部件,有些在硅谷买不到的,在深圳买得到,深圳华强北这个地方组装能力是最强的,我们搞大数据是需要硬件的,中国配套能力全世界是最强的。

  第三,中国的技术,近几年正在往前走,我听到有些公司自己宣称他们已经走在世界前面了,我听了以后非常兴奋,但也不知道是真的是假的,至少像人工智能、新能源汽车,包括现在大数据好多东西,我们国内很多企业现在水平是不差的。我们的技术不一定领先,但是我们现在不一定那么落后了,跟他们是在同一个起跑线上。所以我们的市场很大,我们的配套能力强,技术现在也不太落后,甚至某些方面开始领先了,所以中国在这个领域真有可能弯道超车。

  第三个问题,到底大数据怎么应用?我们今天开会的时候邀请了一些企业,包括机构的同志来,也是这个想法,咱们怎么把它用起来?其实咱们在座的同志们此时此刻正在产生数据,每个人的手机都是终端,移动终端的出现,使现在的信息密度比以前不知道高了多少倍。我记得大概在改革开放初期或者是改革开放以前,文革的时候,那个时候我们在农村待过,一个公社只有一台电报机,手摇的,谁能打一次电话荣耀的不得了,之后是大哥大,现在基本上人人都有手机,智能手机是一个智能终端,都在收集信息,这些信息非常大,怎么把信息利用好?我觉得那些技术密集型、知识密集型的行业可能用的会更多。

  最近我们在讨论中国产业发展转型升级的问题,中国现在产业规模已经相当大了,数量扩张已经到了一个阶段,需要提升质量,过去我们提升数量,但发达国家企业数量减少,技术水平也提高了,我们现在面临一个机遇,我们也在提高,但是我们提高的方法跟他们不大一样,就是数字、数据的因素加进来后我们的转型升级可能跟他们是大不一样的,而且我们是个后来者,由于我们加了这个东西,我们很可能产生所谓“后发优势”,就像有的人手摇的、固定电话都没见过,直接就使手机了,而且是智能手机。我们产业升级很可能把数字、数据、大数据加进来,我是比较感兴趣,有这么一个大的判断,过去几年大体是消费端数据用的比较多,大量分析消费者的市场画像,哪些人卖什么东西,什么时候买,买了干什么,怎么消费,怎么付费等等,这类信息比较多。下一步我比较倾向于转向生产领域,比如,汽车是怎么造出来的,最近有些人关注新能源电池这类的东西,包括特斯拉,我感兴趣的是前面的屏幕,其实特斯拉除了新能源之外,信息技术也是很好的。这个领域将来会发生什么故事?我觉得我们可以充满期待,我们搞《中国制造2025》,我觉得很好,我们当时搞这个文件的时候,我知道有一部分科学家,主要是一些院士,他们在一块讨论以后大概形成的。但这也只能说一部分人对中国十年或者更长时间段以后的中国工业发展前景的展望,你千万不要用计划经济的思维方式,搞了一个2025,各个行业一定按上面讲的具体领域、具体事来干,计划经济为什么不成功?是因为未来是不确定的,不可能把十年以后的事看得很清楚。

  举一个最直接的例子——共享单车,今天我估计有同志是骑共享单车来的吧,我这两天注意看了一下共享单车在街上的数量,走了半个小时,发现90%以上的人都是骑的小黄车、小蓝车,这件事发生在多长时间前?一年前有吗?没有。就是半年多的时间。共享单车发展起来以后,有些过去要倒闭的自行车厂现在生意火得一塌糊涂,接单接到手软。从前说自行车行业肯定不行了,肯定要淘汰了,你怎么会预期到发展这么快呢?所以我说中国制造2025提出展望的方向,很好,我们可以认真吸收。但是政府部门不能让企业全部按照上面一个一个具体的事来干,创新的高度不确定的,空间是非常大的。

  我想我们在这个领域,还是要创新,给我们大数据的应用留下更大的空间。这样中国的工业一定能够走到前面去。其实中国人在这些方面不是一般的聪明,到目前为止,中国人经商,包括搞研发、搞企业,只要放开让聪明的中国人来干,还没看到哪个行业中国人不行。我觉得大数据应用方面咱们也是可以的。