E5061A个人大数据出问题了怎么办考出数据

大数据 及若干问题的讨论_数据分析师考试

1、大数据的发展趋势Gartner2014年发布了技术成熟度曲线,把一项技术的发展分为:创新的萌芽期膨胀期望的高峰期,幻灭的低谷期咣阴的爬升期,和生产率的稳定期五个阶段大数据技术经历了2011年的萌芽期,2012、2013的膨胀期现在慢慢进入幻灭的低谷期,实际上2014年大数據炒作的热度开始降温,大数据还有5到10年才会达到稳定期这样一个判断。

  2、大数据、大数据技术的认识误区数据量大是不是就可鉯成为大数据呢?这里面有一些认识上的误区。宁波的某个区花2亿元,在全区装三千多个高清摄像头每天产生5PB数据,是不是就是大数据?網上也流传过一些段子比如说卖包子的开店,通过分析人流量进行选址也叫大数据分析。我们在调研的过程中发现有些企业把历史嘚交易数据、财务数据等进行整合、,然后得出一些曲线图统计图等。传统数据的我们称为具备数据思维。这很好但还远远不够。┅般认为大数据有4个特点4V,即数据量大、数据类型繁多、高速处理、价值密度低但我们认为,大数据一定要有不同类型数据的融合,比如卫生局的数据和人口方面、地理数据等的融合可以有新的发现,产生新的价值这才是大数据真正奇妙的地方所在。宁波某区区長直言大数据就是烧钱没有钱是玩不起的。显然这种认识也是片面的如果大数据技术只是盲目上设备、大搞建设,却不知价值所在當然会入不敷出。但大数据真正的价值除了服务民生还要应用于产业,从而产生经济价值、带来经济效益

  3、数据的开放和共享问題。这里面既包括政府数据也有企业数据。原来我以为信息孤岛现象主要存在于政府部门,因为大家各自为政同时受IBM白皮书的影响(將智慧城市分为:智慧交通、智慧医疗、智慧环保等7个智慧板块),国内各级政府一窝蜂的上项目因为没有统一的规划和协调,上一个项目便成为一个信息孤岛但调研过后我们发现,其实政府部门的数据做到内部的互联互通、融合、共享还是比较容易的比如卫生局可以來协调所有医院的数据,因为有行政的手段可以干预和协调比如宁波卫生局的大数据应用就是一个很好的案例。而企业的数据共享就比較难比如腾讯很难把自己的数据共享给阿里,或者中移动对于一些企业来说,包括中小企业数据就是命脉,自己可能还没有好好利鼡一般是不愿意公开给别人的。所以这个互联互通是很难的因此在企业界,更容易出现信息孤岛现象

  针对以上两个问题,我们囿两点建议:政府数据共享目前证明,内部开放和共享是可能的但对企业和公众开放还没有很好的案例。因为也牵扯到涉密的问题國内某市长就曾直言,我把数据公开了如果有人挖掘出国家机密,算谁的责任?数据开放没有依据和标准所以我们的建议是,将数据进荇分级包括密级和轻重缓急,哪些数据可以马上开放、哪些可以逐步开放、哪些不能开放当然,开放不等于公开有些数据可以完全公开使用,有些经过申请和审批可以使用等等

  企业数据共享,我们认为数据既然有价值,就可以作为资产可以设立数据银行进荇交易,企业可以对自己的数据进行存取租用等。形成数据产业价值链让企业的数据可以实现增值和共享,这样来方便大家把数据贡獻出来进行流动,融合以及产生更大的价值当然具体商业模式可能还需要探索,还要解决数据的所有权问题等

我要回帖

更多关于 怎样将需要的数据筛选出来 的文章

 

随机推荐