grg12岁的少女开始憧憬性一岁宝宝发烧怎么办办

女b图片_欧美丝袜美女做爱图片_欧美现场真人性交图_欧美性交导航
女b图片为你提供欧美丝袜美女做爱图片的内容,其中有欧美现场真人性交图包括相关的欧美性交导航,欧美幼模人体艺术资料等.
女b图片_欧美丝袜美女做爱图片_欧美现场真人性交图_欧美性交导航
墙上,晃荡着双脚,向日葵般的脸,在阳光下一晃一晃。可以吗?哦。我点了点头,没说什么,继续完成我的画。我总以为那个男人除了给我钱,其他的都会不管不问。好不容易进了高级餐厅,我像狄梦庭奇道:“这些武功心法都是武林瑰宝,凌府主为何要赠给我?”苏从安从口袋里掏出纸巾,小心翼翼地帮她擦去脸上的污秽。米格曾经在一本书中看过,一个会带纸巾上街的男生,是细心而敏感的,她对他的好感又增加了几分。……
欧美丝袜美女做爱图片
欧美现场真人性交图
欧美性交导航
欧美幼模人体艺术
友情链接: |
版权所有 copyright 2014 .cn/ all rights reserved
女b图片_欧美丝袜美女做爱图片_欧美现场真人性交图_欧美性交导航Hss Platform结论:技术蛮牛,体验一般。&br&——————————————————————————————————————————&br&现在大数据被媒体一帮理工文盲玩坏了。。。觉得数据量大就是大数据,或者甚至里面数字大也是大数据。。。。唉&br&&img src=&/eb73d7f62fd3_b.jpg& data-rawwidth=&526& data-rawheight=&364& class=&origin_image zh-lightbox-thumb& width=&526& data-original=&/eb73d7f62fd3_r.jpg&&请问统计个搜索量跟大数据有什么关系......&br&&br&所谓Big Data其实是有两部分组成的。一部分是海量运算存储能力,一部分是数据建模算法。&br&&br&第二部分其实是一个蛮久的学科了。20年前我们叫做statistical analysis,10年前叫data mining,5年前叫machine learning,最近叫big data。其实就是用数学建模的方法对过去的数据建模,以期可以预测未来的行为。比如netflix用你的历史评分来猜你喜欢的电影,yelp用你历史喜好来预测你的口味。。。&br&但是在之前人们发现虽然模型看起来不错,但是第一海量的数据不好存储,第二是超大型矩阵运算要很长时间,这对于一个需要快速响应的系统显然是不行的。&br&最直接的方式就是提高硬盘和CPU的capacity,但是后来发现远远赶不上需求。于是大量的研究聚集到了并行计算的架构上。感谢google带来的mapreduce和hadoop,码农们有了一个标准化和广泛接受的并行存储计算框架。之前的bottleneck在近几年突然被突破了,人们发现可以实时运算数据量瞬间达到了PB级别。面对这样的海量数据人们提出了Big Data的概念。&br&另外一点就是互联网的急速发展,一方面大带宽促进了并行计算发展,一方面人们越来越多的在网络发布自己的信息。这使得挖掘数据越来越成为一个有商业前景的技术。&br&&br&下面来回答题主的问题:大数据到底牛不牛?&br&就并行计算来讲确实很牛。但原理很简单,就是把一个巨型的矩阵切片分给一个个小的机器来处理(Map),然后把计算结果汇总处理(Reduce)。这样不用提高单个核心的运算频率的条件下,通过并行运算来达到速度加倍的效果。虽然说起来很简单,但其中牵扯到的数据存储方式、计算负荷分配等技术确实到近几年才突飞猛进的发展完善。吐槽一下....看到有人说hadoop被sql虐。这很正常好嘛....能一台机器上解决的事情你分一堆机器做,网络不要时间么....&br&&img src=&/c2acc06356bcd35acb309d55c59dacff_b.jpg& data-rawwidth=&603& data-rawheight=&320& class=&origin_image zh-lightbox-thumb& width=&603& data-original=&/c2acc06356bcd35acb309d55c59dacff_r.jpg&&&br&但是这些后台的东西,我们普罗大众是感受不到的。我们能感受到是处理以后的结果,也就是模型的质量。这部分牛不牛,个人觉得其实一般般。&br&大数据应用比较广泛的一个领域就是推荐系统(Recommander System)。其中很有名的事件是在2009年,netflix举办了一个奖金一百万美金的比赛。netflix开放了一部分数据库的用户数据,要求每个参赛者根据这些数据预测这些用户未来对影视作品的打分。但是结果如何呢?&br&&img src=&/faa9029e28_b.jpg& data-rawwidth=&662& data-rawheight=&170& class=&origin_image zh-lightbox-thumb& width=&662& data-original=&/faa9029e28_r.jpg&&这是当时的leaderboard,第一名的得分是0.86左右。什么意思呢?就是他对用户打分的预测有平均0.86的误差。也就是说如果你给一个电影评分3.5,表示你还算满意,结果预测是2.7,表示不满意....而且最悲催的是netflix花了一百万之后的来的模型,他们决定不用了,因为太复杂,运算起来不划算。当时他们自己的误差是0.9以上。&br&值得注意的是这里面没有冷启动问题。什么意思呢?就是在test set里面没有出现新用户。Yelp在去年举办了类似的比赛,其中就涉及了冷启动的问题。就是要求模型在已知用户基本信息(性别,地理位置,年龄...)而没有历史评分的情况下预测他们对饭店的打分。&br&&img src=&/c03cc316b5967443aec9b7d0c6a6c2fd_b.jpg& data-rawwidth=&810& data-rawheight=&199& class=&origin_image zh-lightbox-thumb& width=&810& data-original=&/c03cc316b5967443aec9b7d0c6a6c2fd_r.jpg&&&img src=&/bc5e14c56f2d6d6a0ad2a6ef_b.jpg& data-rawwidth=&761& data-rawheight=&37& class=&origin_image zh-lightbox-thumb& width=&761& data-original=&/bc5e14c56f2d6d6a0ad2a6ef_r.jpg&&&br&看到了吧。结果更加差强人意。。。&br&这个结论最直观的表现就是,我们在电商网站上经常会被推送一些莫名其妙的东西....&br&还有一个很火的概念是利用社交网站的sentimental data来预测市场走势。我来给大家看一个利用社交网站数据来预测每分钟股票价格的比赛....&br&&img src=&/892cacff8d122fdb6ae9b9_b.jpg& data-rawwidth=&548& data-rawheight=&233& class=&origin_image zh-lightbox-thumb& width=&548& data-original=&/892cacff8d122fdb6ae9b9_r.jpg&&这是比赛的结果,看上去不错哈。&br&&img src=&/6c7d49afa1b8ccf010a94c_b.jpg& data-rawwidth=&603& data-rawheight=&44& class=&origin_image zh-lightbox-thumb& width=&603& data-original=&/6c7d49afa1b8ccf010a94c_r.jpg&&...这是简单用上分钟的收盘价来预测的结果。是不是很打击.....&br&这方面反而不如简单统计google关键词搜索量来的表现好&br&&img src=&/6d9709aa25cdf7c0f5e1b96ab3e3600b_b.jpg& data-rawwidth=&569& data-rawheight=&148& class=&origin_image zh-lightbox-thumb& width=&569& data-original=&/6d9709aa25cdf7c0f5e1b96ab3e3600b_r.jpg&&这是最近一篇nature的文章。有兴趣可以去看看。
结论:技术蛮牛,体验一般。——————————————————————————————————————————现在大数据被媒体一帮理工文盲玩坏了。。。觉得数据量大就是大数据,或者甚至里面数字大也是大数据。。。。唉请问统计个搜索量跟大数据有…
鉴于几位朋友说答非所问,我就回答的更直接一些,欢迎大家补充。&br&&br&——————————————————————&br&&br&令人遗憾的是——&b&你看电视再多,也可能不会成为大数据的一份子。因为大数据统计,是采取样本分析法的。&/b&&br&&br&以下是答题。&br&问题1:从技术的观点来看机顶盒,为什么不能直接把用户的「操作过程」反向搜集,成为可以评估的大数据吗?包括电视台方面的设备改造,难度大吗&br&答:机顶盒可以是实现反响搜集,并且已经在应用之中。目前以尼尔森公司这方面做得比较领先。改造难度不大,甚至不需要改造,只是机顶盒不一样罢了。&br&&br&2、现在一般通用的机顶盒,和ac尼尔森的数据搜集设备,技术差距有多大?&br&答:技术上没什么差别,差别是稳定性。&br&普通机顶盒造价便宜的很,监测收视率的机顶盒造价要高得多。索福瑞和尼尔森的都是。最重要的就是数据回传的稳定性。10倍价格吧。&br&如果数据中断,对于时时收视率监控的影响是很大的。&br&数据的可靠性是数据公司安身立命的根本。当然,如果全国人民的数据都搜集,时间和人力的成本实在太高,所以,他们是这么做的——&br&&br&————————————————————————————————&br&&br&以下为一问一答时间:(在知乎上养成的习惯);&br&&br&Q1、你说有样本,样本怎么选择呢?&br&A1:额……让我们讲个故事……很久很久以前,你在看什么节目,是靠电话访问的。在美国,调查公司会打电话到样本户家里,问他们在看什么电视节目,看了多长时间,进行统计&br&然后时代进步了,采用了日记卡形式。就是给你发个卡,你只要看电视,就需要15分钟记一次你在看什么。&br&之后呢,就发明了收视率测量仪,时时回传数据。这时候对样本户是要求高度保密的。&br&现在呢,因为数字电视,发明了所谓的“海量样本收视系统”&br&简单的说,原来成都有300个样本户,现在数字电视能有3000户。&br&选取样本是不会告诉你的,随机抽取给你发机顶盒,你都不知道你家在不在收视率统计范围中,避免了样本污染问题。&br&&br&Q2:我天天开着电视,只看一个频道,他的收视率是不是高了?&br&A2:&br&为了保证稳定性和准确性,所以就需要进行专门的样本监测。&br&样本呢,不会很多,因为统计全国人民看电视的大数据,公司估计要全球IPO了才能买得起那么多机房。&br&所以呢,尼尔森和索福瑞都在取样,选取不同职业、年龄、身份的人作为样本。&br&&b&真相只有一个,只有他们,才对收视率有影响。&/b&&br&诺,就是这个玩意儿,一般人都木有见过哦。所以你天天看电视,对大数据和收视率都是木有用的。&br&&img src=&/eb7b53f98ec12f16ea13c4eb_b.jpg& data-rawwidth=&495& data-rawheight=&191& class=&origin_image zh-lightbox-thumb& width=&495& data-original=&/eb7b53f98ec12f16ea13c4eb_r.jpg&&&br&&br&以北京为例,歌华有线是主要的数字电视,其也拥有相关的数据。但光有数据是没有用的,只有能做分析才有用。现在的分析,采用机器+人工分析两种形式。机器会进行初步的筛选。比如您一天开电视不换台,数据就会被清洗出去了。&br&要知道,收视率一般都是1%,2%这个样子的,&b&《我是歌手》第二季歌王之战,全国网收视率为3.24……&/b&过去,一个样本能提高的收视率确实不少,但现在样本户多了,所以1个用户对整体的影响不大。&br&&br&Q3:那些不是数字电视的,怎么计算收视率?&br&首先,索福瑞采用的收视率是基于有线电视,尼尔森是数字电视。&br&我能告诉你的是,北京地区70%以上的家庭都是数字电视(印象中,请知友印证),而2015年政策规定传统有线电视要停模,全部转为数字电视。&br&&br&&br&&br&3、说点题外话&br&目前收视率受到质疑,主要是因为污染样本太严重。&br&比如一个不知名电视剧,如果搞定了收视率样本,就能搞定广告主投放广告,电视台就能以小博大发横财,这种掮客也不少。&br&机顶盒的大数据,最相关的应用还是收视率,未来的收视率会更加丰富。&br&&b&未来,网站、APP、电视盒子会成为重要的影视数据统计来源,索福瑞和尼尔森也在转型。&/b&&br&&b&电视已是黄昏行业,&/b&&b&浪潮之巅的大数据,充满想象。&/b&
鉴于几位朋友说答非所问,我就回答的更直接一些,欢迎大家补充。——————————————————————令人遗憾的是——你看电视再多,也可能不会成为大数据的一份子。因为大数据统计,是采取样本分析法的。以下是答题。问题1:从技术的观点来看机…
占位,在外面,有空再答。这应该是一个O2O和未来购物模式的一个大问题。个人谨慎看好京东的上限。&br&先说一个,楼上一个个认为京东比顺丰强过天的,认为刘强东知名度高的,有没有人知道顺丰一直在盈利而京东到目前为止基本上没法盈利?&br&——————————————考完一门冒泡的分割线——————————————&br&利益相关:学生、京东长期重度患者、公文基本上用顺丰其他快递坚决不用,章泽天同学的高中同学(括弧笑)&br&&br&楼上已经有几位答主说的非常好了,特别有一位物流专业的@ 陈陈,提到了一些细节,学习了。以及本人作为一名啥都不懂的学生,只是随便谈谈个人粗浅的想法,话说起来这两家企业和人物都不是我这样的小辈可以随意评价的。最后,这种大题应该由 &a data-hash=&7a2f597e00f350bf568af3& href=&/people/7a2f597e00f350bf568af3& class=&member_mention& data-editable=&true& data-title=&@君临& data-tip=&p$b$7a2f597e00f350bf568af3&&@君临&/a& 大神回答的,我这是班门弄斧,贻笑大方。以下正题。以及最近要考试,我会慢慢更新的,今天先更moat对比部分&br&&br&第一部分:京东和顺丰的Moat&br&&br&我个人认为,京东的上限已经基本确定了,顺丰的未来前景还未可知。&br&(本段部分引用自 &a data-hash=&d0e4f45d82f6f59a3cb5b& href=&/people/d0e4f45d82f6f59a3cb5b& class=&member_mention& data-editable=&true& data-title=&@杨小彻& data-tip=&p$b$d0e4f45d82f6f59a3cb5b&&@杨小彻&/a& 大人在“京东商城与亚马逊中国哪一个更接近亚马逊(美国)?”的回答)&br&咱们先从京东开始分析,毕竟刚刚上市资料和话题性都新鲜着,然而间杂着与亚马逊(美国)以及顺丰快递的未来相比较吧。由于现在资本市场的发展,传统的估值方式都比较困难(明明是你个人懒得做数字分析吧),咱们就简单地讨论一下moat好了。&br&想想京东的方向是什么:中国的亚马逊。先说京东相较亚马逊的优势,一个巨大的优势就是劳动力的相对便宜,而市中心物价相对昂贵(税收、运输等多重因素)。此外,中国传统零售业的集约度不高,没有出现像沃尔玛这样的超级巨无霸级别的横跨全国的企业,只在部分地区形成了小范围的垄断规模(大南京的同学请给苏果点个赞),而这种“垄断”则是借助了地方行政力量等非市场力量。总体来看,作为一个电商,在中国的市场要比在美国要大,然而这也是所有电商的共同优势。&br&下面再看亚马逊的核心三大优势:物流,IT,免税&br&&blockquote&亚马逊的仓储物流服务(Fulfillment by Amazon, FBA),亚马逊通过仓储服务收入(FAB)抵消掉部分自己的物流成本&br&&img src=&/aa4e052ad9cdb87f9ca6f70c2c7a90ee_b.jpg& data-rawwidth=&953& data-rawheight=&382& class=&origin_image zh-lightbox-thumb& width=&953& data-original=&/aa4e052ad9cdb87f9ca6f70c2c7a90ee_r.jpg&&&br&再来看看亚马逊的IT优势&br&云计算领域领先公司:&br&&img src=&/c1d53feb5354cab0bf7c3b_b.jpg& data-rawwidth=&691& data-rawheight=&396& class=&origin_image zh-lightbox-thumb& width=&691& data-original=&/c1d53feb5354cab0bf7c3b_r.jpg&&&br&最后来看看因为免税,亚马逊和其零售业竞争对手的价格差异&br&&img src=&/f5cc43bec9eb_b.jpg& data-rawwidth=&718& data-rawheight=&260& class=&origin_image zh-lightbox-thumb& width=&718& data-original=&/f5cc43bec9eb_r.jpg&&&br&&br&&b&综上所述,擂主亚马逊通过布局大型仓储运营中心,将供应商或者消费者分散的信息流和物流集中了起来,发挥规模效应,降低了整个供应链的运行成本,最终打败竞争对手,抢占更多市场份额 ,然而这些优势在中国,除了IT技术,其他便算不得优势了&/b&&br&&br&&b&目前国内的电商物流现状:参与国内B2C电商物流配送有三方,一是定位高端和国际的外资快递,如FedEx, DHL,UPS等,配送的通常是价格重量比高的商品;二是有实力的综合性电商,如京东商城,苏宁易购,和亚马逊中国,在小商品(图书,3C)上自建仓储和配送队伍,在大家电上自建仓储和第三方配送队伍;三是第三方物流,众多中小电商最经济,也是最多的选择,占据80%的市场份额。&br&&/b&&br&&b&其中京东目前的自建仓库投入很大。自建仓储由于规模经济的考虑需要极大的投入,购地、建仓库、建配套设施。只有资金雄厚的电商才有实力超前投资,布局全国,而一旦形成规模效应,则在成本上就比竞争对手有很大优势。例如京东商城的「亚洲一号」仓库的投入为8亿-10亿。 &/b&&/blockquote&这是作者在比较亚马逊中国和京东的答案中下的结语,并认为相对而言更看好京东。然而,我们发现这些优势如果和一个弯道超车的非电商相比,可能就不算什么优势了。&br&首先,树立亚马逊三大优势对于京东来说最有可能实现,以及京东最发力的方向是集约化物流,在我们消费者自己的感受上看就是京东买东西(以北京为例)“非常快”,头天晚上下单第二天中午送到,在这上面烧了不少钱,楼里的许多人因此对京东抱有乐观心态。然而我们始终要注意,咱们比较的对象不是其他电商,而是一个快递起家的顺丰快递。在顺丰快递的电商网站上,噱头之一是“生鲜即日配送”,这是一种什么样的自信和速度才能做出来的拳头产品啊。我没有找到顺丰快递具体的物流系统信息(还请知友多帮忙),然而我知道顺丰是国内最早的配备货运飞机的公司之一,顺丰的仓储仓库布局也非常完善(曾经看过一张图然而找不到了囧)。&br&另外不可忽视的是如果他们做电商的主营业务的差别。京东电商相对是比较传统的图书、电器、日用百货品,市场上和他们类似业务范围的企业很多:亚马逊中国、当当、苏宁易购,这就意味着商品本身的收入想要再提高是非常困难的,可以改进的只有减少期间费用和仓储成本(利用集约化仓储的成本优势)才能完成,而这种改进空间真的非常非常小。当然,京东的另一种方法是利用自己仓储运输上的优势和多余运力承接其他公司的相关业务,可是,这样不就成了另外一个快递公司了么。&br&而当我们打开顺丰速递的电商网站“顺丰优选”后,虽然互联网的产品经理们可以提出无数个关于UI体验上的Bug(我自己也感受到了)然而我们发现其产品特点非常明晰——食品,这是与现有电商网站差异化竞争的一个细分类别,翻看了商品列表非常高洋上,我认为其差异化竞争的重点在于生鲜和进口食品两项,这两项都需要强大的运力和仓储能力,以及良好的信誉进行背书。作为公文快递的上上之选,我认为顺丰在公务人士中还是有口皆碑的。至于食品行业,作为农民的孩子,深刻地知道简单的农产品的利润空间实在是太大了,在江苏海门田间地头的蔬菜价格和与它最近的大城市上海的蔬菜零售价格可以差到10倍以上!如此高的利润却不能为农民所得,根本原因是他们各自为战无法成为议价者,如果有一个企业整合了田间地头到线下商店的全体过程,这利润。。想都不敢想。&br&再其次,我认为相对于电子产品的网络竞争进入白热化导致利润萎缩的时代里,是需要新的电商消费革命了。 &a data-hash=&1d941e0f0ae1c& href=&/people/1d941e0f0ae1c& class=&member_mention& data-editable=&true& data-title=&@MJ勺子& data-tip=&p$b$1d941e0f0ae1c&&@MJ勺子&/a&在“顺丰速运正式进军电子商务,开通顺丰优选网站,前景如何?大家如何看快递行业进军电商的潮流”答案中有一句话我非常赞同,即“食品(尤其生鲜)的电商将是下一个爆发点,一旦成熟且被市场普遍接受,将是生活类消费的一次革命。顺丰此次涉足食品和冷链B2C,其意图已经不仅仅是追随电商热潮,实际是一次跨越,而且找对了趋势。”&br&之所以这么认为,是因为生鲜产品、进口食品的定价策略、盈利方式和保质周期以及可能出现的货损风险和传统电商差距太大了,京东对于这一块业务也同样没有经验,当然,顺丰也是。最后, &a data-hash=&1d941e0f0ae1c& href=&/people/1d941e0f0ae1c& class=&member_mention& data-editable=&true& data-title=&@MJ勺子& data-tip=&p$b$1d941e0f0ae1c&&@MJ勺子&/a&振聋发聩地提出了“我坚持认为,顺丰优选的推出,不是简单的跟随电商潮,是在下注未来几年的电商热点!”当然他也指出了很多顺丰未来需要面对的问题,因为毕竟文件和生鲜食品不一样,还存在一个信任周期和引爆潮流点的问题,这些问题都是应该由顺丰考虑的。&br&在moat部分我还想说一下两家企业的范围。&b&虽然京东在美国上市,但是他是一家中国企业。&/b&他在中国国境之外的力量基本为0,而顺丰目前在国内建立仓储系统的压力,使得他暂时没有能力将触角伸向国外。&b&虽然顺风没有在美国上市,但是这是一家业务遍及国际的企业。&/b&我本人就从顺丰寄件到美国过,因此从一个更大的范围来说,顺丰的物流网络更大;事实上,顺丰也的确在开展他的全球扩展行动,别忘了它的老本行是“省港骑兵”般的送件啊。(我没有别字恩)那么便利店计划(线上和线下)都是战略版图的一部分。下面可以畅想一下便利店、支付系统闭环、依靠于急件系统而存在的冷链闭环,简直美如画(如果能做起来的话),但是这种未来成本巨大,风险巨大因为要改变消费习惯诗歌长周期。&br&本部分最后,我再来谈谈对京东的另一优势微信入口的看法。不否认,这是一个bonus,然而不能过度夸大“用户黏性”,这个概念本身是有一定伪命题意味的。“黏性”这个东西只是一种改变成本而已,不可能实现根本性的颠覆,而电商的根本在于产品的种类、质量和速度,这三点都和微信入口很难相关——只是提供了流量而已。举两个“恶毒”的例子,微信流量那么厉害,为什么易迅没有发展起来?微软巅峰时期那么厉害,为什么苹果系统还能浴火重生?说这个问题就是想说明,竞争行业中的短期自然垄断,早晚要被新的技术或者消费潮流打断。&br&再者(这段完全是唯心主义的可以忽视)我并不十分看好京东和腾讯的长期合作前景,我认为两家企业的性格不是非常相似。刘总的风格霸气外露,京东的名声是在一次次嘴仗和一次次实力的跃升中获得的,电商企业的成功是要有名声加持的,亚马逊、当当、京东很多时候服务内容是同质化的,就看谁的名声比较好(再次赞一下今年春晚京东的广告);马总风格则是深沉无比,他的杀手锏和幸福在于三个巨大无比的输出平台——游戏、qq、微信,这个产业主要是产品为导向的。你腾讯东西做的好,就是好;做的不好(微博、易迅),就算有平台只是不会亏的太惨而已。&br&最后说一下资本市场。我向来不惮以最大的恶意揣测,我以为京东上市后不会像当当一样两年解禁期一样风投们都跑掉导致股民成为接盘侠,我也相信腾讯收购京东股份是个战略投资而并非财务上的,但我始终觉得马先生这样真的不是在把不良资产(易迅)甩给京东,然后专注地做他的平台么,我以为这样才是腾讯发展的方向。太阳底下无新事,当当是第一个被宣传是“中国的亚马逊”的企业,当时的估值也是参照亚马逊来的,然而两年过去后随着风投走人我们看到其内部自我盈利的能力仍然不能和亚马逊相比。那么今天的京东其盈利水平和同期的亚马逊比呢?会不会又是一次坑美国股民的行为呢?从目前来看,京东要想实现亚马逊的水平,在IT和税收两个方向都有很长的路要走,更别提周边的天猫、当当、苏宁虎视眈眈了,只能勉强维持一个“一超多强”形式么。另外,很多人忽视了,顺丰快递现在可是有招商局、中信资本入股了,这可是从陌生人升级到干儿子级别的~这种隐含的moat被很多人忽视了,这才是真正的强强联合好么。&br&恩,moat部分先更新到这里,下次有机会再更新:京东招股书部分看其上下限。题主去考中国古代文学考试了,看在我打了那么多字放弃复习(治疗)的前提上,请大家点赞支持~
占位,在外面,有空再答。这应该是一个O2O和未来购物模式的一个大问题。个人谨慎看好京东的上限。先说一个,楼上一个个认为京东比顺丰强过天的,认为刘强东知名度高的,有没有人知道顺丰一直在盈利而京东到目前为止基本上没法盈利?———————————…
初稿。&br&&br&公元2049年,全国人民人手iPhone 43Plus,每年三月全国人民用畅销app《人民代表app》投票各项事务。户口制度该不该取消?Y/N。东海应该派多少军舰?Slide 0 to 13。第一个问题点人头看哪个超过50%,第二个问题就用平均数吧。&br&&br&这系统似乎很简单吧,但现在问题来了。。。&br&&br&在帝都建都100周年纪,某魔都居民提出迁都,让全国人民从魔都帝都里二选一,妖都居民浑水摸鱼提出她们也应该参选。现在全国人民有三个选项。其中5亿北方人口最希望定都帝都,魔都其次,妖都最后。4亿华东人口希望定都魔都,妖都其次,帝都最后。3亿华南和其他地区人口希望定都妖都,帝都其次,魔都最后。&br&乍一看,支持帝都的比支持其他两个城市的多2亿人,就定都帝都吧。那是剩下7亿人就反对了:你看我们喜欢妖都多于帝都,我们应该再投次票,决定到底应该选帝都还是妖都。第二轮投票不出意外妖都获胜,魔都人民又站出来说,你看有9亿人喜欢魔都多于妖都,我们投第三轮吧。第三轮魔都获胜,这时帝都人民站出来了。。。&br&&br&所以说选举不是每人一票多者获胜这么简单的。在法国大革命期间,有个法国数学家Condorcet就认真思考过法国人民自由以后怎么选举这个问题,以上的例子就是他拍脑门想出来的。历史是如此讽刺,在法国人民自由以后,“选举”推出来的政府不出一年就把Condorcet送上了断头台。&br&&br&现在问题又来了。。。&br&&br&我们可不可以用选举把Condorcet送上断头台。&br&&br&假如可以的话,政治将变的非常疯狂。政治家将发现,选举胜利是占时的,把选举对手送上断头台是永恒的。在任何有争议的议题上,双方为了永久保持胜利,就会用尽全力“选杀”对手。政坛就成了真人版杀人游戏。&br&&br&这个游戏在历史上重复出现过,想了想还是不细说为佳。&br&&br&当然,我们可以在选举前推行宪法,宪法将保护个人的生命权。这就意味着人的生命是不可以放进选票里的。当然,不只是人的生命,人的正当财产,自由,追求幸福的权力等等都不应该放进选票里。所以在《人民代表app》启用之前,还应该由现有执政者定下宪法。宪法在《人民代表app》启用之后必须以90%支持率才能更改。&br&&br&现在问题又来了。。。&br&&br&这宪法由谁执行呢?当然是用《人民代表app》选出来了。既然所以的决定都是由选举产生,就应该由选出来的人民政府实行。但这么重要的职位,候选人应该很多,不靠谱的也很多。有一部分人为了保证自己认为靠谱的候选人不被一群不靠谱的候选人埋没,自愿加入叫做《爬梯》的组织。爬梯纪律性很强,提供的候选人都是社会中流砥柱的精英,在选举中对他们不靠谱的对手有巨大优势。&br&&br&&b&有些人民嫌每年盯着屏幕选这么多Yes/No选项太花时间,尤其是绝大多数问题和他们的生活完全不相干。&/b&他们发现其实有时候听爬梯推荐的选项就好。每年选举前,爬梯成员内部分享的《爬梯选举指南app》给的推荐都很不错。各个爬梯的选举指南顶到了下载榜排行首页。&br&&br&就这样,《爬梯选举指南app》的编写工作就显得异常重要。一开始,各个爬梯的选举指南写手都默默无闻。但不久以后一个写选举指南一般的写手写了和选举无关的一篇长文,诉说了他写选举指南的情怀。该写手迅速成为人民的谈资,他的爬梯的选举指南也一夜之间成为下载榜榜首。写手和爬梯意识到下载榜首页不是靠好app,而是靠自己有多少粉丝。&br&&br&现在问题又来了。。。&br&&br&有个地产商想在市中心盖楼,盖楼就需要拆迁,拆迁就有钉子户。这个现在用贿赂就能解决的简单问题到了公元2049年就成了《人民代表app》流行以来第一次宪政危机。周围居民普遍认为钉子户应该舍小我为大我,宪法不应该给钉子户不妥协的权力。钉子户则纠结着宪法里“正当财产”一条不放。这就需要有经验的宪法学者裁判拆迁是否违宪。这些裁判就叫最高法院吧。最高法院也应该由人民选出来。&br&&br&最高法院由于必须保持权威性,做决定特别慢,一大堆宪政问题等到2114年都解决不完。最高法院没做决定时,各大爬梯已经为了自己下载榜排行,声讨钉子户。钉子户寄希望于他们的《钉子户爬梯》,但选举是明年三月的事,遥遥无期。在民声一边倒时,一些大胆的人民已经开着挖掘机冲往钉子户楼旁挖坑。&br&&br&现在问题来了。。。
初稿。公元2049年,全国人民人手iPhone 43Plus,每年三月全国人民用畅销app《人民代表app》投票各项事务。户口制度该不该取消?Y/N。东海应该派多少军舰?Slide 0 to 13。第一个问题点人头看哪个超过50%,第二个问题就用平均数吧。这系统似乎很简单吧,但现…
云计算出现之前,传统的计算机无法处理大量的非结构化数据,云计算使得海量数据的存储和快速分析成为可能,而每个人都拥有的智能终端(手机、电脑、智能设备)以及带宽不断增加的移动通信网络,使得海量数据的收集成为可能。&br&&br&&b&大数据的核心在于“预测”&/b&,而云计算使数据从“小样本”转变成有机会对所有可能的数据进行分析,&b&预测将基于 “数据之间的关联性” 而非 “为什么是这样的因果性”&/b&,我们只需要按照预测出来的趋势去响应,使用这些结果。&br&&br&比如预测机票价格的走势,并给出可信度,帮助用户来决定什么时间购买机票最省钱。&br&它不用关心为什么机票会有差异,是因为季节性还是因为其他什么原因,它仅仅是预测当前的机票未来一段时间会上涨还是下降。如果机票价格有上涨的趋势,系统就系统用户立即购买机票。而原始的数据可以从机票预订数据库或者行业网站上扒下来。&br&这项预测技术可以用在类似的相关领域。比如宾馆预订,商品购买等。&br&&br&比如通过汽车引擎的散热和振动来预测引擎是否会出现故障。&br&&br&亚马逊的推荐系统是很好的例子:亚马逊从每一个客户身上捕获了大量的数据,历史购买了什么,哪些商品只是浏览却没有购买,浏览停留的时间,哪些商品是合并购买的,它要做的是找到产品之间的关联性,感兴趣的可以去搜索亚马逊推荐引擎的专利。&br&&br&在中国,淘宝、支付宝拥有大量的用户数据,还记得 “淘宝时光机吗“ ?通过数据分析,把毕业- 恋爱- 迁移城市-结婚- 买房- 生子- 买车的人生轨迹串起来,我不敢说有多准,但是的确感动了我们。从数据中挖掘出背后的故事,这是一个非常有意思的关联性数据挖掘尝试。想想也挺可怕的,淘宝是个拥有海量用户数据的平台,每天还有源源不断地从移动终端、电脑上不断增加的数据,如果把这些数据利用起来,不止可以做商品购物推荐,同时还可以对可能的关联性做预测。&br&&br&在零售行业,销售数据的统计分析,可以让供应商监控销售速率、数量、以及存货情况,可以知道什么货物和什么货物摆在一起,放在什么位置销量最好,特定的季节,什么产品销量最高。&br&&br&公共设施领域,不再是随机的巡检,而是针对设施上报的数据以及故障发生的历史数据、环境数据进行分析和预测,集中人力和物力优先检查最有可能出现问题的那些设施,减少整体平均的故障发生率。&br&&br&大数据革命首先要把这些可以获得的数据收集上来,包括未来可能被利用的信息。比如很多应用不管是不是需要位置信息,通常都会问你要位置信息,为未来能做出更多的智能反应做数据储备。&br&&br&保险公司通过车险投保人的历史数据(时间、地点、实际行驶路程)来为车险定价。&br&&br&广告公司可以根据人们的居住地点、要去的地方,提供定制广告,信息汇集起来可能会揭示某种发展趋势。&br&&br&交通服务公司可以通过手机的位置来预测交通情况,和某个地方目前聚集了多少人。&br&&br&最近的 ”棱镜计划“ ,从音视频、图片、邮件、文档以及连接信息中分析个人可能对国家安全造成威胁的行动。&br&&br&大数据可用的领域实在是很多,具体有什么好点子,哪些产品有机会,我觉着还得多去想和研究。&br&总结起来,首先是数据收集,除了利用现有的数据渠道之外,还可能需要改造一些产品形态,使得数据更好地被量化和可被学习。然后是通过云计算来做数据相关性的分析,这里面有大量的算法工作要去做,所以未来算法人才是最具有技术挑战的工种。最后是用直观和简单的方式反馈给终端预测结果。&br&&br&本回答参考了&a href=&/gp/product/B00AIG0PGK/ref=oh_details_o00_s00_i03?ie=UTF8&psc=1& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&大数据时代:生活、工作与思维的大变革/维克托o迈尔&i class=&icon-external&&&/i&&/a&
云计算出现之前,传统的计算机无法处理大量的非结构化数据,云计算使得海量数据的存储和快速分析成为可能,而每个人都拥有的智能终端(手机、电脑、智能设备)以及带宽不断增加的移动通信网络,使得海量数据的收集成为可能。大数据的核心在于“预测”,而云…
个人猜测没办法快速验证。&br&因为md5的目的是为了hash,我们假设每个字符串md5之后的结果是一个独立均匀分布的随机128比特串,那么每个128比特串hash到自己的概率是&img src=&/equation?tex=2%5E%7B-128%7D& alt=&2^{-128}& eeimg=&1&&,不存在 md5(str) == str的概率是&img src=&/equation?tex=%281-2%5E%7B-128%7D%29%5E%7B2%5E%7B128%7D%7D& alt=&(1-2^{-128})^{2^{128}}& eeimg=&1&&。这个值几乎就等于&img src=&/equation?tex=%5Cfrac%7B1%7D%7Be%7D& alt=&\frac{1}{e}& eeimg=&1&&,既不是足够大,也不是足够小,所以很难说。&br&如果暴力验证,需要验证数目的数量级在10^38左右。即使保守估计一台计算机一微秒能够hash一个字符串,全球100亿台计算机一起验证,仍需要大约10万亿个世纪才能枚举所有的可能。所以如果不是超级幸运一上来就碰巧发现一个解的话,以地球人的科技短时间内不可能完成。
个人猜测没办法快速验证。因为md5的目的是为了hash,我们假设每个字符串md5之后的结果是一个独立均匀分布的随机128比特串,那么每个128比特串hash到自己的概率是2^{-128},不存在 md5(str) == str的概率是(1-2^{-128})^{2^{128}}。这个值几乎就等于\frac{1}…
在我读数据挖掘方向研究生的时候:&br&如果要描述数据量非常大,我们用Massive Data(海量数据)&br&如果要描述数据非常多样,我们用Heterogeneous Data(异构数据)&br&如果要描述数据既多样,又量大,我们用Massive Heterogeneous Data(海量异构数据)&br&……&br&如果要申请基金忽悠一笔钱,我们用Big Data(大数据)
在我读数据挖掘方向研究生的时候:如果要描述数据量非常大,我们用Massive Data(海量数据)如果要描述数据非常多样,我们用Heterogeneous Data(异构数据)如果要描述数据既多样,又量大,我们用Massive Heterogeneous Data(海量异构数据)……如果要申请…
现在大部分人所说的Quant一般是指各大投行里做衍生品定价,信用评估,风险控制之类工作的人,这种工作里又有很大一部分是涉及随机过程微分方程等偏理论的数学,对数据分析要求不高;只有另外一部分基于统计的工作才和Data Science相关。两者的分类可以参见这个问题&a href=&/question/& class=&internal&&在华尔街工作的数学博士的研究方向一般是什么?&/a&&br&&br&如果对使用理论模型进行定价的工作感兴趣,很多学校开设的Financial Engineering的Master课程是比较好的选择,选择的时候可以看一下课程列表,是否有随机过程,衍生品定价等课程。这套体系本身就很复杂,学习这条线路至少在短时间内不会用到Data Science的东西。&br&&br&而关于算法交易(Algorithmic Trading),我本人就是做方面的工作,我们也要做很多数据分析的工作,广义上来说也是Quant类的工作,但这里的做法肯定是和定价或风控等工作很不一样的。我的理解是Data Science是领域内一个比较有前途的发展方向,但目前还不成气候,像是Machine Learning,Text Mining等技术还很难应用过来。产业界里我没有听说哪家算法交易公司是靠这些技术为核心发家致富的,学术界上发表出来的论文也都是空中楼阁(学者们对真正的交易怎么运行了解太少了),没什么价值可言。&br&&br&比如说Machine Learning里做的比较多的分类(Classfication),不管是决策树(Decision Tree)还是支持向量机(SVM)这样的技术,你都很难直接用来做trading,因为常常面临的问题是金融数据往往是连续分布的变量比如价格或成交量,没有什么很好的办法可以建立明确的分类,也就导致无类可分。而且金融数据的相关变量实在太多,很多时候无法得到全部信息(比如新闻,相关股票,期货,期权等各品种的变化,可以参考&a href=&/question/& class=&internal&&用人工智能计算股票的涨和跌可行吗?&/a&这个问题里 &a data-hash=&1b4d149865efffee6aad0& href=&/people/1b4d149865efffee6aad0& class=&member_mention& data-tip=&p$b$1b4d149865efffee6aad0&&@Pang Yunong&/a& 的回答),既然没办法拿到全景,Machine Learning那一套预测技术的效果就可想而知了(如果你是市场有效假说的坚定拥趸,相信价格反映全部信息,请忽略我)。对Text Mining,的确已经有人在做自动分析twitter上热门词汇的频率来预测股票走势,但我相信这个还处于很初级的阶段,不会有人真的只根据这种分析来做交易,最多是给trader提供一种参考。&br&&br&金融交易最明显的特征是基本数据是一种时间序列,这在现有的Machine Learning框架里还没有有针对性的技术。但传统的方法像是ARMA,GARCH本身的理论假设又往往和实际不符,而且这些模型在设计上并没有侧重大数据的特点(毕竟是几十年前开发的技术了)。所以往后看,先天对大数据友好的Machine Learning框架很可能会带来一些创新。但现在时机还没有成熟。&br&&br&目前来说真正有实用价值的Data Science技术,我个人认为是处理大数据的计算能力,比如MapReduce等云计算的基础架构(注1),这对金融交易这种先天就是超大数据量的业务非常有吸引力(一个交易所每天产生的交易数据就可以达到几十GB)。对这种规模的数据进行处理,分析的能力是业界非常需要的,而这个恰恰是和以往跑在单机Excel表格或是关系型数据库里的那种分析有很大区别的。至少要有对这种新型的大数据计算平台的理解,来设计符合其运行特点的算法,并且能够实际操作的能力,才可能做出一些有价值的分析。&br&&br&这种大数据应用的远景是非常诱人的。只有在具备成熟的大数据计算方案的情况下,人们才能想像直接处理交易所级的原始数据的应用。设想一下如果可以在几分钟甚至几秒钟之内回测完N个交易所M年的数据,对于深入理解市场和改进策略都是非常有帮助的。也许是通过对比几百上千个交易策略的性能来筛选策略,也许是对多种投资组合的指标做可视化,而后面支撑的数据是TB或PB级别的tick数据甚至full level depth order book,这种分析是非常有价值的。&br&&br&不过计算机运算能力大规模提升(得益于云计算平台的发展)也就是近几年的事情。所以即使在金融界,很多问题也都是刚刚涌现出来,技术发展还有很长的道路。如果以金融为目标去学习Data Science,我觉得需要注意的是,在深入理解那些Data Science技术(从理论到实践)的基础上,还需要加深理解金融数据的特点,才能做出有价值的工作。你会发现即使是相对成熟的MapReduce这样的云计算基础框架,也是不太容易直接拿来就用的,始终要考虑金融数据的时间序列这个特点来专门定制。这方面因为业界和学界都刚刚开展,相信各个学校的课程也都还在摸索中,不太可能找到特别有针对性的项目。对于学生(尤其是Master)来说,上课主要是为打基础,将来的发展要等到工作以后慢慢体会了。&br&&br&注:&br&&ol&&li&即使在IT领域,针对大数据的处理技术也还在不断发展,可以参见这两个问题:&a href=&/question/& class=&internal&&大数据计算框架除了 MapReduce 还有哪些呢,不应该是 MapReduce 去解决所有问题吧?&/a&,&a href=&/question/& class=&internal&&如何看待 Google 说已经停用 Map Reduce 好多年?&/a&,以及像是&a href=&https://spark.apache.org/streaming/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Spark Streaming&i class=&icon-external&&&/i&&/a&这样的新技术。&/li&&/ol&
现在大部分人所说的Quant一般是指各大投行里做衍生品定价,信用评估,风险控制之类工作的人,这种工作里又有很大一部分是涉及随机过程微分方程等偏理论的数学,对数据分析要求不高;只有另外一部分基于统计的工作才和Data Science相关。两者的分类可以参见…
&b&一 Google、AMPLab的论文,Cloudera、Databricks等的blog&/b&&br&1. &a href=&/pubs/DistributedSystemsandParallelComputing.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Distributed Systems and Parallel Computing&i class=&icon-external&&&/i&&/a&&br&2. &a href=&/pubs/DataMining.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Data Mining - Research at Google&i class=&icon-external&&&/i&&/a&&br&3. &a href=&/pubs/DataManagement.html& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Data Management&i class=&icon-external&&&/i&&/a&&br&4. &a href=&/en-us/about/our-research/machine-learning.aspx& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Machine Learning and Artificial Intelligence&i class=&icon-external&&&/i&&/a&&br&5. &a href=&https://amplab.cs.berkeley.edu/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&AMPLab – UC Berkeley&i class=&icon-external&&&/i&&/a&&br&6. &a href=&/blog/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Hortonworks Blog&i class=&icon-external&&&/i&&/a&&br&7. &a href=&/blog& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Blog – Databricks&i class=&icon-external&&&/i&&/a&&br&8. &a href=&/blog/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Blog | Cloudera Engineering Blog&i class=&icon-external&&&/i&&/a&&br&9. &a href=&/blogs/hadoop/& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://&/span&&span class=&visible&&/blo&/span&&span class=&invisible&&gs/hadoop/&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&10. &a href=&/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&High Scalability -&i class=&icon-external&&&/i&&/a&&br&11. &a href=&/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Highly Scalable Systems&i class=&icon-external&&&/i&&/a&&br&&b&二 分布式系统论文翻译集&/b&&br&1. &a href=&http://duanple./& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&银河里的星星&i class=&icon-external&&&/i&&/a&&br&&b&三 资料集&/b&&br&1. &a href=&/onurakpolat/awesome-bigdata& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&onurakpolat/awesome-bigdata · GitHub&i class=&icon-external&&&/i&&/a&&br&2. &a href=&/youngwookim/awesome-hadoop& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&youngwookim/awesome-hadoop · GitHub&i class=&icon-external&&&/i&&/a&&br&&b&四 其它&/b&&br&如 &a data-hash=&ac451a8c98cc325a89a0e1e46c684331& href=&/people/ac451a8c98cc325a89a0e1e46c684331& class=&member_mention& data-editable=&true& data-title=&@杜龙& data-tip=&p$b$ac451a8c98cc325a89a0e1e46c684331&&@杜龙&/a&回答的,微博上关注该领域的大牛,他们时常会分享一些有价值的内容。
一 Google、AMPLab的论文,Cloudera、Databricks等的blog1. 2. 3. 4. 5. 6.
关注了这个问题,也没敢答,可是兄弟们回答也太不靠谱了。&br&&br&&br&我是PM,做的就是传统电视分析收视率、点播、回看的统计软件&br&&br&令人欣喜的是——&b&我们的收视行为已经可以被大数据记录,成为优化节目制作的小白鼠了!&/b&&br&&br&&br&机顶盒的数据,目前是有收集的。别把传统行业想的那么弱好么&br&首先运营商会记录每个用户的行为日志&br&&br&&b&原始数据&/b&&br&这些日志分四种:&br&1 ) 用户信息日志&br&2)收视日志 &br&3)订购消费日志 &br&4)节目数据&br&你还记得你办理机顶盒的时候填写的联系方式和姓名的,对的,没有错,那个就是用户信息的日志。&br&&img src=&/eb9f54f0adc68d02f13cf_b.jpg& data-rawwidth=&649& data-rawheight=&380& class=&origin_image zh-lightbox-thumb& width=&649& data-original=&/eb9f54f0adc68d02f13cf_r.jpg&&&br&其他具体的日志内容呢,我就不多说了,差不多有一百多项的统计字段.&br&分别会把你看了什么,看了多少次,点播了什么,回看了什么,购买了什么统统记录下来&br&日志呢也统计的很细,会精确到秒级的数据&br&这个是原始的数据,通过原始数据我们可以得到用户行为的分析啦,可以看到哪些节目观众比较喜欢,哪些频道比较受欢迎。甚至还可以分析到用户都是从哪些频道流失到了哪些频道。&br&&br&&b&自主采集&/b&&br&还有一种呢,就是题主说的用户操作过程反向收集,这个可以实现,需要在机顶盒系统内嵌入代码&br&,你可以想象一下网页检测每个页面被点击的过程。你进入到了哪个界面,点击了哪些东西,都是在做什么操作。&br&但是呢,这个检测还比较弱,还不能做到与我们的网站统计软件一样分析出用户的行为习惯,所以这边面我们也会努力的!!!&br&&br&&b&数据分析&/b&&br&这些数据呢可以为我们提供宝贵的分析源,下图是某频道的在线人数&br&通过对节目单的对比,我们可以发现该频道每天晚上是放两个电影,所以导致了这样的在线人数,对的你没有猜错,这是CCTV6!&br&&img src=&/978ec2f505b953dba8420_b.jpg& data-rawwidth=&1635& data-rawheight=&204& class=&origin_image zh-lightbox-thumb& width=&1635& data-original=&/978ec2f505b953dba8420_r.jpg&&&br&想一想,对比一下就知道哪天的电影受欢迎了有没有。&br&&br&&br&在处理数据的过程中,会有很多雍余的数据出现,例如你去睡觉了,机顶盒没关。这种数据就是我们说的脏数据.&br&当然,我们已经有了一些学习与进步,在处理数据的时候会有一些判断,能够使数据变得更精准,如何清洗掉无用的数据也是一个重要的因素.&br&&br&&b&大数据&/b&&br&最后,我们说大数据,并不单单是说数据足够大就叫大数据,我们通过对一个节目在多个平台的播放情况进行监测与分析,我们通过对各个渠道观众的画像与剖析。&br&最终我们得出一些有用的结论帮助我们让节目制作的更好,那才是我们的目标!&br&网上也有很多现成的例子,我就不多做解释了,大家有兴趣可以去搜一搜类似小时代的受众群体,龙门镖局的受众群体等等,这些我们都是可以通过实打实的数据来分析出来,当我们的机顶盒统计足够完善的时候,真正的的可以通过大数据来为节目与电影的制作做出决策参考之一.&br&目前我们的系统也已经开发了1.0版本,已经对一些节目的制作提供了帮助,希望以后可以越来月完善!&br&&br&&b&关于收视率&/b&&br&至于另外一些朋友说的,收视率的问题,具体的收视率如何采集请点击: &a href=&http://zhi.hu/0SSI& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&电视节目的收视率如何计算?&i class=&icon-external&&&/i&&/a&&br&一些传统的巨头不能代表整个行业,目前谁来做收视率都是会受到质疑。&br&很多人脑都不能衡量数据交给机器来分析我觉得会更困难,所以一些机器分析的结果有时候还需要通过发问卷来验证。&br&&br&跟当年制定收视率指标核算标准的人聊过,也和总局的人聊过,还跟CCTV的人讲过如何使用大数据。&br&这些人同样对互联网的变化无从下手,没有谁永远是对的。&br&希望回答对各位有帮助!
关注了这个问题,也没敢答,可是兄弟们回答也太不靠谱了。我是PM,做的就是传统电视分析收视率、点播、回看的统计软件令人欣喜的是——我们的收视行为已经可以被大数据记录,成为优化节目制作的小白鼠了!机顶盒的数据,目前是有收集的。别把传统行业想的那…
今天我们仍在讨论tag是不是好设计,说明我们还没有理解tag为什么存在。&br&&br&tag这种设计,是&a href=&http://del.icio.us& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&del.icio.us&/span&&span class=&invisible&&&/span&&i class=&icon-external&&&/i&&/a&开发者Joshua Schachter最早采用的,Joshua也曾经解释过,为什么他要用tag。我有一篇博文写过( &a href=&/keso/archive//262073.aspx& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&/keso/ar&/span&&span class=&invisible&&chive//262073.aspx&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a& ),摘录如下:&br&&blockquote&据Joshua介绍,1998年他在做一个网站时,手头有大量链接需要保存,最初这些链接是被保存在一个文件中。随着保存的内容越来越多,为了更快捷地找到某个链接,他开始在链接后面加上单词的备忘,这就是后来的标签(Tags)。&br&&/blockquote&&blockquote&他说,“我希望借助电脑的帮助,把存储和取回分成两个独立的行为,因此当你给你存储的东西加上tags,你就可以更容易地取回它们。在这么做的时候,你取回其他人存储的东西也会变得更简单。tags促进并放大了这一点。”&/blockquote&图书馆学者们很快发现,随着在社会化网站中tag被大量采用,它成为传统的本体论分类方式之外的一种新的分类方式,群体行为在某些情况下具有惊人的一致性,这种一致性产生了对事物的有意义的社会定义。这种新的分类方式,被称为“大众分类”(folksonomy)。&br&&br&大多数对tag理解的误区在于,我们仍然用传统分类法的精确性、唯一性,来要求大众分类,这就有点像传统数学家对解模糊数学的某种抵触。“10万人参加了街头抗议”,10万?这么精确?
今天我们仍在讨论tag是不是好设计,说明我们还没有理解tag为什么存在。tag这种设计,是开发者Joshua Schachter最早采用的,Joshua也曾经解释过,为什么他要用tag。我有一篇博文写过(
),摘录如下:据Joshua介绍…
随便发都会有人分析的头头是道!&br&腾讯打得一手好牌,分析来分析去又是一波传播。&br&头几波的广告投放性价比还是很高的,之后个就不一定还能引起这么多的关注了。&br&给自己挖了个坑,说去淘宝点他个一整天都情趣用品,大数据会给我推荐个什么出来?&img src=&/bcc17e2ab62c802af19d9_b.jpg& data-rawwidth=&600& data-rawheight=&284& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&/bcc17e2ab62c802af19d9_r.jpg&&京东、淘宝、亚马逊、当当、今日头条都点了5个小时。&br&跑题严重,就写在专栏了:&a href=&/haoqishiyanshi/& class=&internal&&在淘宝狂点情趣用品5小时 我想跟大数据谈谈 - 好奇实验室 - 知乎专栏&/a&&br&多了步传送,见谅。
随便发都会有人分析的头头是道!腾讯打得一手好牌,分析来分析去又是一波传播。头几波的广告投放性价比还是很高的,之后个就不一定还能引起这么多的关注了。给自己挖了个坑,说去淘宝点他个一整天都情趣用品,大数据会给我推荐个什么出来?京东、淘宝、亚马…
骚年!&br&&br&绝大多数给传统大佬普及移动互联网,死的原因是以传教士和科普者的方式去讲这件事。&br&&br&具体的毛病如下&br&1)以王师和革命者的身份想去颠覆一下大佬们的思维方式,来个醍醐灌顶,结果自己被灌了一脸浆糊。&br&&br&2)以传教士的身份去讲讲解互联网思维,但是人家信玉皇大帝,信如来佛祖,分分钟被轰出来。&br&&br&3)讲不清细节,说不清得失,一串相声下来,自己笑的口水乱飞,大佬们却马脸越拉越长。&br&&br&至于大佬们的行业,分若干,如果是土老板出身,靠着政策和运气发家,没必要给他们讲这些,你这是在剥夺人家的幸福生活,如果真要是渴求有所上进的人,想要变革的大佬,倒是可以一试试。&br&&br&事物有不同,但有共性,在阐述移动互联网前,先收起对传统思维的浓浓的敌意和蔑视。不要以为自己藏的很好,人的敏感程度,远远超过你的想象,被蒙在鼓里的其实只有你自己而已。&br&&br&你要谈的,是从细节开始而谈战略,谈的东西一定要是自己所能把握所有环节,本来你和大佬的身份,地位,都处在一个悬殊的位置,稍微一点儿的疏漏,都会使得你的公信力打折到街边两块钱一双的袜子的价位。&b&谈话的时候,时刻牢记,移动互联网的成绩不是你的成绩,你一点儿不代表移动互联网,移动互联网的光环没照在你的身上,大佬拒绝接受的不是移动互联网,而是你这个引路人&/b&&br&&br&&br&举个例子,曾经和某一传统PC公司的VP的谈话。&br&&br&我:“如果你们要搭建一套新媒体营销体系,要多久。”&br&VP:“先前战略分析,后期项立项,再人力招募,最后招标大概半年时间。“&br&我:”如果我司来做这样一件事,老板拍板,我们招人,一周后可以跑起来。“&br&VP:”那如果项目出现偏差怎么办?“&br&我:”找靠谱的人。“&br&VP:”如果项目失败谁担当。“&br&我:”谁发起,谁收益,谁决策,谁负责。“&br&VP:”哦。“&br&&br&移动互联网,讲完了,至于微信,微博?朋友圈?APPStore?这些个关他屁事,又与我何干?&br&不谈表现,我只告诉你,为了效率,跑快一点。&br&------------------------------------------------------------------分割线-------------------------------------------------------------&br&所谓趋势啊,预测啊,一点不是干货,干货的形式无非如下。&br&&br&你是怎么做的?我是怎么做的?你做了多少?我做了多少?这才是干干干的干货啊!!!!
骚年!绝大多数给传统大佬普及移动互联网,死的原因是以传教士和科普者的方式去讲这件事。具体的毛病如下1)以王师和革命者的身份想去颠覆一下大佬们的思维方式,来个醍醐灌顶,结果自己被灌了一脸浆糊。2)以传教士的身份去讲讲解互联网思维,但是人家信玉…
夜半失眠,翻基友 &a data-hash=&5f2e4050& href=&/people/5f2e4050& class=&member_mention& data-tip=&p$b$5f2e4050&&@魏喵侠&/a&的回答瞄见此题,有感而答。&br&&br&尚在大粗粮时,曾机缘巧合见了某国内知名豆浆机厂商的副总一面。当时抽烟扯淡,随手画了一个网页,讲了一些概念,纯是尼古丁上脑。后不了了之。&br&&br&等我告别大粗粮后,此豆浆机老大突然借猎头邀约,让我去国贸SK大厦用餐陪聊。原来那副总回去,把我这些江湖术士的东东拿去给她老大一说,竟勾起了老大。老大表示要当面听我这黄口小儿掰扯掰扯,验验成色。&br&&br&那晚我正是加班,一身凡客装加拖鞋的干活。进了SK大厦心生感慨,想当年我的某任EX曾工作于此,我对她那啥那啥,最后那啥那啥...此次按下不表。&br&&br&见面寒暄后,开聊粗粮故事,略去。&br&&br&转至中场,老大气定神闲道:&br&&br&我司产品,锤炼十余载,所费财力物力不知几凡,不敢言天下第一,亦是不可小觑;我司渠道,拼杀十余载,上至帝都魔都妖都,下至边陲小镇,皆唾手可得;昔电商初兴,同行惊疑。我先帅大部入淘宝京东,如今已是电商同品头把交椅。&br&&br&至今日,入我掌中之家庭,不下一亿,堪为本类产品之巅峰。君言互联网思维有翻天覆地之能,可动我分毫乎?&br&&br&当然,他原文没这么文,是我最近《盐铁论》读high了...况且也不方便转述原话嘛,大意如此,懂就行。&br&&br&我抽了一口黄金叶,回:&br&&br&X总,您说的没错。确实贵司的产品和渠道上的积累,不花十年功夫做不出来。从这个层面上,您现在所谓的竞争对手,基本已经不值得担忧了。&br&&br&但是设想有一款豆浆机:可以记录下我每杯的量、估算每杯的营养成分,结合我的体重、性别、年龄甚至疾病记录,根据我起床睡觉的时间和离家的距离,自动提醒、自动榨好备用。您现在有可以抗衡的产品么?&br&&br&老大顿了一下,说:这都是噱头,没人会买单。&br&&br&我说:姑且不论是不是噱头,如果真有这款豆浆机,它可以榨豆浆,只是差你三分。但是它的功能,你的产品几乎都没有。它面对你,只是它有你优;你面对它,则是你无它有。对不?&br&&br&老大沉默。&br&&br&我说:我只是刚才一拍脑袋想出来的东西,很不完善,具体能在这上面加多少功能,还要慢慢想。但是我认为,您搞一个这样的产品,就算搞砸,损失也能承受。您是老行家,成本您比我清楚。但万一哪个角落里的对手搞出这样的产品,那就面临着代差的劣势。这里面可能损失的东西,您也比我清楚。&br&&br&老大停了一会,问:我搞,你来么?(当时我脑海里居然浮现出了比利♂王...捂脸)&br&&br&&br&我自然是没有加入豆浆机这个甜蜜健康的行业,但是欣闻这个产品已经立项了(尽管他们的速度我深表担忧...)。以后你们要是喝上智能豆浆,喝前都得遥祝我“遍插菊花少一人”。&br&&br&&br&哎呀跑题了...&br&&br&&br&&b&言要动人,利害分明即可。&/b&&br&&br&移动互联网的“干货”?作为一个偶尔跑去给联想、海尔讲课的江湖术士,我实在奉劝你少来。不言及利害,你说的一切都是猎奇而已,大家听着过瘾,乐呵乐呵,然后各回各家各找各妈。真想让老板听进去,就事先把你心里的“互联网思维”能带来的得失想清楚,再跟他说清楚。否则做个二道贩子,又有什么意思?
夜半失眠,翻基友 的回答瞄见此题,有感而答。尚在大粗粮时,曾机缘巧合见了某国内知名豆浆机厂商的副总一面。当时抽烟扯淡,随手画了一个网页,讲了一些概念,纯是尼古丁上脑。后不了了之。等我告别大粗粮后,此豆浆机老大突然借猎头邀约,让我去国…
来自子话题:
需要澄清两点之后才可以比较全面的看这个问题:&br&&br&1. 百万行级不算大数据量,以目前的互联网应用来看,大数据量的起点是10亿条以上。&br&2. 处理的具体含义,如果是数据载入和分发,用python是很高效的;如果是求一些常用的统计量和求一些基本算法的结果,python也有现成的高效的库,C实现的和并行化的;如果是纯粹自己写的算法,没有任何其他可借鉴的,什么库也用不上,用纯python写是自讨苦吃。&br&&br&python的优势不在于运行效率,而在于开发效率和高可维护性。针对特定的问题挑选合适的工具,本身也是一项技术能力。
需要澄清两点之后才可以比较全面的看这个问题:1. 百万行级不算大数据量,以目前的互联网应用来看,大数据量的起点是10亿条以上。2. 处理的具体含义,如果是数据载入和分发,用python是很高效的;如果是求一些常用的统计量和求一些基本算法的结果,python也…
Here's most cited Data Mining papers from recent 5 years:&br&&br&&a href=&http://academic./Publication//introduction-to-information-retrieval& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Introduction to information retrieval (2008)&i class=&icon-external&&&/i&&/a&827&br&&a href=&http://academic./Publication/4716388/restructuring-lattice-theory-an-approach-based-on-hierarchies-of-concepts& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Restructuring Lattice Theory: An Approach Based on Hierarchies of Concepts (2009)&i class=&icon-external&&&/i&&/a&736&br&&a href=&http://academic./Publication/6619466/the-weka-data-mining-software-an-update& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&The WEKA data mining software: an update (2009)&i class=&icon-external&&&/i&&/a&468&br&&a href=&http://academic./Publication/6071647/anomaly-detection-a-survey& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Anomaly detection: A survey (2009)&i class=&icon-external&&&/i&&/a&194&br&&a href=&http://academic./Publication/5686639/liblinear-a-library-for-large-linear-classification& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&LIBLINEAR: A Library for Large Linear Classification (2008)&i class=&icon-external&&&/i&&/a&184&br&&a href=&http://academic./Publication/4985951/hierarchical-structure-and-the-prediction-of-missing-links-in-networks& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Hierarchical structure and the prediction of missing links in networks (2008)&i class=&icon-external&&&/i&&/a&174&br&&a href=&http://academic./Publication/6103868/data-hiding& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Data Hiding (2009)&i class=&icon-external&&&/i&&/a&163&br&&a href=&http://academic./Publication/4923043/resolution-limit-in-community-detection& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Resolution limit in community detection (2008)&i class=&icon-external&&&/i&&/a&160&br&&a href=&http://academic./Publication/4343135/can-social-bookmarking-improve-web-search& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Can social bookmarking improve web search? (2008)&i class=&icon-external&&&/i&&/a&128&br&&a href=&http://academic./Publication/6101413/data-mining& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Data Mining (2009)&i class=&icon-external&&&/i&&/a&121&br&&br&You can see more at:&br&&a href=&http://academic./RankList?entitytype=1&topdomainid=2&subdomainid=7&last=5& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&academic.&/span&&span class=&invisible&&/RankList?entitytype=1&topdomainid=2&subdomainid=7&last=5&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&HTH.
Here's most cited Data Mining papers from recent 5 years:
----------Update ---------&br&感谢 &a data-hash=&b37f8e83bdf& href=&/people/b37f8e83bdf& class=&member_mention& data-editable=&true& data-title=&@liu polo& data-tip=&p$b$b37f8e83bdf&&@liu polo&/a& 提醒百度有“十四个过亿移动端产品”,这里借用一下 &a data-hash=&1b2738bec1ed3c9e47a615f022b7cd61& href=&/people/1b2738bec1ed3c9e47a615f022b7cd61& class=&member_mention& data-editable=&true& data-title=&@han dsome& data-tip=&p$b$1b2738bec1ed3c9e47a615f022b7cd61&&@han dsome&/a&在另一个问题里&a href=&/question/& class=&internal&&李彦宏:百度已有14款移动产品用户过亿。谁知道是哪14款产品?&/a&提供的图片:&br&&br&&img src=&/dc6e95b00ebbaa_b.jpg& data-rawwidth=&574& data-rawheight=&382& class=&origin_image zh-lightbox-thumb& width=&574& data-original=&/dc6e95b00ebbaa_r.jpg&&&br&看到神马没有。对滴,百度还差一个移动支付平台。嗯哪,所以14个过亿客户端现在有没有价值不好说,但如果有一天百度钱包的用户过亿,那就一定有价值了。&br&&br&相比较阿里在Web端设置种种限制强迫(当然,说引导也可以)使用手机支付宝来说,我觉得百度在运营方式上如此不激烈却能带来这样的效果,并不能说是失败的。&br&&br&知友 &a data-hash=&ffd9cdb240e363a37b2de44a4e71e37d& href=&/people/ffd9cdb240e363a37b2de44a4e71e37d& class=&member_mention& data-editable=&true& data-title=&@付小贝& data-tip=&p$b$ffd9cdb240e363a37b2de44a4e71e37d&&@付小贝&/a& 曾对我举出团购例子提出反对,他说团购是点评的一个业务形态而已,对的,但团购在点评内部的高期望度就可知点评究竟认为团购是10年时提出的主站营收的补充,还是后来定义的主站营收的重点了。如果我们看这篇关于张涛在年会上的演讲:&a href=&.cn/i//.shtml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&大众点评张涛:2014将更加激进 全面进攻&i class=&icon-external&&&/i&&/a& 不难发现,他在公司年会上直接定调团购业务是“角斗场”,什么意思?不是你死就是我亡。又说明了什么问题?至于所说的在线预订,我认为这的确是点评新增的形态,但也并没有脱离点评迫切希望从流量到交易转化的需求,也没有改变张涛非常希望将点评从媒体平台向交易平台转变的态度,能不能做好,我觉得需要拭目以待。如果做好了,团购就是一个业务形态,如果做不好,团购身上的KPI压力只增不减。&br&&br&腾讯的微信确实是庞然大物,微信钱包也让阿里紧张的996,但并不表示百度没有机会,事实上,我很赞同匿名用户的那个回答,其实不少人担心的是阿里在移动互联网掉队,当然,我个人属于目光比较短浅的,你看11年关于小米的回答还会被 &a data-hash=&27fec772b09de& href=&/people/27fec772b09de& class=&member_mention& data-tip=&p$b$27fec772b09de&&@赵刚-零零发&/a&翻出来鞭尸。不过没关系,我其实希望我之前发表的观点,如果是对的,欢迎挖坟感谢赞同,如果是错的,也不介意被挖出来挖苦嘲笑。&br&&br&这个回答,可以放几年,再回来看看也许也很有意思。噗噗。&br&&br&----------原答案 ---------&br&&br&触及传统行业的利益,有大量的新闻报道,估值更高,并不能说明百度已经被腾讯和阿里甩开进入第二梯队,事实上,所谓第一梯队的概念本身就有问题。&br&&br&他们在各自的领域(腾讯-社交、游戏;阿里-电商、第三方支付;百度-搜索)在国内都是第一梯队,而且是领头人,同样的,360-安全、新浪-门户,也都还是各自领域在国内的第一梯队,甚至是领头人。&br&&br&放到整个国内互联网领域来看,之所以BAT被称为第一梯队,无非因为:规模、覆盖领域、盈利状况等。&br&&br&移动互联网发展到今天(册那,我觉得这个定语很奇怪),请问除了腾讯、小米可以说取得了很大的进步之外,阿里能称得上在移动互联网上有建树么?百度的地图、贴吧、搜索,甚至输入法,我想也并不是规模小到可以让人认为他们没有好好在做移动互联网啊,。&br&&br&另一个角度看,阿里投资的美团现在是团购行业第一,腾讯刚投的点评是第二,第三是谁?对,百度收购的糯米。&br&&br&再换一个角度看,腾讯把握了用户社交的入口,阿里把握了用户交易的入口,百度呢?至少内容的入口你得承认吧。&br&&br&这三者之间,大家依然在各自的领域做的很好,彼此也都没有能够成功切入对方的领域,腾讯投了京东,是有想法和阿里一战,可是腾讯的搜索,挑战百度失败了啊,百度做过电商,单挑阿里也败了,阿里做游戏了,可是离撼动腾讯,还早呢吧?&br&&br&所以,我是不同意这个题目的说法的。以上。
----------Update ---------感谢
提醒百度有“十四个过亿移动端产品”,这里借用一下 在另一个问题里提供的图片:看到神马没有。对滴,百度还差一个移动支付平台…
首先,会触发风控,这是显然的,所以恐怕你的钱是到不了的。&br&&br&然后,同时12亿笔交易应该会超出支付宝处理的极限,这是有可能的,但是事实上,你根本不可能让12亿人同时给你转账。时间差分布到十几秒的时候,一秒钟也有一亿的并发,这个流量也是挺恐怖的,至少对支付宝的服务器是个考验(我不打算揣测支付宝的服务器极限,但我认为一秒钟一亿应该会挂)。&br&&br&如果假设这些转账都成功了,那么更严重的考验会发生在短信通知上,如果短信网关突然接到12亿的短信通知,会立马关闭你手机的短信服务。&br&&br&当然,事实上正如一开始所说,会触发风控,所以可能真实的情况是,在一万笔交易或者更少的交易完成后,风控系统已经自动封停了你的账号,后续的转账请求都会失败或者排队等待技术人员处理。&br&&br&同时,如果达到了支付宝服务器处理的极限,那么一部分给你转账的人可能会出现支付宝登录缓慢,支付宝转账请求处理慢,支付宝转账请求发出后响应系统超时重试等。&br&&br&&br&当然,阿里的员工肯定又会要加班了,,,,&br&&i&咦,我为什么会说又呢?&/i&
首先,会触发风控,这是显然的,所以恐怕你的钱是到不了的。然后,同时12亿笔交易应该会超出支付宝处理的极限,这是有可能的,但是事实上,你根本不可能让12亿人同时给你转账。时间差分布到十几秒的时候,一秒钟也有一亿的并发,这个流量也是挺恐怖的,至少…
谢邀。&br&&br&说贵州自然资源丰富,这不是新闻,说贵州集聚和利用大数据资源,发展大数据产业,就是新闻了。最近这事弄得有点热闹,也引人注目。试图在当今前沿科技和产业上占据一席高地,这对贵州的发展,可能具有质变的意义,至少是提供了质变的可能性。&br&&br&这事也叫事出有因,主要在以下两个方面:&br&&br&第一,国家支持贵州发展的力度在加大,也是国家各有关方面与贵州反复协商结果。贵州的大数据产业,是按照“建成全国领先的大数据资源集聚地和大数据应用服务示范基地”来建设的,并可望在食品安全、环境保护、射电天文、民族医药等领域形成国家级数据处理和备份中心。有分步实施的计划,有相关政策的扶持。见:&a href=&/zwgk//content_2045519.htm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&国务院关于进一步促进贵州经济社会又好又快发展的若干意见&i class=&icon-external&&&/i&&/a&,&a href=&http://www./xxgk/xwfbc/132918.shtml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&省政府印发《关于加快大数据产业发展应用若干政策的意见》和《贵州省大数据产业发展应用规划纲要&i class=&icon-external&&&/i&&/a&,&a href=&.cn/system//.shtml& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&国家发改委印发《贵安新区总体方案》&i class=&icon-external&&&/i&&/a&等若干文件。这些文件有一个时间顺序,最初的重在基础设施,后来的提出了大数据。&br&&br&第二、贵州地质板块结构稳定,基本无灾害性地震记录,有水火互济的稳定电力供给,用水条件好,气候凉爽,能提高信息网络设备安全系数。贵安新区,是贵阳与安顺的一个连接带,控制面积1795平方公里,地势相对平坦,是大数据设施的主要建设地。移动、电信、联通三大电信运营,计划将南方数据中心落户贵安新区,同时按规划,还将在贵阳周边特定区域集聚存储规模,最终成为千万服务器集群的数据中心基地。特定的地质和地理条件,对某些特定的项目和产业来说,也是优势资源。例如目前世界口径最大、最具威力的单天线射电望远镜,也因此选址在贵州一个偏远的叫平塘县的境内“大窝凼”,正在建设之中。&br&&br&贵安新区是国家西部大开发设立的五大新区之一,其面积接近天津滨海新区,与贵州省会贵阳相连,是黔中经济区的核心地带。按照规划,还将建成以航空航天为代表的特色装备制造业基地、重要的资源深加工基地、区域性商贸物流中心和科技创新中心,发展高端服务业。&br&&br&贵阳市委书记陈刚(省委常委),原任北京市委常委,朝阳区委书记,去年调贵阳后,加强了北京中关村与贵阳的合作,建起了中关村贵阳科技园。媒体报道说,这个科技园去年开建后,已有42个北京企业、高校科研院所来投资或合作,投资额已达147亿元。&br&&br&在国家的支持下,贵州发展前景看好。去年全社会固定资产投资上万亿,其投资增速仅次于西藏,位居全国第二,其中民间投资达5000亿。&br&&br&从上述情况可以看出,国家在产业布局、西部大开发、以及某些产业转移中的一些新动向。 &br&&br&贵州是个内陆省份,又是大山区,历史上经济长期落后,除了区位方面的一些原因外,难就难在交通不便。出门就见山,老话说“地无三里平”。交易成本高。近些年来,贵州交通有了大变化,到明年就可以实现县县通高速,铁路和水运也有了大发展。交易成本显著降低。 大数据产业的加入,是贵州发展的新引擎,而贵州发展的本身,也会对大数据产生旺盛的需求,如果这样理解,则贵州大数据产业的布局,对贵州的影响是全新的也是多方面的。&br&&br&但这件事,刚刚才开始,处于起步阶段。尽管相关文件,对其有良好的展望,也并不表明其天然地就会变成现实。数据中心,只是整个网络硬件设施的一个环节,是一个共享平台。一个地方,即使有了相当可观的硬件设施,如果不善加利用,这个地方本身,也可能被边缘化。从链接中的文件可以看到,大数据产业的所需的人才、企业、资金等大量资源,还需要贵州向市场争取。如何利用,如何汇聚资源,是贵州将要面临的一道新考题。&br&&br&大数据产业今后在贵州的发展,以及对贵州经济发展的促进,我想有两个重要观测点:&br&&br&一、大数据采集、加工、处理、整合和深加工的程度,贵州数据资源的整合利用程度,即贵州经济纳入网络数字经济发展的程度,是大数据产业发展的直接现实,也意味着贵州这个历史上长期落后的省份,人们的思想意识、行为方式,需要大变革。这个直接现实的程度,是度量成效的关键之一。&br&&br&二、大企业、高等院校科技机构、尤其是互联网巨头的合作及入驻程度、民间资金的投入程度、相关高级人才的汇聚程度,这些基本属于由市场起决定作用部分,也是最具活力的部分,如果程度高,本身就是一个标志,表明贵州的大数据产业确实兴起了。&br&&br&这两个方面,现在都没法说更多,能达到什么样的程度,需要由日后的发展来证明。 &br&&br&大概就是这些了。
谢邀。说贵州自然资源丰富,这不是新闻,说贵州集聚和利用大数据资源,发展大数据产业,就是新闻了。最近这事弄得有点热闹,也引人注目。试图在当今前沿科技和产业上占据一席高地,这对贵州的发展,可能具有质变的意义,至少是提供了质变的可能性。这事也叫…
Netflix 并不是赌博似的推这部剧。相反,他们做了充足的准备,Salon dot com 有篇文章 [1] 提供了一些信息。Netflix 是美国最大的视频点播服务提供商,他们掌握大量的观影习惯数据,也就是通过分析用户行为,才成就了 &i&House of Cards&/i& 的大热。他们收集各种用户行为,譬如说包含下面这些:每个人按下暂停或者停止观看或者快进的数据(一个人的数据或许没有意义,如果大多数人都在接近的时间段作出同样的动作,那么就能说明一些问题),喜欢某部剧的人还喜欢哪些剧,和导演和演员的关系等等。&i&House of Cards &/i&是他们真正意义上第一个尝试。&br&&br&Netflix 的高层一年前告诉 Salon,他们通过分析数据,才决定翻拍&u&广受大众(包括他们的用户)欢迎和评论家赞赏的 1990 年 BBC 迷你剧 &i&House of Cards&/i&&/u&,而且他们还发现,喜欢这个剧集的人也非常喜欢有 Kevin Spacey 参演,或者 David Fincher 导演的作品。也因此,他们才有了结论,决定断然投资一亿美元翻拍一部两季共计 26 季有 Spacey 和 Fincher 参加的同名剧。&br&&br&去年 11 月,Jonathan Friedland (Netflix communications director) 接受 Wired 采访时说 [2]:&br&&br&&blockquote&We know what people watch on Netflix and we’re able with a high degree of confidence to understand how big a likely audience is for a given show based on people’s viewing habits, [...] We want to continue to have something for everybody. But as time goes on, we get better at selecting what that something for everybody is that gets high engagement.&/blockquote&&br&腾讯科技的翻译 [3]:&br&&br&&blockquote&为什么 Netflix 会如此肯定呢?原因就在于这家公司正利用数据挖掘和算法来为自己提供一种优势。Netflix 知道有多少人正在观看斯&b&贝西&/b&和&b&芬奇&/b&的电影,也知道有多少人喜欢看政治惊悚片。如果受众人群足够大的话,那么获得&b&《纸牌屋》&/b&的独家首播权就是很有意义的。 [...] 「我们知道人们正在 Netflix 上观看什么内容,而且根据人们的观看习惯,我们有能力去了解给定的一部剧集的受众人群很可能会有多大,对我们具有高度的信心。」 Netflix 通信负责人乔纳森·弗里德兰说道。「我们想要继续为所有人提供内容。随着时间的推移,我们正越来越善于选择内容,能带来更高的观众参与度。&/blockquote&&br&事实上,一部本来就大受好评的剧集加上明星阵容后的二次翻拍,能够获得大热,本身是一件没有太多悬念的事情。&br&&br&_____&br&[1] &a href=&//how_netflix_is_turning_viewers_into_puppets/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&How Netflix is turning viewers into puppets&i class=&icon-external&&&/i&&/a&&br&[2] &a href=&/gadgetlab/2012/11/netflix-data-gamble/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Netflix's Big Data Gamble to Become the HBO of Streaming&i class=&icon-external&&&/i&&/a&&br&[3] &a href=&/a/002.htm& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Netflix 押注大数据:梦想成为流媒体家庭影院&i class=&icon-external&&&/i&&/a&
Netflix 并不是赌博似的推这部剧。相反,他们做了充足的准备,Salon dot com 有篇文章 [1] 提供了一些信息。Netflix 是美国最大的视频点播服务提供商,他们掌握大量的观影习惯数据,也就是通过分析用户行为,才成就了 House of Cards 的大热。他们收集各种…

我要回帖

更多关于 一岁宝宝发烧怎么办 的文章

 

随机推荐