知道当前人数及未来小麦种植养分需求比例例,怎么选具体数量

{"debug":false,"apiRoot":"","paySDK":"/api/js","wechatConfigAPI":"/api/wechat/jssdkconfig","name":"production","instance":"column","tokens":{"X-XSRF-TOKEN":null,"X-UDID":null,"Authorization":"oauth c3cef7c66aa9e6a1e3160e20"}}
{"database":{"Post":{"":{"title":"数据分析的13种思维","author":"RickyFine","content":"作者:胡晨川原文出自:原文链接:“数据分析的目的在于驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,相信将来你一定能用上!\n\n1、信度与效度思维\n\n这部分也许是全文最难理解的部分,但我觉得也最为重要。没有这个思维,决策者很有可能在数据中迷失。信度与效度的概念最早来源于调查分析,但现在我觉得可以引申到数据分析工作的各方面。所谓信度,是指一个数据或指标自身的可靠程度,包括准确性和稳定性,取数逻辑是否正确?有没有计算错误?这属于准确性;每次计算的算法是否稳定?口径是否一致?以相同的方法计算不同的对象时,准确性是否有波动?这是稳定性。做到了以上两个方面,就是一个好的数据或指标了?其实还不够,还有一个更重要的因素,就是效度!所谓效度,是指一个数据或指标的生成,需贴合它所要衡量的事物,即指标的变化能够代表该事物的变化。只有在信度和效度上都达标,才是一个有价值的数据指标。举个例子:要衡量我身体的肥胖情况,我选择了穿衣的号码作为指标,一方面,相同的衣服尺码对应的实际衣服大小是不同的,会有美版韩版等因素,使得准确性很差;同时,一会儿穿这个牌子的衣服,一会儿穿那个牌子的衣服,使得该衡量方式形成的结果很不稳定;所以,衣服尺码这个指标的信度不够。另一方面,衡量身体肥胖情况用衣服的尺码大小?你一定觉得荒唐,尺码大小并不能反映肥胖情况,是吧?因此效度也不足。体脂率,才是信度和效度都比较达标的肥胖衡量指标。在我们的现实工作中,许多人会想当然地拿了指标就用,这是非常值得警惕的。你要切骨头却拿了把手术刀,是不是很可悲?信度和效度的本质,其实就是数据质量的问题,这是一切分析的基石,再怎么重视都不过分!2、平衡思维说到天平大家都不陌生,平衡的思维相信各位也都能很快理解。简单来说,在数据分析的过程中,我们需要经常去寻找事情间的平衡关系,且平衡关系往往是关乎企业运转的大问题,如市场的供需关系,薪资与效率关系,工作时长与错误率的关系等等。平衡思维的关键点,在于寻找能展示出平衡状态的指标!也就是如图中红框,我们要去寻找这个准确的量化指标,来观察天平的倾斜程度。怎么找这个指标呢?以我的经验,一般先找双向型的问题,即高也不是低也不是的问题,然后量化为指标,最后计算成某个比率,长期跟踪后,观察它的信度和效度。3、分类思维客户分群、产品归类、市场分级、绩效评价...许多事情都需要有分类的思维。主管拍脑袋也可以分类,通过机器学习算法也可以分类,那么许多人就模糊了,到底分类思维怎么应用呢?关键点在于,分类后的事物,需要在核心指标上能拉开距离!也就是说分类后的结果,必须是显著的。如图,横轴和纵轴往往是你运营当中关注的核心指标(当然不限于二维),而分类后的对象,你能看到他们的分布不是随机的,而是有显著的集群的倾向。举个例子:假设该图反映了某个消费者分群的结果,横轴代表购买频率,纵轴代表客单价,那么绿色的这群人,就是明显的“人傻钱多”的“剁手金牌客户”。4、矩阵化思维矩阵思维是分类思维的发展,它不再局限于用量化指标来进行分类。许多时候,我们没有数据做为支持,只能通过经验做主管的推断时,是可以把某些重要因素组合成矩阵,大致定义出好坏的方向,然后进行分析。大家可以百度经典的管理分析方法“波士顿矩阵”模型。5、漏斗思维这种思维方式已经普及:注册转化、购买流程、销售管道、浏览路径等,太多的分析场景中,能找到这种思维的影子。但我要说,看上去越是普世越是容易理解的模型,它的应用越得谨慎和小心。在漏斗思维当中,我们尤其要注意漏斗的长度。漏斗从哪里开始到哪里结束?以我的经验,漏斗的环节不该超过5个,且漏斗中各环节的百分比数值,量级不要超过100倍(漏斗第一环节100%开始,到最后一个环节的转化率数值不要低于1%)。若超过了我说的这两个数值标准,建议分为多个漏斗进行观察。当然,这两个是经验数值,仅仅给各位做个参考~理由是什么呢?超过5个环节,往往会出现多个重点环节,那么在一个漏斗模型中分析多个重要问题容易产生混乱。数值量级差距过大,数值间波动相互关系很难被察觉,容易遗漏信息。比如,漏斗前面环节从60%变到50%,让你感觉是天大的事情,而漏斗最后环节0.1%的变动不能引起你的注意,可往往是漏斗最后这0.1%的变动非常致命。6、相关思维我们观察指标,不仅要看单个指标的变化,还需要观察指标间的相互关系!有正相关关系(图中红色实线)和负相关关系(蓝色虚线)。最好能时常计算指标间的相关系数,定期观察变化。相关思维的应用太广了,我提往往是被大家忽略的一点。现在的很多企业管理层,面对的问题并不是没有数据,而是数据太多,却不知道怎么用。相关思维的其中一个应用,就是能够帮助我们找到最重要的数据,排除掉过多杂乱数据的干扰!如何执行呢?你可以计算能收集到的多个指标间的相互关系,挑出与其他指标相关系数都相对较高的数据指标,分析它的产生逻辑,对应的问题,并评估信度和效度,若都满足标准,这个指标就能定位为核心指标!建议大家养成一个习惯,经常计算指标间的相关系数,仔细思考相关系数背后的逻辑,有的是显而易见的常识,比如订单数和购买人数,有的或许就能给你带来惊喜!另外,“没有相关关系”,这往往也会成为惊喜的来源哦。7、远近度思维现在与许多处在管理层的朋友交流后,发现他们往往手握众多数据和报表,注意力却是非常的跳跃和分散。如何避免呢?一是上文说的通过相关思维,找到最核心的问题和指标;二就是这部分要说的,建立远进度的思维方式。确定好核心问题后,分析其他业务问题与该核心问题的远近程度,由近及远,把自己的精力有计划地分配上去。比如:近期你地核心任务就是提高客服人员的服务质量,那么客服人员的话术、客户评价通道、客服系统的相应速度等就是靠的最近的子问题,需要重点关注,而客户的问询习惯、客户的购买周期等就是相对远的问题,暂时先放一放。当然,本人经历有限,例子举得不恰当的地方还望读者们海涵。8、逻辑树思维如图的树状逻辑相信大家已经见过许多回了。一般说明逻辑树的分叉时,都会提到“分解”和“汇总”的概念。这里把它变一变,使其更贴近数据分析,称为“下钻”和“上卷”。所谓下钻,就是在分析指标的变化时,按一定的维度不断的分解。比如,按地区维度,从大区到省份,从省份到城市,从省市到区。所谓上卷就是反过来。随着维度的下钻和上卷,数据会不断细分和汇总,在这个过程中,我们往往能找到问题的根源。下钻和上卷并不是局限于一个维度的,往往是多维组合的节点,进行分叉。逻辑树引申到算法领域就是决策树。有个关键便是何时做出决策(判断)。当进行分叉时,我们往往会选择差别最大的一个维度进行拆分,若差别不够大,则这个枝桠就不在细分。能够产生显著差别的节点会被保留,并继续细分,直到分不出差别为止。经过这个过程,我们就能找出影响指标变化的因素。举个简单的例子:我们发现全国客户数量下降了,我们从地区和客户年龄层级两个维度先进行观察,发现各个年龄段的客户都下降,而地区间有的下降有的升高,那我们就按地区来拆分第一个逻辑树节点,拆分到大区后,发现各省间的差别是显著的,那就继续拆分到城市,最终发现是浙江省杭州市大量客户且涵盖各个年龄段,被竞争对手的一波推广活动转化走了。就此通过三个层级的逻辑树找到了原因。9、时间序列思维很多问题,我们找不到横向对比的方法和对象,那么,和历史上的状况比,就将变得非常重要。其实很多时候,我更愿意用时间维度的对比来分析问题,毕竟发展地看问题,也是“红色方法论”中的重要一环。这种方式容易排除掉一些外在的干扰,尤其适合创新型的分析对象,比如一个新行业的公司,或者一款全新的产品。时间序列的思维有三个关键点:一是距今越近的时间点,越要重视(图中的深浅度,越近期发生的事,越有可能再次发生);二是要做同比(图中的尖头指示,指标往往存在某些周期性,需要在周期中的同一阶段进行对比,才有意义);三是异常值出现时,需要重视(比如出现了历史最低值或历史最高值,建议在时间序列作图时,添加平均值线和平均值加减一倍或两倍标准差线,便于观察异常值)。时间序列思维有一个子概念不得不提一下,就是“生命周期”的概念。用户、产品、人事等无不有生命周期存在。本人最近也正在将关注的重心移向这块,直觉上,生命周期衡量清楚,就能很方便地确定一些“阀值”问题,使产品和运营的节奏更明确。10、队列分析思维随着数据运算能力的提高,队列分析的方式逐渐展露头脚。英文名称为cohort analysis,说实话我不知道怎么表述这个概念,我的理解就是**按一定的规则,在时间颗粒度上将观察对象切片,组成一个观察样本,然后观察这个样本的某些指标随着时间的演进而产生的变化**。目前使用得最多的场景就是留存分析。举个经常用的例子:假设5.17我们举办了一次促销活动,那么将这一天来的新用户作为一个观察样本,观察他们在5.18、5.19...之后每天的活跃情况。队列分析中,指标其实就是时间序列,不同的是衡量样本。队列分析中的衡量样本是在时间颗粒上变化的,而时间序列的样本则相对固定。11、循环/闭环思维循环/闭环的概念可以引申到很多场景中,比如业务流程的闭环、用户生命周期闭环、产品功能使用闭环、市场推广策略闭环等等。许多时候你会觉得这是一个不落地的概念,因为提的人很多,干出事情来的例子很少。但我觉得这种思考方式是非常必要的。业务流程的闭环是管理者比较容易定义出来的,列出公司所有业务环节,梳理出业务流程,然后定义各个环节之间相互影响的指标,跟踪这些指标的变化,能从全局上把握公司的运行状况。比如,一家软件公司的典型业务流:推广行为(市场部)?流量进入主站(市场+产研)?注册流程(产研)?试用体验(产研+销售)?进入采购流程(销售部)?交易并部署(售后+产研)?使用、续约、推荐(售后+市场)?推广行为,一个闭环下来,各个衔接环节的指标,就值得关注了:广告点击率?注册流程进入率?注册转化率?试用率?销售管道各环节转化率?付款率?推荐率/续约率...这里会涉及漏斗思维,如前文所述,千万不要用一个漏斗来衡量一个循环。有了循环思维,你能比较快的建立有逻辑关系的指标体系。12、测试/对比思维AB test,大家肯定不陌生了。那么怎么细化一下这个概念?一是在条件允许的情况下,决策前尽量做对比测试;二是测试时,一定要注意参照组的选择,建议任何实验中,都要留有不进行任何变化的一组样本,作为最基本的参照。现在数据获取越来越方便,在保证数据质量的前提下,希望大家多做实验,多去发现规律。13、指数化思维指数化思维,是指将衡量一个问题的多个因素分别量化后,组合成一个综合指数(降维),来持续追踪的方式。把这个放在最后讨论,目的就是强调它的重要性。前文已经说过,许多管理者面临的问题是“数据太多,可用的太少”,这就需要“降维”了,即要把多个指标压缩为单个指标。指数化的好处非常明显,一是减少了指标,使得管理者精力更为集中;二是指数化的指标往往都提高了数据的信度和效度;三是指数能长期使用且便于理解。指数的设计是门大学问,这里简单提三个关键点:一是要遵循独立和穷尽的原则;二是要注意各指标的单位,尽量用标准化来消除单位的影响;三是权重和需要等于1。独立穷尽原则,即你所定位的问题,在搜集衡量该问题的多个指标时,各个指标间尽量相互独立,同时能衡量该问题的指标尽量穷尽(收集全)。举个例子:当初设计某公司销售部门的指标体系时,目的是衡量销售部的绩效,确定了核心指标是销售额后,我们将绩效拆分为订单数、客单价、线索转化率、成单周期、续约率5个相互独立的指标,且这5个指标涵盖了销售绩效的各个方面(穷尽)。我们设计的销售绩效综合指数=0.4*订单数+0.2*客单价+0.2*线索转化率+0.1*成单周期+0.1*续约率,各指标都采用max-min方法进行标准化。通过这个例子,相信大家应该就能理解指数化思维了。","updated":"T04:01:09.000Z","canComment":false,"commentPermission":"anyone","commentCount":13,"likeCount":186,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T12:01:09+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-44c0d3c0aa205ab55d04e6a85a7cddee_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":13,"likesCount":186},"":{"title":"数据分析实战 | Excel数据透视表 & 自助式分析工具","author":"RickyFine","content":"本文将通过两种方式介绍常规的数据分析操作,一个是熟知的数据透视表,还有一个是通过自助式BI分析工具FineBI工具来作分析。方案一:数据透视表一. 数据录入
保证无空标题行、无重复行标题、无合并单元格、无非法日期和数字格式的数据明细表。如果明细表有标题为空,将无法制作数据透视表,需要将标题补充完整。如果存在相同的标题,数据透视表会自动添加序号以区分,所以尽量不要存在相同的列标题。如果存在合并单元格,除第1个单元格外,其他均作为空值处理。所以尽量取消合并的单元格,填充完整。如果存在非法日期,生成的数据透视表中,无法按日期格式进行年、月、日格式的筛选和组合,尽量转换成 Excel 认可的日期格式。如果存在文本型数字,将无法在数据透视表中正确求和。需将文本转换成数值型数字才可以进行相关的汇总统计。二. 创建透视表选中要汇总的数据内容点击插入插入数据透视表在弹出的数据透视表菜单中,设置常规选项可以手动更改要汇总的数据内容可以选择在当前表格还是新建表格中创建透视表点击确定,就生成了一张空的数据透视表三. 透视表结构字段列表明细数据表的所有第一行列标题都会显示在“字段列表”中,相当于数据透视表的数据源。可以通过「数据透视表分析」—&「字段列表」—&打开透视表生成器字段设置区域。把要显示的字段拖放在相应区域内,就可以动态的根据区域进行汇总了。数据透视表的显示区域。组合成的数据透视表会在这儿显示。筛选器,可按指定条件过滤筛选数据进行汇总统计。行标签,该区域的字段会按照上下排列显示。列标签,该区域的字段会按照左右排列显示。数值,将要统计的数据列放在该栏目内就行,可选各种汇总统计方式,如计数、求和、平均等。四. 汇总统计选中要汇总统计的列,拖进「透视表生成器」行区域中选中要汇总统计的值列,拖进「透视表生成器」值区域中选择要汇总的方式,常规的有求和、计数、平均值、最大/小值等默认数字是按照求和汇总,文字按照计数汇总。可通过点击下图中叹号区域,调出「字段设置」菜单,也可通过右键点击「汇总列」菜单调出。选择要汇总字段的显示方式,一般默认就行,其它常用的有汇总百分比等五. 结构布局选中要汇总统计的列,拖进「透视表生成器」行区域中选取数据透视表,在顶部找到「设计」—&「报表布局」选取想要的布局方式压缩式布局,默认布局方式。大纲式视图,按列标题分列显示,汇总显示在每项的上方表格视图,按标题分列显示,汇总显示在每项的下方重复所有项目标签,可以填充相同的内容。不重复所有项目标签,取消重复,是上一步的逆操作。分类汇总选项不显示分类汇总在组底部显示所有分类汇总在组顶部显示所有分类汇总总计选项为行和列禁用为行和列启用仅为行启用仅为列启用空行选项在每个项目后插入空行删除每个项目后的空白行数据透视表选项显示,展开/折叠按钮控制、字段标题筛选、错误值/空值的替代、打印选项布局,自动调整列宽(默认选中,调格式时需去掉)、更新时保留单元格格式开关,合并单元格控制数据,数据刷新控制上图报表布局为表格视图,不显示分类汇总,禁用总计,合并单元格六. 高级功能切片器。在数据源字段中,想要查看经过某一字段进行过滤筛选后的数据汇总,可动态交互使用。调出方法为:「数据透视表」—&「插入切片器」创建计算字段。当原始数据表中没有某些统计时,需要计算产生一列数据,可通过「数据透视表」—&「字段、项目和集」创建计算字段。然后进行汇总统计如下图中的计算字段:有效问题占比,按照如图所示进行设置,拖进透视表生成器的「值栏目」中即可小技巧如何批量打开 Excel 文件:一次选中多个,然后按「回车键」即可。新建工作薄快捷方式:Ctrl + N选取某列全部内容:选取第一行,按住 shift 键不松,双击选中的单元格下边线(鼠标放到下边线时,光标「指针」会变成「小手」)查找重复行:选取数据区域—&开始—&条件格式—&突出显示单元格规则—&重复值;使用筛选器可精准查找;( 常用的还有 数据—&删除重复项 )快捷筛选:选取要筛选的值—&右键—&筛选—&按单元格值筛选(多种筛选方式及排序方式)输入日期:输入 6-22 即可自动补全年份;「Ctrl + ;」 默认为当前日期。插入多行:选取多行,插入删除空行:选取列—& Ctrl + G —&定位—&定位条件—&空值—&删除 ;或者使用筛选器,筛选空值,然后批量删除方案二:自助分析工具FineBIFineBI是一种能连接各类数据源,对原始数据(尤其是大数据量)进行快速分析,制作明细报表和酷炫可视化图表的工具。一.配置数据连接由于可以直连数据库,避免了从数据库中将数据导出成excel的麻烦,一次配置,权限内皆可使用1.数据连接管理。点击数据配置进入BI数据配置界面,单击数据连接管理,如下图:点击新建数据连接,添加一个数据连接,如下图,数据连接命名为BIDemo:二. 新建业务包业务包是将数据按照主题管理,如财务、销售,如果数据分析涉及的范围较广的话。业务包内可对数据库进行转义,建立关联关系,也可以手动选择将数据表中需要使用的字段添加到Cube中。1.添加数据表。点击添加按钮,新建一个业务包,选中新建的数据连接,选中该数据连接中的分析所需要的表。这里也可以手动上传excel表,如果不是连接数据库的话,可以直接快速建立分析。2.业务包命名、保存、数据发生变动(数据库数据发生变动/业务包cube中添加了数据表等情况)时,业务包cube更新。至此,数据连接工作就算完成,一般配置数据的工作由IT信息部/数据管理员完成。作为分析人员,正式的数据分析从以下开始。三.建立分析分组报表1.拖曳一个表格组件至即时分析页面,会自动跳转到数据设置页面。2.统计组件属性配置。进入到统计组件属性配置页面,点击组件后面的下拉选项,选择交叉表,即选择组件内部类型,如下图:3.绑定数据。在组件属性配置页面,所有业务包及数据均在页面左侧,选择业务包&数据表之后,选中相应字段,拖曳到中间的对应标签框里,比如说,选择业务包中的合同信息,将里面的合同类型、合同付款类型、合同金额分别拖曳到中间的行表头、和指标区域中,此时下方会自动出现该表格的预览结果,如下图:最后可对样式进行修改,提交展示即可。当然也可制作数据图表,原理和表格类似,以后在慢慢详述吧。","updated":"T07:26:05.000Z","canComment":false,"commentPermission":"anyone","commentCount":3,"likeCount":123,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T15:26:05+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-0fd119f22c9009_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":3,"likesCount":123},"":{"title":"支付宝发布数据可视化规范,可视化分析有套路!","author":"RickyFine","content":"早先,阿里发布了支付宝数据可视化规范,这是一套数据可视化的设计语言,对数据图形进行了拆解、提炼,从色彩搭配、组件规范、基础元素、功能上进行了归纳总结。\n\n图表用色\n\n图表用色上,提出了一些图表用色上的建议,给出了一个标准的配色方案。1.单色的使用在使用单色就能表达数据意义的情况下,建议不使用多色。在图表只展示单一属性的情况下,建议不要使用多种色相。如果数据的数值已经通过形状、位置、角度等其他视觉通道进行了编码,那就没有必要再设置不同的亮度和饱和度。2.多色的使用人们在不连续区域的情况下通常可以分辨6~12种不同色相,以及有限个可辨亮度层次。过多的颜色使用将对人类的视觉感知产生困扰。建议谨慎选择颜色的数量。在考虑图表中的颜色数量时,需要将背景色和图例颜色考虑进去,即显示区域所有颜色的总和。如果着色区域比较小,由于视觉通道的相互影响,可分辨的数量将相应有所下降。多色相的使用:当图表展示了多种不同的属性时,建议用不同色相来区分不同属性。多亮度与多饱和度的使用:亮度和饱和度可以编码数据的顺序或数量特征。通常我们只会在特定图表内使用到多亮度或多饱和度,例如在一个“热力图”中,用不同亮度的红色来表示不同的气温测量值。3.背景色的使用图表设计中的颜色使用必须统一,建议背景颜色不要选取与图表主体内容相同或相近的颜色。在一个精心设计的图表中,背景颜色既要能良好地衬托图表主体,又不产生喧宾夺主的效果。通常我们较多地使用白色、浅灰色作为背景颜色,有些情况下也会使用黑色。4.透明度的使用透明度是与色相、亮度、饱和度紧密相关的另一个视觉通道。由于透明度编码本身受亮度和饱和度编码的强烈影响,建议不要同时使用这三个视觉通道。但是它可以和色相编码一起使用。通常使用透明度时,图表会有很多堆叠层次,我们需要做到使每一个前景层都能够在背景层之上良好地显示,并且不产生相互干扰。5.辅助元素配色辅助元素的配色需要避免与图表主体配色产生冲突。在此基础上,尽量与图表主体配色统一。图表类型选择什么图表应该根据“有什么数据,需要用什么图表”。从数据出发,从功能角度对图表进行以下分类。1.比较类可视化的方法显示值与值之间的不同和相似之处。使用图形的长度、宽度、位置、面积、角度和颜色来比较数值的大小,通常用于展示不同分类间的数值对比,不同时间点的数据对比。2.关系类可视化的方法显示数据之间相互关系。\n使用图形的嵌套和位置表示数据之间的关系,通常用于表示数据之间的前后顺序、父子关系以及相关性。3.趋势类可视化的方法分析数据的变化趋势。\n使用图形的位置表现出数据在连续区域上的分布,通常展示数据在连续区域上的大小变化的规律。4.分布类可视化的方法显示频率,数据分散在一个区间或分组。\n使用图形的位置、大小、颜色的渐变程度来表现数据的分布,\n通常用于展示连续数据上数值的分布情况。5.地图类可视化的方法显示地理区域上的数据。\n使用地图作为背景,通过图形的位置来表现数据的地理位置,\n通常来展示数据在不同地理区域上的分布情况。6.区间类可视化的方法显示同一维度上值的上限和下限之间的差异。\n使用图形的大小和位置表示数值的上限和下限,通常用于表示数据在某一个分类(时间点)上的最大值和最小值。7.时间类可视化的方法显示以时间为特定维度的数据。\n使用图形的位置表现出数据在时间上的分布,通常用于表现数据在时间维度上的趋势和变化。规范引用:文中图表:帆软图表产品()","updated":"T03:38:07.000Z","canComment":false,"commentPermission":"anyone","commentCount":23,"likeCount":375,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T11:38:07+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-c5ecd2bd4a54b0cd59fa_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":23,"likesCount":375},"":{"title":"如何才能做好一张报表?","author":"RickyFine","content":"文/傅一平只要是做BI的,无论在哪个具体岗位,报表总相伴。假如你是取数人员,业务人员设计的取数样张,大多就是报表原型,只不过还没发布;假如你是报表开发人员,你的所有工作就是开发并发布它;假如你是专题项目人员,你所做的专题的基本组成要素就是模型+指标+报表+可视化交互;假如你是运维人员,那你务必保证公司的核心报表按时发布。报表是维持公司正常生产运营的一部分,领导关注企业发展,需要业绩的报表,分析师关注问题,需要从报表发现异动,财务人员关注收入和利润,需要从报表入账,营销人员关注业务发展,需要从报表获取执行情况,一线人员关注报表,需要了解自己的付出和所得。因此,报表的价值毋容置疑,它是企业生存的基本要素,不可或缺,而BI其他的内容,则有点像奢侈品,用了也许可能更好,但也可以不用。虽然从10多年前开始,BI专题渐成潮流,但报表在BI中的地位始终稳如磐石,假如BI没有报表,甚至让人怀疑BI存在的价值?现实中,业务人员往往并不是通过操控BI的分析工具获得信息和知识的,取数或报表+EXCEL+PPT似乎还是主流形式。报表是如此重要,因此谈报表的制作就有较大的意义,它几乎跟企业中的每个人都息息相关,但做出一张报表容易,但做好一张报表很难。很多报表开发人员都会有这个感觉,业务人员报表总是东提一张西提一张,拼命的催进度,动不动就是领导要,口径乱七八糟,好不容易上线了,就埋怨报表出数太慢,整天要求提速,速度提上去了,就抱怨质量,一发现异动,首先怀疑报表的数据出现问题。”领导说,这个月这个报表数据异常啊,我们市场上也没做啥事,是不是数据有问题啊?好好查查!””这个月我们营销做的很多,用户数肯定不止这点,是不是报表没统计这部分用户啊,好好查查!”作为报表开发人员,你总是被巨大的报表负担压得喘不过气来:”报表太多了吧,不大的企业,各种报表上万张,是人干的吗,而且只增不减,不光系统亚历山大,业务人员个个还说不能下线?””报表可是业务人员提的,但搞了这么多指标,同样的命名都不同的口径,不同的人不同的口径,数据不一致,是我的错吗? 还老说我的数据有问题,到底是谁的问题?””这么短的时间,哪可能这么快开发完成一张报表,要速度就没质量,你看着办,我又不是神仙?什么,又是领导要?””我明明规划好了目录,但报表太多了,情况太多了,根本不知道如何归类? 这张报表该发布在哪里比较容易被找到呢?””好不容易发布一张报表,总算满足了省公司要求,但地市也要,县市也要,片区也要,TMD,还需要报表指标的用户清单,以便一线考核和核查,但你们提出的时候,根本没考虑这些维度啊?能怪我吗?”这些问题时常在,但要解决这些问题,首先需要学会换位思考,理解一下业务人员,也理解清楚自己的使命。IT可能有专门的岗位负责报表需求、开发和维护,但业务部门鲜有专门负责报表的,往往某个业务的负责人就是报表需求的提出人,报表仅仅是他们众多工作中的一环,因此不要奢望业务人员对于报表设计的科学性、规范性有多大的考虑,更不要对于业务人员提出报表规划的要求,这就好比以前经常提的业务架构,有多少是真正能落地的。明天怎么样,业务人员自己都不清楚,因此,屁股决定脑袋是常态。用最短的时间设计完报表,然后扔给开发人员尽快上线看到数据,就是他们最大的诉求。从更广的角度看,报表是你的专业和生计,而对于业务人员不是,甚至仅仅是个过客,君不见业务人员流动如跑马灯,而你仍然在那里。因此,做完一张报表是你和业务人员共同的职责,做好一张报表则是你的职责,特别是如果你希望做出一张精彩绝伦的报表,那也是很专业的事情,非一般人所能做到,明白这一点是解决问题的前提。那么前面那么多问题,怎么破? 报表到底难在哪里?首先来谈谈报表数量的问题。即使如运营商,资费套餐这么复杂,增值业务也不少,但真正需要的报表可能也不超过上百张,号称报表上万的,往往是报表管理出现了问题。其实报表的数量跟你对于何谓一张报表的定义有关,即使是一张报表,假如维度很多,就可以幻化出成百上千的报表视图,这个你懂的,因此,首先定义好何谓一张报表,是你管理好报表的一个基础。笔者给出一个建议,也是在实践中做成功的,就是一个业务仅做一张报表,实现报表的收敛,曾经将企业的2000张报表,减少到200张。要知道,做同一个业务,由于企业不同的人,不同场景,不同理解,不同角度,都会提出针对一个业务的不同报表,你不能总是忙于新增报表,而应尽量在原有基础上去扩展。有些时候,即使是不同的业务,假如类型相同,指标相同,也可以仅作一张报表,不同的业务作为维度即可。做报表,要尊重历史,懂得传承,不要轻易去增加报表,同一个业务,搞出两张报表,就是不一致噩耗的开始。接下来谈谈报表标准化问题。企业的核心业务不会大变,因此,真正对于企业运营重要的报表其实是非常有限的, 当然报表自上而下会有所扩展,但还是有限的,这是报表标准化的基础,对于没有稳定性的东西,就没有标准化的意义。所以我们认为报表太多,往往是各类业务人员的奇思妙想造成的,并不是说他们提的报表太糟,而是因为你自己没有基线和标准,无法给他们规范和约束,当然人家报表就会海阔天空, 比如当你面对一个业务新人,无论你如何晓之以理,唯有规范是有用的,否则他就会使唤你,并搞出自己的一套垃圾报表。要实现报表标准化,建议从指标的角度去梳理业务和存量报表,共性或相似的指标会非常多,比如不同命名,不同角度的指标往往可能是一个指标,梳理出企业的基本指标体系是报表管理人员(或开发人员)的使命,标准化包括指标分类,指标命名,业务口径,技术口径,实现方式等等。你去看看企业的经营分析报告,前面一部分,往往就是企业的基本面指标,那可是非常稳定的,当然,还需要进行一定的扩展,因为一些执行性的指标也非常重要,比如公司上层关注渠道健康度指标,可能一线则关注渠道受理量,同时企业年初或季度会新设立或淘汰一些指标,但这类变动不会太大,因此对于企业的业务越了解,就越能抽象出这一层指标。有了基本指标,结合基本的维度,他们的组合,就形成了企业的指标体系,而基于这个指标体系,通过自由组装,则可以幻化出无数的报表,这是报表标准化的基础,能做到这一步,非常不容易。曾经翻过企业的所有报表指标,不同口径不同维度的名义指标有5-6000个,但共性的指标也就只有300-400个,其他要么是变种,比如杭州受理量与杭州下沙受理量,要么是特别个性的指标,关于个性指标如何处理,这个后面再表。所以要指标化,是因为报表的基本的粒度就是指标,降低报表的冗余,必然是基于指标这个最小粒度去实现共性的提炼和组合。指标的提炼是巨大的工程,但这个是实现报表数据一致性,减少重复报表开发,降低系统开销的战略性举措。做报表的,虽然事务工作非常多,但还是要抬起头来,系统思考一下,报表的路怎么走? 阿里提出了“小前台,大中台”的概念,实际道理是相同的,标准化就是在做报表中台的事情,你要致力于完善你的指标体系,而不是致力于去实现一张张报表,这个意义深远。报表中台对于报表人员的综合素质要求很高,既要有宽广的业务视野,也要有深厚的数据沉淀,辅以沟通协调能力,造诣甚至远超一般的业务人员。另大量分析和跟踪报表个人色彩浓厚,没有共性,生命周期也可能很短,没归纳的必要,笔者给的建议就是,千万不要将其跟标准化的东西混在一起,可以开设一个个性化目录,纳入这些报表,让其自生自灭。因为根据笔者统计,企业可能有50%以上的报表每月访问用户只有1-2个人,其价值非常有限。没必要让每个业务人员满意,做报表是非常严谨的事情,如果是非常个性化的报表,宁愿取个数或搞个定时脚本每月导出给他,也不要让其打乱了报表体系,这些报表除了增加噪声,对于公司的意义不大。但无论是标准化,还是控制报表数量,都会涉及到你的报表理念及与业务人员的微妙关系。这里来谈一谈。首先,比业务更业务。也许觉得很难理解,举个例子,比如移动通信中有离网这个指标,很多业务人员认为离网就是简单的一个指标,但在系统中,离网包含主动销户、账户欠费销户等更多的含义,离网的业务流程系统实现其实非常复杂,每类离网实际表达了不同的业务含义。业务流程的制定往往是几代业务人员积淀下来的成果,没有一个当前的业务人员能理解的这么透,而系统中则完整的记录了下来,你应该成为这个知识的传承者,才能够作出一张超越业务人员的报表。其次,把报表当成产品来做。将报表当成产品,我始终认为真正的报表是为企业开发的,业务人员只是报表的需求提出者,因此,你还需要去理解报表提出的背景,哪些是这张报表的用户,你需要尊重提出报表需求的人员,但对于报表开发要有自己的想法和主导权。因为大多数时候,报表需求提出者只关注自己当前的诉求,但一张报表要有生命力,还需要考虑更多的因素,包括指标是否要标准化,报表怎么展现,存储多长时间,打开速度如何,能否复用以前的指标,粒度是否要满足一线要求,是否清单要能保留,是否有同样的类似报表等等。报表开发人员如果能站在公司的角度去思考报表的制作,就应该有信心主动的提出更好的报表设计方案,你不仅要解决当前的问题,也要尽力解决未来可能的问题,也许一开始你觉得很痛苦,但后面做报表可能就会海阔天空,很难,但一张好的报表,真得价值很大。再次,成为一个使能者。中国移动对于业务支撑工作提出过一个词,叫使能者,意思就是要更主动的为业务服务,要能提前想,提前做,而不是总是跟在业务后面。报表开发人员还是要有主人翁意识去看待报表这个事情,毕竟报表是自己的立生之本,为什么不把它打造的跟更完美一点,你不做?谁做?或者说,你不入地狱,谁入地狱?业务人员的心态是很微妙的,有人愿意去做一张更好的报表,何乐而不为呢?可能一开始有抵触情绪,似乎动摇了其权威,但从长远的角度来讲,业务人员会接受的,甚至他们其实也希望理理报表体系,指标和口径定的清晰一点,只是真的有心无力。当然实现时间是个问题,但总是有解决办法,比如先临时取个数呗,办法总比问题多。随着积累越来越多,报表中台的威力会逐步发挥出来,可复用的东西越来越多,不一致现象越来越少,一些潜在的问题会逐步减少,报表的一些根本性问题会得到改善。做报表,最欣慰的就是看到自己的实现的报表常年还在提供服务,而不是1-2年后就完成使命,变得无人问津,甚至上线即下线,那也是很悲哀的事情。当然,再好的思想,没有平台或工具支撑也是不现实的。要生成一张报表从常规的开发来看涉及报表计算、报表开放及报表可视化三类平台支撑,它们分别决定了报表的生成速度、查询速度和好看程度,在这个大数据时代,也迎来了变革。从计算的角度看,大数据时代还是需要升级传统的引擎了,MPP数据库似乎是比较好的选择, 比如GBASE,EXDATA一体机等,当然如果数据量小,用啥都可以。从查询的角度看,报表指标标准化后,由于粒度和维度非常多,指标的量会非常大,因此传统的ORALCE啥的数据库往往无法支持,可以使用HBASE等数据库来支撑快速查询,比如上百亿的指标,用HBASE来做报表指标查询,也是瞬间的事情,搁在10年前,估计这种指标化的思想也很难真正落地,现在解决方案很多了,百花齐放吧。从可视化的角度看,现在报表可视化产品也很多,当前开源漂亮组件已经很多了,对于大型的有开发能力的企业,采购这类产品必要性在降低,似乎自主开发或定制开发更好一点,特别是在数据量非常大的时候,比如要找个产品去对接HBASE也是挺麻烦的事情,从自助化的角度看,有了好用的报表或BI工具,有了标准化的指标,什么自助报表啥的都不成问题,这也是其带来的巨大好处,每个用户都可以基于指标配置出个性化的报表。无论是报表的指标标准化,开发人员的重新定位,还是平台工具的变革,可能有些企业早就实现了,有些企业则认为其不切实际,但无论如何,我们还是不能仅限于做成一张报表,而应致力于思考做好一个平台,做好一张报表,让报表更快速,更准确、更简洁始终是表哥追求的目标。","updated":"T08:56:45.000Z","canComment":false,"commentPermission":"anyone","commentCount":9,"likeCount":36,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T16:56:45+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-58f281c070db7f817ddb787a6deaf0ef_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":9,"likesCount":36},"":{"title":"从事数据工作的你,有多少数据竞争力?","author":"RickyFine","content":"文 | 傅一平原文自:微信号“与数据同行”有处在十字路口的数据职场人写信给我,谈到了职业发展的困惑,谈到了能否跳槽,这是个沉重的话题,今天就来聊一聊,权当回信吧,仅作参考。从技术通道讲,数据岗位大致分为5类,不同的行业分法和叫法可能不同,大家意会就行,当然管理人员不在讨论范围之内。1、数据分析师:也可叫作经营分析师,比如撰写经营分析报告,这类工作大多在业务部门,其主要的工具是EXCEL及PPT,基础数据大多需要技术部门提供,可能自己也掌握一些可视化挖掘工具,比如SAS或SPSS,当前跟数据挖掘师的边界开始模糊,互相渗透吧,其核心使命是为公司决策提供服务。2、数据挖掘师:主要基于数据仓库或大数据平台,通过挖掘算法进行模型的创建和学习,其与经营分析师有很多相似之处,比如都需要理解业务、数据和场景,最大的区别就是具备较高的开发技能,比如掌握了Python、Scala等挖掘语言,能够操作专门的挖掘平台等等,现在很多的岗位如数据科学家啥的,都同出一脉,其核心使命是挖掘数据价值为应用服务。3、数据开发师:主要根据业务的要求提供取数或报表开发支撑,其在各个行业都是非常庞大的群体,需要熟练使用FineReport、水晶报表一类的报表开发工具和商业BI工具。与数据挖掘师的区别就是一般用不到挖掘技能,比如用简单的SQL就能搞定,一般数据挖掘师都经历过数据开发师这个阶段,其核心使命是完成数据需求。动图:4、数据架构师:这类人员是数据仓库或大数据平台的数据建设和运营者,负责数据的采集、建模及治理,注意这里的建模是数据仓库建模,不是指数据挖掘,其核心使命是建设一个可用的数据系统并确保数据可用。5、平台架构师:负责数据仓库或大数据平台各类产品的规划和建设,很多时候,其包含了数据架构师的职能,其核心使命是满足数据计算、存储和查询要求。很多公司没有分这么多岗位,要么是一人承担多种工作,比如数据架构师和数据开发师混编,数据挖掘师和数据分析师混编,要么没有相关岗位,比如没有数据挖掘师,虽然很多岗位是想通的,但其实每类岗位专业技能要求还是有所不同,如果你想做精做深,就需要明白其中的区别,明确自己真正的专业方向,不同企业同样一个数据分析师的称呼,做的可是天壤之别。比如大家看到大数据很热,以为自己在企业也搞数据,就认为很有竞争力,但仔细剖析一下,就会发现诸如BAT招聘的数据分析师根本不是你以为的数据分析师,大多企业搞数据的其实都不能胜任,因为混淆了概念。如果你搞清了自己归属哪一种类别,我们就可以来谈谈具体的要求和评估下自己所处的阶段。吴军把工程师分为五个等级,第五级是能独立完成所分配的工作,第四级是能指导和带领其他人一同完成更有影响力的工作,第三级是能够独立带领人做出一个为公司挣得利润的产品了,第二级是能够做出先前没有的东西的人,第一级是开创一个产业的人。当然我们不需要像吴军定义的那么的高大上,笔者也只是针对5年以内的数据新人所处阶段给个大致评估,数据科学家或资深人士啥的超出了范围,而且数据工作越往后越强调创造性,因此没法评估。1、数据分析师的基本要求是懂企业的业务和数据,具备写报告的能力,所处的阶段,跟自己所处的企业强相关,你提交的经营分析报告能够呈送到公司哪一层,就代表了你的水平,比如你主要为科室写,就代表了达到科室的水平,如果你的报告能在公司的市场经营分析会发表,就代表了公司的市场水平,如果你的报告给老大,就代表了公司的水平,经营分析报告考验的一方面当然是你的数据分析水平和业务能力,但更考验的是你的沟通力、理解力和表达力。数据为根,领导为本,数据分析师从事的工作也算是一门艺术。2、数据挖掘师所处阶段很难划分,纯粹从技能的角度看,第一阶段是能理解业务和数据,能熟练的处理数据,以经验导向去打造一个模型,这算是入门了,第二阶段是对统计学有一定理解,掌握专门的挖掘引擎,能采用更为科学的方式去打造一个模型,第三阶段是自己搞算法去创造一个模型,这在很多应用型企业不太需要,基本上是数据科学家要干的活了。上面仅仅是从技能的角度做了划分,数据挖掘最终还是要效果导向,无论你掌握了什么技能,最主要的评估依据是创造了多少效益,即使你经验导向,模型没有采用什么算法,但只要效益高,就可以称是个好的挖掘师,因为你拥的数据和业务经验足以弥补挖掘技能的短板。传统数据挖掘业务理解和数据处理占到了70%以上精力,因此技能要求并不是那么苛求,但随着大数据的来临,海量数据处理、机器学习的技能要求会大幅加大,比如计算优化啥的,这已经不是业务经验所能弥补的,要靠一定的技术,很多互联网公司对于数据挖掘师都提出了相关的技术要求,由此可见一般。3、数据开发师本质属于开发人员,就是俗称的码农,只是他操作的平台大多是数据仓库类OLAP平台,使用的语言大多是SQL,展现的方式大多是报表、指标或清单,业务和数据理解力基本代表了其开发水平,因此,评估的方式既有传统的开发人员的及时率啥的,也包括数据准确性等指标,公司的运营报表,KPI指标都依赖于代码质量,影响也不可谓不大。数据开发师的技术通道较窄,除了上升为管理者,常见的是转型成为数据架构师或数据挖掘师。4、数据架构师相对于数据开发师内涵更广,视野更宽,其致力于企业数据的采集、整合和治理,如果说数据开发师侧重于满足一个个数据需求,数据架构师则侧重打好数据基础,为前者提供更好的服务保障,我们通常说的数据仓库建模、数据质量管理、元数据管理等等,都是其工作范围,阿里不是在提打造小前台,大中台吗?那么数据的大中台谁来打造,就是数据架构师,可以这么说,数据架构师是公司数据资产的总体设计师。注意数据架构师和大数据架构师是两个概念,大数据架构师前面的大数据是大数据领域的概念,一般是指大数据平台的架构师,数据架构师的数据才指真正的对于数据的规划。数据架构师的评估比较难,因为领域覆盖很广,很多企业实际将其职能分散到了多个人手中,比如数据仓库由项目经理建设,数据治理工作则让运维人员负责,这导致了建设和运维的脱离,两张皮现象使得数据治理工作很难真正落地,实际上数据管理领域是最需要DevOps的。基于实践的认知,笔者觉得初级的数据架构师一般只具备单点能力,比如能规划企业的数据蓝图,能完成企业相关数据管理规范的制定,或是能完成一个数据仓库、数据质量或元数据项目,优秀的数据架构师则能贯通管理、开发和运维线,让数据规范能在实践中真正落地。没有做过数据开发,就不要轻易让人做数据架构,很容易眼高手低,那种没做过数据仓库的,一上来就谈数据管理的,大多也是无法落地的。5、平台架构师就不用多说了,完全技术导向,如果懂业务和数据更好,不懂也没关系,一般的技术控走的都是这条路线,之所以将其纳入数据人的范畴,是因为大数据时代系统和数据耦合性越来越高,诸如深度学习、人工智能什么的,算法能否高效,已经不仅仅是个数据问题,也是个平台问题。但即使你有了很强的能力,也并不代表你对外就有竞争力,比如你在一个企业内可能很厉害,对外却是一文不值,因为你的能力在自己的企业可能是稀缺的,独特的,但对外则要遵循市场的供求关系。有了这些铺垫,我们就来谈谈数据人跳槽的可行性问题,不同的数据岗位行业需求不一样,决定了你的实际竞争力。如果你的数据技能越通用,意味着社会需求就多,如果再加上你不俗的能力,你对外就有相当的竞争力。相比较而言,当前外部最稀缺的是数据挖掘师和平台架构师,大家在招聘网站上看到的,大多都是这类岗位,大数据时代到来,让具备这类技能的数据人员有很大的跳槽优势,这是一条路很宽的康庄大道,如果已经走在这条道上了,就持续的提升这方面的专业能力吧。每个行业这类岗位的优秀人员,往往是在企业内部的平台上千锤百炼出来的,实践经验很丰富,决定了较其他没有环境的读书派,自学派有独天独厚的优势,比如数据挖掘师,假如你所在的企业有海量的数据,就要用好这个优势,无论于甲方乙方。数据分析师(经营分析师)实际是最难跳槽的,因为你的专业知识跟你所在的企业相关性很大,你理解的业务和数据可能仅在你的企业有用,如果换了一个企业,知识体系可能需要推倒重来,当然很多数据分析师养成了很好的逻辑思维能力,也有很好的方法论,但这个属于管理层面的技能了,外面评估你也不再会是专业技能,而是你所在企业的职位高低了,因此,你懂的。数据开发师包含了我们广大的表哥群体,但很遗憾,从专业技能的角度看,在外面也没有什么竞争力,你熟悉的业务和数据圈子太小了,报表和取数实际也并不需要太多的专业技能,如果不想做管理,建议逐步往数据挖掘师、平台架构师进行转型,数据开发师在日常工作中会接触到很多的平台技术,要抓住参与的机会。最后,谈谈很纠结的数据架构师,也是写信给我的同仁当前所做的工作,从来信中感觉她更侧重于数据治理方面。从数据建模的角度讲,业务为王,毕竟数据仓库都是分主题的,不熟悉业务和数据就不要来做数据仓库,决定了在数据仓库方面的能力只能在所属的行业有竞争力,比如笔者就没看到过金融行业的建模团队可以马上转到通信行业建模的。从数据治理的角度讲,虽然其有一套方法论,但笔者没有看到过有专门的外部数据治理团队能从天而降来做好我的企业的数据治理的,销售数据治理产品还可以,但具体的数据治理工作还是依赖自己企业的人员,其牵扯的企业环节太多了。因此,如果做数据架构师,还是很能锻炼能力的,但数据架构师属于练内功的事情,离业务远了一点,价值较难评估,导致在一些企业并不很受重视,同时数据架构师蛮吃行业,一般企业不会冒险去对外招聘一个数据架构师,毕竟首先得理解自己企业的数据。但未来数据架构师行情看好,因为大数据成为企业的资产,数据资产管理工作举足轻重,笔者从BI时代走来,深刻感觉到当前企业内的数据架构师变得越发重要,成为稀缺的人才。以上五类还有一个转型或升级方向是去做数据产品的相关岗位,比如售前啥的,如果你沟通表达不错,善于与客户相处,加上你已有的数据背景,当然这个没有客观评定的标准了,身边这类例子还是蛮多的。总之,1-5年的数据人,需要客观的认识这五类数据工作的性质,明确自己的专业发展方向,虽然我们强调综合性人才,但对于数据类工作一定要精通一门,知道自己的擅长和局限之处,不要好像什么都懂一点,但其实哪样都不精通,这是大忌,其实任何一门只要沉下心去做,达到出类拔萃的境界,就不会受上面所说的一些限制了。如果真得想换个环境,其实可以看看招聘网站相关的要求,大致也可以了解自己的竞争力如何,应该如何改进,希望能给予一些启示。","updated":"T02:54:10.000Z","canComment":false,"commentPermission":"anyone","commentCount":3,"likeCount":52,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T10:54:10+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-061ef1eff0acacfcc5568_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":3,"likesCount":52},"":{"title":"如何设计一个数据平台?","author":"RickyFine","content":"数据平台的建设可以当做一个产品来设计。从广义上来讲,所有以数据驱动为核心的都可以称为数据产品(如数据报表平台,DMP,BI平台),从狭义上来讲,就是公司内部的数据平台。今天我们要讨论的,主要是在公司内部搭建数据平台。\n\n公司的内部数据平台,主要是给各业务提供数据处理、分析、展示,供内部所有部门人员使用的,涉及数据的收集(填报)、数据的整合、业务报表制作、业务员数据分析以及可视化数据展示,目的是让公司内部的所有业务都能通过数据来驱动和辅助决策。简单点讲就是通过数据平台来驱动公司内部的数据化运营。\n\n那么如何设计符合企业实情并能解决实际问题的数据平台呢?\n\n1. 平台建设主导人需要对每一块业务需求有深刻的了解,知道每个业务部门想要看什么样的数据,需要什么样的分析报表;这些数据是否现在就可以获取到,是否需要收集;业务部门通过这些数据分析,是如何推进和改善业务,是否有提升的价值意义。\n\n2. 这样一个平台可以当做一个产品来看,需要根据业务的要求设计符合使用者需要的内容,产品要有层级和结构。如果设计的一张数据报表既要满足管理层的需求又要满足一线业务人员的需要,那么这样的数据产品体验很大可能是比较差的。因为领导和业务人员的关注点不一样,看数据的视角也不一样。领导往往需要一些能帮助把握大方向的关键指标,并且希望知道这些指标之后的问题是什么?原因是什么?所以给领导设计的报表需要直观易懂,并能够基于这些关键指标的异常给予问题定位。而业务人员主要是偏向执行层面,关注的数据往往粒度很细,需要知道各项指标的明细。3. 数据平台一定要注意数据质量、规范、统一。因为数据平台是面向所有业务的,怎么保证公司的所有部门人员对于数据的理解是一致的,这点特别难。(比如服装行业的“断码”,从领导层来讲,公司仓储的服装全部尺码如果不完整就是断码;从仓库的仓管员角度来讲,仓库内的服装尺码不全就是断码;从门店的业务员角度来讲,客户需要的尺码当前门店无货就是断码)。公司的各个业务系统千差万别,由于各种客观因素,导致生产系统的数据质量和结构也会千差万别,这样数据仓库的数据建设就显得尤为重要。数据平台的数据质量依赖于数据仓库底层的数据模型,所以一个好的数据仓库很大程度上决定了数据平台的数据质量。4. 工具选型上,有报表平台、BI 。报表平台适合构建基础的规范化的数据平台,从明细报(表格类)的,项目档案,文件报备,数据填报,数据报表,业务主题分析,文中的所有demo就是用FineReport制作,侧重于展示和报表管理。BI 侧重于分析,拿到数据可以自己拖拽维度来分析,不同于报表受模板框架的限制,涵盖简单的明细报表、分析报表和主题分析,制作要简单很多,大数据量的处理性能也强劲很多。下面我们就从实战的角度来加以阐述。某公司是一家电商公司,那么该公司的各部门需要看哪些数据呢?首先收集日常常用的数据指标,哪些是经常要查询的,哪些是要日常填报的,这些在过往的经营中都有备案,好收集。这就构成了日常的基础查询类报表,这类报表最占大头。其次,我们可以观察一下各部门的KPI是什么?下放到团队以及个人的KPI是什么?是否能以具体的数字来量化?如果对负责支持的部门的KPI不了解,就去寻求部门领导帮助(使用者最懂要什么),不落实指标如何能设计出好的数据报表?通常粗略的,例如采购部门的KPI基本就是销售额用户数销售毛利采购成本,运营部门的kpi就是用户复购用户流失转化率,市场部门的kpi就是流量、新客数。这就构成了各部门日常管理的报表。那么知道各个部门的核心KPI后,下一步就是针对一些特定场景的主题报表。主题报表往往是记录某一事件,其中的指标都是相互关联的。比如,我希望知道这个月我的绩效完成的怎么样?在团队内排名是提升还是下降?每个人的绩效结果明细是怎样的?——这就构成了日常考核报表。又比如在分析产品时,需要重点关注某些产品的相对市场份额和市场增长率,则要建立波士顿矩阵分析,以便让资源有效地分配到合理的产品结构中(当然还有其他分析角度)——这就是j简单的品类分析。再从业务分析和使用场景入手,拿采购部门的小王来说,他是怎样看数据的呢?每天早上,我希望知道昨天的销售情况怎么样?所以这时候应该设计一张基础查询报表给到他,这张数据报表应该具有以下功能和内容:1. 能够查看昨天以及过去各时段的数据;能够按照产品、地域来统计;能够与过往的平均值做比较,看看是不是某区域某产品的趋势上有大的变化,是不是广告投放,活动推广带来的,影响大不大。其次,每个月,每季度的数据是多少,能够选定时间段自动展示。2. 指标越丰富越好,如果销售额下降了,看看是不是订单数下降了,订单数没变是不是客单价的问题,是由于商品结构的原因还是活动门槛调整导致的。3. 数据分析的粒度越细越好。比如数据粒度可以从全国下钻到省份,从省份下钻到城市,这样交易额下降了我就能知道是哪个省哪个城市出了问题?就能针对性的解决。经过以上几个步骤,即可形成平台雏形,形成规划文档。但一个数据平台,无论前期规划得多么丰富,也不可能一蹴而就。公司的业务在不断变化,分析的内容也越来越丰富,在这过程中总需要不断磨合和调整,只有不断完善之后,才能形成一个更加量身定制的实用的平台。","updated":"T06:56:44.000Z","canComment":false,"commentPermission":"anyone","commentCount":3,"likeCount":38,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T14:56:44+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-e8c0c980b409a14385a1bdff3a6dff3c_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":3,"likesCount":38},"":{"title":"如何选择报表系统?","author":"RickyFine","content":"谈数据化管理离不开报表系统,企业都会用到报表系统,但不可能有十全十美的报表系统,毕竟任何一个行业和企业受自身客观环境的限制。但做报表的表格表姐们,总要有点理想和追求,就好比到一定年纪会自问,我的人生追求到底是啥?报表系统,合适的就是最好的。脱离了业务驱动的任何IT系统,没有价值,因此能够从客户需求出发,打造出适合某个细分市场的报表系统,就是最好的报表系统。现在报表工具市场百花齐放,自有存在的道理,所谓的大数据报表引擎,在相当长的时间内,对于很多企业来讲,是没有必要的,大炮打蚊子,那也是极其浪费的事情。同时,大数据让客户的数据意识渐起,因此,即使针对的是小数据的报表工具,也能赶上一波红利,如果报表工具之前没有特别的差异性,客户服务能力就至关重要了,IT一定程度卖的不仅是产品,还有服务。如何看待报表系统?任何代表趋势性的发明和系统,都来自最前沿的应用领域,报表系统最核心的是对于数据的处理和展现,因此,以大数据应用为核心,或者拥有海量大数据的企业,其对于报表系统的诉求和应用,应能代表这个技术的发展方向,互联网企业可以向BAT看齐,传统企业可以向运营商看齐,比如中国移动曾经打造了世界最大规模的数据仓库系统,在那个时候,引领了数据仓库建设的潮流。那么,企业如何打造极致的报表系统?首先,极致报表系统的打造,不是一个工具或系统就能单方面解决的,企业自身对于报表的认识和投入是至关重要的。因为报表系统能力不仅取决定于工具能力,也依赖企业的数据管理能力,而数据管理能力在各个企业的情况不同,同样的工具在不同的企业应用那也是千差万别,好马也要配好鞍。数据管理能力除了数据质量,最重要的是数据标准化能力。一个企业的报表成千上万,运维开发团队疲于奔命,这是有问题的,说明它的数据管理能力还未到达一定的水平,当然,这也是大多企业的常态。产生这个问题的一个根本原因是标准化能力不足,报表由指标组成,一个企业的基本指标非常有限,但指标的组合可以无穷无尽,因此,报表可以无穷无尽,这是祸根。大多数企业做不了报表标准化的事情,有两个根本原因:一是IT报表团队本身的问题。BI领域一直有一个挑战,就是到底是以满足业务人员需求为主还是致力于打造一个平台,更致命的是,BI人员所谓的满足需求并不是在完成一个功能,而是价值也许只有几天的一段取数代码,其是无法实现很好的传承的。但打造一个平台是何其艰难,因为这里的平台不仅仅指功能,不是搞个自助配置工具就算是了,还包括数据平台,你可以叫作数据中心,核心就是要打造一层标准化的数据层,对于报表来讲,就是指标。二是IT报表团队与业务人员的博弈。业务人员屁股决定脑袋很正常,但无论报表做的多急,要的多快,报表团队还是要注意控制节奏,因为大多数企业,业务人员提报表需求没有成本,决定了让业务人员自发减少需求是无解的,到了一定阶段,你做的再快,也无法带来满意度的提升。报表团队总要预留些余粮和人力,规划一下自身的蓝图,研究下更高效的支撑方式,一个IT部门,大多时候,报表规划建设一笔带过,买个工具呗,更不会关注到标准化这种事情,你不提,谁都不会提。报表标准化也不可能让业务人员提出来,只有自力更生了,而且,即使你提出来了,业务人员还可能不理解。报表团队深陷事务型工作而难以抽身,很大程度反映了其视野的局限性,习惯用人力的投入解决一个无解的问题,报表管理者是需要反思的,我们总说表哥是老实人需要做老实事,但规划上绝不能含糊,大数据时代,数据创新恰恰应该放到报表团队的核心位置。有哪些理想的报表工具?报表工具与那些发展前景?(以下是技术和需求的探讨,不关心的同学可以跳过)为避免广告嫌疑不明说,市面上能数一数二的也就一两家。这里更希望谈一些我认为的好的报表系统的特质,和未来的发展追求。1、速度是极致报表系统的一个基本要求。笔者早几年接触到淘宝的数据魔方的时候,是非常惊讶的,它海量的数据、极致的速度,多维的展现,是多么的完美,后来到网上找了很多相关资料,才知道这个产品在数据处理上做了大量的定制改造,才使得它有这个表现。那么能否有一个更加通用的报表后台引擎,在降低对于数据定制化处理要求的同时,提供极速的前台多维查询展现?虽然我们厂用HBASE实现了指标库,后台指标数据几百亿,但其对于数据的定制要求太高,在很多场景难以适用,而且,似乎没有好的成熟前台能够适配,自己全套定制做也不大可能。传统的报表工具引擎侧重展现,但对于后台数据大多时候仅仅起到一个接入的作用,它的设计理念,可以认为是以重前台,轻后台的方式,尽可能覆盖更多的后台数据的形式去满足市场需求,但带来的问题是,后台数据深度支撑能力太弱了,因此无法满足海量多维度数据的快速查询要求。2、海量,快速,多维,是未来报表引擎的要求对于拥有海量数据的企业,需求已经在改变,有时,宁愿自己做报表,也不再愿意采购报表工具产品,这是有其原因的。笔者已经知道当前市场上有不少新型的OLAP产品,诸如Kylin等产品的企业也在崛起,笔者没用过,无法做出评价,但这个的确代表了方向。所以说速度越来越重要,还因为当前有一种趋势,分析型和清单级报表需要融合成一体,也就是说,从指标可以下钻到清单,这可以帮助实现分析执行一体化,而以前清单往往靠取数临时实现,造成了两者的不一致,降低了异动核查的效率。比如运营商其实有两套报表,一套叫生产报表,一套叫经分报表,前者以满足一线生产为主,后者以满足管理者分析需要为主,以前很难有一种报表工具能同时支撑这两种数据查看模式。3、开放性是极致报表系统的一个根本诉求。其实,所谓开放和封闭是相对的,如果你的封闭体验和性能做到了极致,客户可以牺牲一定的灵活性来适应你的产品。现在诸如数据库一体机大行其道,因为好用嘛,暂时也没有好的替代品。但是,在报表产品上,封闭可能成为不了趋势,笔者以前谈过,越是面向前端的产品,用户对于灵活性的诉求会剧烈增长,直到抵消产品封闭带来的价值。报表工具有前端展现和后台数据引擎两个基本模块,假如你有强劲的后台数据引擎,就需要考虑,前端的展现是否可以开放接口,能否提供一套API?要知道,再牛逼的前台展现搞不过EXCEL,也搞不过PPT的组装,更搞不过各个企业复杂的业务管理、机制和流程要求,比如,报表展现要打个水印怎么办? 加入一段安全控制代码行不行?当然,不仅仅是前台开放,后台也需要,比如报表数据的刷新,触发方式多种多样,总要有些定制化能力,提供更多的可配置性和开放性。4、适配性是极致报表系统的一个现实要求。各类报表产品显然对于企业系统环境是有要求的,但不要为了极致性能而忽视现状和通用性,比如SPARK2.0刚刚推出,就不要说产品只支持2.0,假如是基于hadoop的,则需要尽可能兼容大多数版本。一般来说,假如只是为了打造一个更快的报表系统,企业不会去改变它现有的技术架构体系,毕竟报表始终是IT的下游系统。报表系统更应该考虑的是如何尽可能的适应当前大多数企业的现状,与时俱进吧。在大数据时代,产品的竞争力,很大程度是取决于你版本的更新速度,因为客户的需求变化很快,技术更迭也很快,必须要适配的足够快,已经有太多牛逼的公司由于缓慢的产品更迭速度而备受客户诟病,一旦口碑做坏了,就一去不复返了,报表工具不是一种容易硬捆绑的产品,而且这个圈子并不大。再次,谈谈报表前台吧。当前,很多报表产品都已经有拖拉钻取的功能,但建议的一个设计原则是,能简单就尽量简单点吧,一个报表产品前台,不要提供太多的选择,最好还能分一下用户层级。大多企业一线人员,是报表的主要使用者,根本不会拖拉钻取,它如一个婴儿,报表是喂给它的,只要看得清楚,速度快就行了,不要奢望它会用到你哪怕30%的功能,给个搜素、收藏夹、导出功能就足够了,以前OLAP产品所以用不好,就在于使用门槛太高,很多使用人员,甚至不知道啥叫维度,啥叫指标,你让他拖什么?高级的定制功能,设计步骤也要点到为止,配一张报表,最多是三步,选择后台表,选择指标和维度,报表设计(比如多表头啥的),生成报表,当然还有调度啥的,就不细谈了。最后,还是要提提报表企业的雄心吧。不少报表企业被大企业收购了,很大原因是它形成不了生态链,一旦产品同质化,就只能依附于大系统的巨无霸生存,这种结合显然于双方都有利,一个将自身产品的价值链进一步延伸,一个依附于某个数据库或者某类系统,能够获得额外的性能提升,以此形成新的差异化竞争优势。但是,弊端也很明显,跟着巨无霸往往意味着速度变慢,创新变慢,那么,报表企业到底如何才能施展自己更大的抱负呢?单靠一款报表工具打天下其实风险很大,因为维度太单一,前段时间,吴伯凡在《日知录》中提企业竞争力的时候,谈到的降维打击是很有启发意义的。文:傅一平原文自微信公众号:与数据同行","updated":"T07:23:38.000Z","canComment":false,"commentPermission":"anyone","commentCount":0,"likeCount":12,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T15:23:38+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-e05abfb0e7e9_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":0,"likesCount":12},"":{"title":"我是如何入门、成长并进阶为数据分析师的?","author":"RickyFine","content":"前几天和一朋友A聊天,一个在我看来完全可以在大部分行业领域公司独当一面的数据分析师,目前仍谦虚的以“数据猿”自称。从事数据分析的他,半路出家,起初虽然懂一些数据库的知识,但仍然和很多人一样,艰难地上了路。于是我们就索性一起讨讨经,“一本正经”地聊起工作来,留下点感悟。\n\n数据分析如何起步?\n\n说入门很简单一定是骗你的,A说自己是从记数据开始的,记数据一方面是为了应付领导的提问,另一方面也是在培养数据的敏感度。确实,分析的源头一般是某些指标有了明显的变动,熟悉每天的交易数据或用户数据能让你一眼就看出问题在哪里,哪些数据有关联,然后再做分析。而我是从Excel做起的,大部分时间都是在取数,做“表哥”,还要抵挡来自业务的需求攻击。后来,他去做了数据挖掘,我从BI再从数据平台转做了技术。\n\n万事开头难,但一旦数据分析有了动力,就要开始完善自己的知识体系,这也是真正入门的开端。那如何完善数据分析的知识体系?\n\n1、基本的计算机知识和统计知识\n\n数据库+SQL语言\n\n一些常用的数据库如Oracle、SQL Sever、DB2、MySQL,这些数据库或者说日常接触的数据库都要有所了解,懂最常用的就好,最重要的还是要会写SQL。\n\n数学/统计学知识\n\n一些基本的数学统计方法如描述性统计、多元统计分析、回归分析等,重要性不言而喻。\n\n数据挖掘知识:方差分析、回归分析、因子分析、聚类分析等等。这些东西作为入门多多少少都要会一些,虽然有可能不会全用到,但一旦用时方恨少。\n\n数据分析可视工具\n\n数据分析可视化工具很宽泛。首推Excel,中小公司很依赖,熟练使用数据透视表,这是必备技能。中大型公司都是用报表工具或者BI来做报表,但有了SQL+Excel的基础,这些工具上手都很快。\n\n2、业务知识\n\n数据分析师要与公司的各业务打交道,所以对于各部门的业务知识要有深入的了解。某业务领导需要知道某个指标,你需要知道这个指标由哪些数据构成?数据统计的口径是什么?数据怎么取出来?这个指标对于行业的意义是什么,处于什么范围分别对应什么样的情况,是好还是坏。然后慢慢摸索这个指标层面多维度的规律,如何设定最合理。\n\n明确自己的位置,快速成长\n\n附上网上的一张数据分析师能力体系图,用于参考。数据分析是一向比较专业的工作,要时刻警惕自己能力是否有提升,目前是什么样的水平,习惯反思自己:这里引用@的回答1、你了解你所整理的数据的来源吗?是自己公司的业务数据,还是与合作伙伴交换的数据?是自己公司相关部门采集的,还是从第三方获取的?获取过程中,具体的指标和逻辑是什么? 2、这些数据是真实的吗?采集和整理过程中会不会出现什么问题?技术上的逻辑和业务上的逻辑是不同的概念,有没有技术上没有瑕疵,但并不符合业务逻辑的数据流程?\n3、到你手里的数据经过了什么处理?你又做了什么处理?为什么他们和你要做这些处理?4、谁需要你的数据?你处理后的数据流向哪里?他们用数据做什么?这些数据最终又拿去做了什么?比如,为客户做了什么服务,公司发布了什么内容,或向管理层证明了什么KPI,或支持了哪个部门的评估?5、你做整理的周期是什么?为什么是这样的周期?6、公司有其他的部门在处理其他的数据吗?是什么样的数据?和你有什么关系?为什么这些数据要分开处理?7、近一年,你自己的电脑上应该已经积累了不少数据,试试做个分析,从一段较长的时间来看,你负责的这一块数据发生了什么变化?为什么会有这个变化?和公司的产品、经营、业务有关,还是和行业有关?具体怎么有关?如何进一步提升?业务上1.业务为核心,数据为王了解整个产业链的结构制定好业务的发展规划了解衡量的核心指标有了数据必须和业务结合才有效果需要懂业务的整体概况,摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常关键。2.思考指标现状,发现多维规律熟悉产品框架,全面定义每个指标的运营现状对比同行业指标,挖掘隐藏的提升空间拆解关键指标,合理设置运营方法来观察效果争对核心用户,单独进行产品用研与需求挖掘业务的分析大多是定性的,需要培养一种客观的感觉意识。定性的分析则需要借助技术、工具、机器。而感觉的培养,由于每个人的思维、感知都不同,只能把控大体的方向,很多数据元素之间的关系还是需要通过数据可视化技术来实现。3.规律验证,经验总结发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。技能上1.Excel是否精钻?除了常用的Excel函数(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel图表(饼图、线图、柱形图、雷达图等)和简单分析技能也是经常用的,可以帮助你快速分析业务走势和异常情况;另外,Excel里面的函数结合透视表以及VBA功能是完善报表开发的利器,让你一键轻松搞定报表。2.你需要更懂数据库常用的数据库如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL语句的熟练使用,对于数据库的存储读取过程也要熟练掌握。在对于大数据量处理时,如何想办法加快程序的运行速度、减少网络流量、提高数据库的安全性是非常有必要的。3.掌握数据整理、可视化和报表制作数据整理,是将原始数据转换成方便实用的格式,Excel在协同工作上并不是一个好工具,报表FineReport比较推荐。项目部署的Tableau、FineBI、Qlikview一类BI工具,有没有好好培训学习,这些便捷的工具都能淡化数据分析时一些重复性操作,把精力更多留于分析。","updated":"T08:10:35.000Z","canComment":false,"commentPermission":"anyone","commentCount":10,"likeCount":106,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T16:10:35+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-061ef1eff0acacfcc5568_r.jpg","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":10,"likesCount":106},"":{"title":"「专栏·数据化管理」文章目录 !","author":"RickyFine","content":"数据化管理 / 平台报表 / BI / excel数据分析理论 / 感悟数据可视化","updated":"T03:52:09.000Z","canComment":false,"commentPermission":"anyone","commentCount":1,"likeCount":9,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","titleImage":"","links":{"comments":"/api/posts//comments"},"topics":[{"url":"/topic/","id":"","name":"数据分析"},{"url":"/topic/","id":"","name":"大数据"},{"url":"/topic/","id":"","name":"商业智能(BI)"}],"adminClosedComment":false,"href":"/api/posts/","excerptTitle":"","column":{"slug":"dataware","name":"数据化管理"},"sourceUrl":"","pageCommentsCount":1,"snapshotUrl":"","publishedTime":"T11:52:09+08:00","url":"/p/","summary":"","reviewingCommentsCount":0,"meta":{"previous":null,"next":null},"commentsCount":1,"likesCount":9},"":{"title":"关于数据分析思路的4点心得:维度、指标、KPI","author":"RickyFine","content":"1、
看数据看维度\n\n在对某一项业务或者业务的某个模块进行分析时,可以从大小两个角度去切入分析。\n\n首先站在广阔的视角去看待一些数据。比如对某个产品(消费品),就要分析在大环境下是一个什么样的数据,如市场排名,市场占有率。还要记录市场整体波动情况,竞品的数据。这些一般可以通过第三方调研机构或者行业报告获得。然后需要分析针对这个产品你内部关心的数据是什么。比如每月每周的销售量,各渠道的销售量,广告、促销活动、线下活动、联合活动等带来的销售的提升和品牌知名度的提升。\n\n当了解完以上的数据,就应该对这个产品方方面面的情况有个宏观的了解,对需要提升哪些数据指标有了一个清晰的认识。之后就是细化到某个模块维度进一步分析,比如电商渠道需要关注的多一些,DAU、WAU、客单价、复购、用户流失等等,每个模块都可建立漏斗信息。实际分析时还要关注数据异常,做针对性分析。\n\n\n\n2、
什么是好的数据指标?\n\n并不是所有的数据字段都可以当做指标。在选择监测的数据指标前可以先问自己几个问题:\n\n一对于这个产品你核心关注的是什么?比如销售增长率、市场占有率?\n\n二这些指标能够反映这个产品的走向趋势么?如果这些指标变好了能否说明公司是在往好的方向上发展?\n\n三这个指标是否可控,能否操作?如果有些指标你目前的技术根本无法统计到,那也是无济于事。\n\n四指标系设立是否严谨不存在漏洞。描述一个产品的一定是有系列指标,这些会标是否能完全的说明情况,在验证你的假设结论时,是否能完全支撑。\n\n再来说说指标的数据和分析。\n\n有时候数据本身也存在欺骗性,比如这个月的销售额是600W,另外两家最大竞品分别是300W和250W,似乎加起来也没有我们大。但是事实上,我们上个月的销售是800W,竞品分别是200W和180W。数据看上去很漂亮,但是按对比和比率来讲我们远下降了。\n\n所以,好的数据最好一定是以比率的形式存在,要有对比性质的相对数据。\n\n单纯一个或几个数据情况是没有意义的,点连成线,线构成面去展示,用图表展示一段时间的整体趋势,才能客观评价产品的健康程度。通常我们用BI或者报表搭建数据看板(dashboard)监测重要的数据指标。数据分析要有目的性,不要被数据迷惑。上面的数据就是只关注了销售额情况,但忽略了整体分析而导致的表面欺骗。\n\n\n\n3、发现数据异常,该从哪几个维度去分析?\n\n有时候总量的角度是无法看出问题的,比如销售额、UV下降了,我们需要进一步细化去分析。看销售额总量的时候明显是下降了,先确定大的市场有没有波动,竞争对手有没有动作,需要查看市场总额以及竞争对手每个品类的数据。然后分析自身,每个渠道的销售额情况监测,每个区域的销售额情况,每个时间段的销售情况,把活动时间比如五一的数据扣除拟合,将有问题的标记出来。如果是渠道问题优化渠道,如果是市场波动,需要全局考虑战略和市场对策。\n\n所以如果是销售额的分析,需要从渠道、活动时间点、地域等情况去深入分析。比如,是不是因为十一的活动导致销量有个明显的上升趋势?是不是因为上周搞了促销活动,导致本周一线业务员有个消极缓冲的时段,整体销售额低迷。\n\n另外,数据一场也不是什么坏事,如果再数据分析过程中发现某数据表现极好,比如某渠道的销售增长率很高,是不是可以思考为什么会这样,有什么好的经验借鉴,甚至是不是要考虑调整渠道的投放比率。\n\n\n\n4、不同阶段的关键性指标应该是随着业务的变化而变化的\n\n在做数据分析前,我们会确定分析的目标,每个阶段不同。以电商渠道为例,有时候是分析各类活动效果以进一步优化方案或者挑选最合适的方案,留下分析模型以便后续活动对比预测;有时候是研究广告投放,在预算能让营收最大化;有时候是增强用户粘性,提高用户活跃度。\n\n所以不同阶段无论是关键性指标还是KPI都要做相应调整。比如产品投放初期,关注用户数、订单数,后续考虑用户活跃度,回购率,客单价等等。部分观点援引:Taff,腾讯VR产品经理文中图表:图1—FineReport大屏数据看板(,账号:demo;密码:demo)图2—FineBI自助式BI()","updated":"T09:07:27.000Z","canComment":false,"commentPermission":"anyone","commentCount":6,"likeCount":58,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T17:07:27+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-896b3f7cab88a33a2de8_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":6,"likesCount":58},"":{"title":"如何针对业务场景做数据分析?","author":"RickyFine","content":"企业的数据分析是个很复杂的工程,需要业务和分析技术两块知识。这里从业务的角度切入,谈谈如何对业务分析。首先,企业的分析主要分为管理分析和经营业务分析,分析整体的思路是:明确业务场景——确定分析目标——构建分析体系——梳理核心指标。因为每个企业/行业的业务不同,分析体系也不同,这里主要说一下零售电商,按照不同的分析场景来探讨下。其他行业也欢迎大家勾搭,或者可以看看这个专栏里里的案例(比较偏向报表体系,有一定借鉴意义):以电商为例,常用的业务分析场景有销售、商品、渠道、竞品、会员等等,而商品可进一步细分为商品的库存、商品的利润以及关联销售分析。在整个业务分析体系中,电商行业遵循“人货场”的思维逻辑,其指标可这样划分:1、销售类分析销售分析主要是为了追踪销售情况,与KPI对比,调整销售策略,进一步提升销售额。分析思路:基本上任何一个问题都可以套用“人货场的模型来分析”。比如分析客单价下降的原因,从人货场角度切入的话,可建立如下的分析模型:分析方法:数据分析可通过数据对比、极值、预测的方式来分析对比:比如事业部销售额排行榜、销售额贡献度、城市排行榜等等极值:比如月销售额最高纪录,激励销售人员或事业部突破记录预测:根据权重曲线预测未来的销售额2、商品分析商品分析是基于商品的一个流程管理——进销存。比如商品库存太大,占用资金,则采购进货不合理;商品陈列不合理,造成发货不及时,销售滞后。商品分析体系——“进销存”思路,常用的指标如商品的折扣率、动销率、周转率等。3、会员数据分析会员数据分析一方面是可以指导销售营运,另一方面是提高营销的精准度,增加用户的粘性,减少流失。会员分析管理体系:4、其他管理分析
人力资源管理中的数据分析一般包括两个方面,一方面是人员结构分析,另一方面是人力效能的分析。在人效分析过程中最关注两个指标,人均产出和人员费用产出率。人员结构分析包括不同职能部门的人力结构、不同层级的人才结构、不同工作年限的人才结构等等。分析人力结构是防止人才的断层,在招聘上做好预案,优化薪酬分布。数据分析领域的财务主要是管理财务,管理财务需要细化到每个子公司、每个业务、每个产品、每个业务部门、每个客户,以他们为主题的分析有:现金流分析、盈利能力分析、财务预算分析等。这里只是概述了一个框架,每一个点展开都是一门知识,欢迎留言探讨~文 | 帆软","updated":"T10:24:52.000Z","canComment":false,"commentPermission":"anyone","commentCount":3,"likeCount":102,"state":"published","isLiked":false,"slug":"","isTitleImageFullScreen":false,"rating":"none","sourceUrl":"","publishedTime":"T18:24:52+08:00","links":{"comments":"/api/posts//comments"},"url":"/p/","titleImage":"/v2-a41ffebb40b1e230c56cd_r.png","summary":"","href":"/api/posts/","meta":{"previous":null,"next":null},"snapshotUrl":"","commentsCount":3,"likesCount":102},"":{"title":"来自58的启示:如何从零开始做出数据可视化的动效图?","author":"RickyFine","content":"原作者:今天来聊聊数据可视化,摘录了这样一篇美而带有设计感的案例。虽说本应该谈谈数据分析、数据化管理的,但是可视化也是分析过程中很重要的一环,这里就引用了58同程的案例。数据可视化大屏案例我在其他公司也见过,完全是当一个产品在做。——正文——58作为中国最大的分类信息网站,其服务覆盖了生活的各个领域及中国所有大中城市。在58高速平稳发展的今天,希望用数据可视化的效果来整合展现58集团的数据资源,让大家全方位了解58的价值。由此,58启动了“城市脉动”项目。(注:文中附图所有数据均非真实数据,仅为效果呈现)一、调研58对“城市脉动”项目的整体定位进行了思考,如何展现数据?展现场景是怎样的?用户是谁?该给用户怎样的体验?围绕着这些问题,整个项目的核心目标也愈发清晰。数据是什么?是信息的表现形式和载体(定义中摘取)。那么抛开狭义理解的数字本身,从表现形式和载体入手,只专注于各类数据应用于不同环境下最优的表现形式,让展现更具有目标性,让设计“有理有据”。展现场景是怎样的?我们的用户是谁?有展示场景才会有用户,因而将用户与展现场景放在一起进行分析。整体项目是利用大屏设备进行相关数据及图表展示,预想将项目应用的场景分为两种情况:1.专业展示:参与商务活动、分享或为某些团体进行讲解及展示使用。 2.普通展示:主办公区域或前台大厅实时数据展示。这样则更能准确定位出我们的用户是谁,并将用户分为3类人群:a.专业用户:即参加商务活动、分享等,需了解具体数据内容的用户。此类用户会较为细致的查看每项数据; b.兴趣用户:即无论数据在何处展示,其对数据都有浓厚的兴趣,会去驻足停留,仔细观看及分析数据。 c.普通用户:即匆匆过往的人群。这部分用户可能只会在屏幕前短暂停留。该给用户怎样的体验?基于对整体项目的分析,数据部的同学对数据内容与表现形式进行了专业化的归类,58从用户体验及设计角度,与数据部同学进行探讨并优化内容,最终为“城市脉动”定了三个关键词:清晰、明确、迅捷。以确保给用户更为良好的体验。a.清晰目的是使繁杂多项的数据能够清晰展现,达到图与数据的完美结合;b.明确用视觉手段将各模块内容区分开,使各模块数据明确展示;c.迅捷再次明确用户群体及展示内容,针对不同场景及用户的差异化需求,让用户更加迅捷找到兴趣内容。通过分析定位,目标也渐渐清晰:让设计服务于数据内容,给各类用户以最为清晰明确迅捷的数据展示。即,通过视觉与动效的结合,能够给ab两类细致观看的用户良好的视觉呈现及

我要回帖

更多关于 劳务派遣人数比例规定 的文章

 

随机推荐