国内做数据治理怎么做的厂商有那些?

企业和数据有怎样的关系?

打个比喻在商业“宇宙”中,企业(特别是大型企业)这艘飞船要实现增长数据系统(DMP/CDP)是驱动数据化的引擎,数据则是助推的一剂“燃料”然而洳果数据没用好,产生不了价值驱动不了业务增长,好比是建了一个数据“黑洞”

随着更多的企业建立并部署数据管理系统,数据治悝怎么做(data governance)的话题也被越来越广泛提及和关注

近日一篇刷屏文《“数据主义者”们的毒鸡汤》逐条剖析了市场对数据和技术概念上的一些錯误认知,直击相关从业者内心

目前市场对于数据和技术这两个概念会“神化”或者简单化,企业认为找一家IT公司搭建了一个系统这個系统就应该能施展“魔法”,就应该能够帮助业务但其实这里面远比大家想的要复杂得多。数据的价值很多时候完全不在数据本身,而是一个从处理到应用的每一个环节都需要专业的过程

那么从实实在在的业务角度,如何远离数据治理怎么做中的那些坑?希望以下这篇文章产生自纷析数据创始人兼CEO宋星和品友互动创始人兼CEO黄晓南两位数据治理怎么做专家对谈的观点文章能提供一些启发

|以下内容转载洎公众号网站分析在中国

今年2月底,我发表了【“数据主义者”们的毒鸡汤】这篇相当有“反省”意味的文章,很快便刷了屏

文章有佷多留言,但其中一个留言(来自“孙铭徽”)引起了我的注意就一句话:“说了半天也没有说how啊!”

这十个字的留言让我意识到,仅仅只是告诉大家什么是有害的、什么是真实的还不够我们更需要知道什么才是“打开”数据的正确的姿势。

但数据领域,做到正确相当困难因为最大的障碍不是技巧、技术,而是错误的观念和逻辑

关于这个话题,我与我的好朋友——在大数据治理怎么做方面有资深经验的專家Grace(黄晓南品友互动创始人兼CEO)进行了两个多小时的讨论。这篇文章基于我们的谈话,来讲讲什么样的观念和逻辑是“我们自认为”正確的所以,跟我过去的文章一个人“自说自话”不同这篇文章同时包含了我和Grace两个人的观点。

当然没有绝对的正确,适合自己的才昰更好的

目前市场对于数据和技术这两个概念会“神化”或者叫简单化,以为有了数据就可以做到自己所期望的或者以为找一家IT公司幫他们搭了一个系统,这个系统就应该能施展魔法帮助业务但其实真实的情况要比这样的想法复杂太多。

企业在开始琢磨如何使用数据嘚过程中(例如考虑搭建DMP或是CDP)碰到最多的问题就是数据收集和清理的问题。问题的根源在于:

1、企业不知道自己数据在哪哪些地方可以收集数据;

2、收集回来的数据要做哪些处理,怎么处理

企业往往认为拥有了DMP或者CDP这样“高端”的工具,这些数据问题就应该能够自动解决这是一种典型的神话数据的表现。

举个例子以DMP为例,DMP的代码埋好了以后需要在媒体端做宏替换,如果不做宏替换的话进来的数据僦是脏数据,用这种数据分析模型出来的结果一定存在问题有时,即使做了宏替换也有可能会加错,或者媒体端出现重复传送——数據收集端的专业性其实很高对于数据运营的要求也很高。我们看到的成功案例背后其实都需要投入大量的这种数据运营。如果这个问題没有处理好那整个系统也就没有办法释放价值,甚至都无法正常运行

不仅获取数据需要运营能力,处理数据同样如此例如,利用苐三方监测公司采集活动数据但是发现在campaign初被执行之时,字段标号可能是随意的一个campaign下好多不同的字段,所以仅是字段对齐这件事情僦非常耗时;如果要把历史campaign数据也接入进来的话会更复杂,因为历史数据字段的对齐的耗时更加恐怖类似这种工作经常要花上好几个礼拜。

这些例子说明获取数据本身并不简单,但即使获取了数据离真正让数据发挥价值,还有十万八千里发挥数据的价值,很多时候唍全不在数据本身而是一个从获取到处理到应用的每一个环节都需要专业的过程。

从获取到处理到应用数据的每一个环节都需要专业洏达到这个专业的前提,是必须从“源头”开始设计

所谓从源头开始设计,是从业务端发轫且把数据的产生和获取一同考虑在内有机結合的规划。

例如很多学员或者客户都曾问过我,如何衡量他们的品牌营销的效果对于这个问题,正确的解法是从你的品牌campaign开始策劃设计的时候,就必须把衡量效果尤其是用数据来衡量效果考虑进去,而不仅仅只是设计campaign本身或者说,campaign设计本身就应该包括为衡量效果而做出的安排以及数据获取上的设计。

举个例子你说我要做利用KOL传播的campaign,这个没问题但是怎么衡量KOL投放的效果呢?如果你不做任何設计,那么只能最终用KOL给你发的软文的阅读量来评判效果但仅以阅读量来作为评判是非常可笑的,因为实在没有任何参考意义——KOL给自巳刷阅读量极为普遍

因此,在设计这个campaign的时候你需要增加一些“行为点”甚至“转化点”作为campaign的执行环节,比如在KOL的软文中唤起读者/粉丝进行某个可被数据监测到的行为

“行为点”和“转化点”会为你衡量campaign实际的效果提供相当有细节和过程的数据,从而获取主动权

這只是一个很小的例子。

但考虑一下在整个营销和运营的过程中,实际上充满着数量庞大的这样的小例子、各种各样的流程安排以及嫃正在这些细节执行的角度上安排数据的监测和获取,这就足以完全颠覆企业现有的“数据文化”更何况,上CDP或者DMP这样的“大杀器”哽需要从源头开始设计,否则它们根本无法帮助你起到应有的作用。

完善数据能力而不是仅仅考虑拥有数据本身

“伪数据主义者”的蝳鸡汤鼓吹系统的作用,鼓吹数据的价值但很少真正强调更基础且更重要的工作——完善企业自身的数据能力。

完善数据能力包括如丅四个方面必须要做的功课:

1、建立以终为始的场景意识。

这就是我们前面所讲的从“源头”开始设计的意义如果一开始并没把应用场景想明白,等系统搭建完了再想就会发现收集什么数据,在哪里收集的问题会令人手足无措

最佳实践只有一条,在任何数据项目的初期先做咨询和调研比如为了上线DMP而把历史购买人群或是广告受众提取出来做在线用户调研,来了解用户的爱好确定投放场景,以及针對市场和线上营销部门的业务需求进行调研后面建设DMP的需求就比较清晰。

又如采用会员制的企业,需要把所有会员打通管理起来然後通过定向不同的人群包来做会员运营的实验,这个场景需求也很明确这样的场景必须在建立系统之前就想清楚,本质上就是一个“我偠什么”的问题而如果一开始并不真正清楚知道我要什么,也不知道“要什么”背后包含什么细节风险就会很大。

以终为始是一个基夲的工作方法在任何企业搭建数据管理系统,例如DMP/CDP的过程中都应该是最基本的要求

2、接受数据所有权和使用权分离的现实并加以应对。

将外部数据纳为己有的做法今天已经没有太大必要性,可能性更是大大降低很多企业今天还在买数据买标签,但其实效率和准确性嘟已经大大降低企业应该转变思路,考虑利用第三方的数据能力而不是拥有数据本身。不管是出于对数据安全的保护还是出于业务嘚实质效率,这都是投入产出比最高的一种方法也是最大化数据能力的一种方法。

今天最大化调动数据的能力,以及连接各方的数据能力对企业发挥数据的价值尤为重要。

3、商业理解与数据运营能力的结合

如同我们的DMP/CDP的企业调研所呈现的:一个DMP项目,需要以业务咨詢为贯穿始终的核心如果让纯IT的部门来负责运营,失败的可能性就比较大

那么怎样更容易获得成功?成功的模式应该是业务部门来牵头,IT部门技术控制与支持

数据的运营能力,和场景的判断问题相关的都是业务。但很多企业中都是业务部门作为用户对IT部门提需求,IT蔀门统一处理这种组合容易失败,无论业务部门提出多么细节的需求本质上都不是IT部门能够真正理解的需求。这并非是贬低IT部门而昰因为IT部门并不从事业务,必然跟天天与业务打交道的人在业务理解上有区别

Grace谈到了她的一个非常成功的客户。这个客户为建立DMP系统參与的部门非常多,从市场部、媒介部、战略部、调研部、电商部、IT部在内部形成联合小组,然后再由一个管业务的高管来直接负责所以最终的DMP不仅成功落地,更直接能够嵌入业务这是一个很正面的例子。

4、不要过度强调定制化

定制化的价值毫无疑问,但是完善数據能力不能矫枉过正一种矫枉过正的倾向是凡事都要追求定制化。很多时候企业会认为找第三方的IT公司来定制数据管理系统就一定能滿足业务需求。这个乍听起来好像很有道理但风险在于极端追求定制化往往意味着大量没有被验证的模型和产品。

现在的很多数据管理系统(即使是DMP还是CDP也无论是国内的解决方案还是国外),所用的底层技术方法和技术手段都已经比较成熟完全可以直接在这些成熟的方案基础上进行标准和参数定制。

无论什么样的企业在数据管理系统的需求中,基础的功能模块和场景还原、解决方式和手段其实并没有太夶不同又何必要在这些基础的领域完全定制化浪费时间和人力物力呢?更何况,从零开始的失败风险比直接“站在巨人肩膀上”的风险,不知道要大了多少

定制化仍然重要,定制的部分往往是参数、配置及模型以及数据输入输出等。比如对KPI的定制什么是有效人群,叒如归因里面到底应该看什么节点或者人群标签应该如何设置,企业自有数据如何引入如何标准化等等以及,那些确实不能满足的功能再进行二次开发不迟。

所以如果将失败的原因归咎于系统定制化程度不够高这个就很麻烦。任何公司要做数据系统(如DMP/CDP)的话建议他們一定要弄清楚供应商是不是已经有成熟的产品和解决方案实践案例,而不是让类似于IT公司或者软件外包公司来直接进行定制化开发深喥定制化对大部分企业而言并非好事,因为真正能够驾驭定制化数据系统的企业其实屈指可数

考虑更加现实的成本规划

企业应该避免另外一个倾向,即用最少的钱建最牛的数据系统或者是走一步算一步,先花点小钱试一下这种心态对于数据管理系统这种战略项目而言佷容易失败。

尽管迷信一分钱一分货在定价并不完全透明的数据市场并没有太大道理但我仍然认为,企业的数据问题本质上还是一个價值认知的问题。

如同我们前面所讲的“以终为始”的意识如果一个企业把需要数据实现的“终”想明白了,比如企业把数据系统定位為消费者互动管理平台或者用户增长管理平台就会将数据和数据系统的价值上升到业务战略的层次。如果真正意识到数据系统是把整个鼡户生命周期管理起来的平台这个系统的重要性就会是战略级别的,对价值和成本的衡量就会更加理性

所以对于一个企业建立自己的數据体系和数据系统,Grace很有发言权她强调有三件事情一定要提前想清楚:

1、最“终”的商业应用场景是什么?

进而就会确定谁来负责这个倳情以及如何设计和验证,以及愿意为实现这个场景的优化付出多少的成本甚至能够计算出大概的ROI。

2、企业有没有私域数据以及有多少?

囿些企业说想做CDP或者DMP但一研究发现没有多少数据,既没有自己的APP微信上也只有几千个粉丝,这样建立一个上百万甚至更贵的系统意义僦很小了

3、在数据运营上有没有做好准备?

有没有好的员工或者合作伙伴来能让数据和系统真正有效运行起来。这不仅是我们前面所讲的偠从“源头”设计还需要在每个业务环节考虑数据获取、利用和反馈。例如DMP常见的场景,是在各类触点上捕获数据为此,媒体的沟通、代码的添加、数据的质量控制、不同数据的打通等等都需要人去做切实的运营工作。没有这些细致工作企业很难真正从数据中获嘚价值。

一个普遍的迷信认为多花钱就一定能有好系统。事实上系统二字不是指开发的软件系统本身,而是软件、数据、人才与组织㈣者的有机结合当这个有机结合的任何一方缺失或者能力欠佳,企业的数据体系就会面临巨大的困难这样的困难,其实完全不是由一個数据软件系统本身的好坏来决定的但企业总是倾向于让软件系统承担所有的责任,这反而阻塞了企业的真正改进与提升

因此,企业對于数据系统的成本规划不仅仅是数据软件系统本身,而必须包含企业内外人才(外部人才如咨询顾问)的成本规划以及为获取数据而付絀的成本的规划。

尽管不同的公司情况非常不同从而很大程度上影响供应商的选择,但我觉得有至少有四点可以是作为选择数据系统供應商(尤其是CDP/DMP类型的数据系统)的标准:

1、有丰富处理多重复杂的大量企业内部数据(私域数据)和企业外部数据(公域数据)的实践经验和能力

这個很重要,当数据维度非常多很多字段都要去打通时,供应商的真正水平就将显示出来没有处理过这些需求的供应商会遇到很困难的凊况,因为这个领域有太多技术和业务并发的挑战因此处理起来非常复杂,需要真正有经验的供应商尤其是对企业业务有深刻理解的供应商才可能解决。

2、有整合外部数据能力的丰富经验且对国内的数据生态有充分的理解。

这一点不难理解数据系统的根本价值在于利用数据,而利用数据背后有相当多的场景实际上是利用了企业之外的第三方的数据能力。供应商必须具有能够帮助企业打通第三方数據生态的能力

3、具有通过运营数据和数据系统产生商业结果的经验。

要有真正为企业带来了正向变化的案例关于正向变化,我需要啰嗦几句这并非一定是在KPI上立竿见影的提升,由于数据化的再造和转型是战略性的改变因此任何企业在KPI、组织优化、效率、资源获取等任何一种或多种进步,都算正向变化

4、不仅要有技术能力,更要有产品能力

即要有被验证的数据系统的架构与落地能力(包括系统的稳萣性、数据处理的能力、数据挖掘和建模的能力以及数据安全的治理等),还要能做出真正实用易用的产品二者缺一不可。当然真正衡量一个供应商的技术能力和产品能力还包括很多方面,这里不再赘言

另一个值得关注的事情,是国家对数据的安全和隐私数据保护肯定會越来越强对于企业来说,数据治理怎么做和数据使用的合规性变得很重要典型如搭建了DMP的企业,如果通过DMP提取的数据提供给外部第彡方在这个过程中,如何做到数据合规、操作合规如何保护个人信息,都成为涉及到企业自身安全的极为重要的领域

这些方面如果鈈加以重视和管理,很可能数据还没有用上高管就被请去喝茶了。数据攸关企业性命死生之大,不可不察这虽然增加了企业利用数據的门槛,但从更长远的角度看又是所有规模企业都必须跨过的门槛。更早主动面对与解决很可能在未来成为重要的竞争优势,企业必须寻求在这一领域真正有方法和实践的供应商的帮助

我要回帖

更多关于 数据治理怎么做 的文章

 

随机推荐