作者:宋星(纷析咨询创始人)、Anna(纷析咨询合伙人)
本文为数字化营销转型的十个数据大坑系列文章之六,往期内容见下方
- 01 到底什么是数据缺乏标准,有哪些ID也不统一
- 02 数据的埋码和监测缺乏标准化
- 03 数据对象的定义缺乏标准化
- 04 数据收集的不标准,最终都会导致数据标签无法规范化
- 05 无法忽视的“房间内的大象”:概念、用词和数据指标的不统一
01 到底什么是数据缺乏标准,有哪些ID也不统一
一方数据和二方数据发生混淆,一方数据概念不一致:最基本的是对于一方消费者数据是什么的认知不统一。只有企业自己拥有(own),可以自己触达的个体消费者数据才是一方消费者数据。有些企业说,我从电商那里获得的数据可以发短信,可以在平台里面投放,怎么不是我的一方数据呢?因为这些数据所属方并不是企业,而是平台,你没有办法从平台拿出来,就不能属于一方数据(而是被称为二方数据)。
这种认知不统一不标准带来最直接的问题,就是企业对自己到底有多少数据,能用多少数据的量级心里没数。有些企业说我有2000万个可以发短信,打电话的手机号,最后发现里面只有10%是企业自有的。2000万自有手机号和200万手机号的应用场景大小,获得的收益,分析后得到的结论可是大有不同!
以为自己有大体量数据,因此设计了巨大的数据应用场景,最后发现无数可用。往小了说,这会让数据负责人直接下岗,往大了说,是企业战略决策的误判,导致大量资源的浪费。
- 一种误区是,只有手机号属于一方数据。手机号确实可以判断用户的唯一身份,但是获取手机号的成本只会不断增加,这是自己在给自己增加数据获取难度。
- 第二种误区是除了手机号之外,所有的其他ID(包括Device ID,微信Open ID & Union ID,抖音BDID等等等等)都属于一方数据。这样难免会陷入如果我要获取更多一方数据,我所需要的投入会呈几何数增大,但是我的业务ROI无法平衡。同时,还增加了ID拉通的压力,最终导致大家觉得ONE ID是个不可能的命题,数据拉通项目流产。
- 所以需要有一个对企业一方数据,甚至是整体消费者数据的ID体系的规划和统一。很多企业没有弄清楚到底能获得什么ID,又到底需要用什么ID,这极大阻碍了后面的数据应用。
- 举个我们碰到过的实际例子:一个企业有百万量级的一方数据ID库,但是里面有70%都是通过广告收集到的Device ID。企业希望通过会员券的发放,激活存量的用户,转化为新会员,为会员小程序引流。当他们想要对这些用户发放只能在小程序内应用的优惠券的时候,结果70%的人连触达都做不到。
- 还有一个典型例子,由于ID收集的不统一,最终会在圈选用户的时候发现,想要找到20个人群包发短信,最后可以发短信的只有5个人群包;其余ID都不可用,最终依然是圈了一堆人群包,结果每个包的数量都很小,也不确定里面人群是否有重叠,根本用不了。
- 如果你的业务是完全基于小程序的私域电商,那微信生态的UnionID对你的重要性与手机号同等重要;但是如果你是一个设备开发方(例如苹果手机),那设备ID与人的ID绑定是核心(这也就是为什么所有手机生产商都要你用手机之前注册手机生态的原因之一)。
02 数据的埋码和监测缺乏标准化
不论是哪一种不标准,最终导致的结果同样是数据分析中出现问题,产生错误的结论从而导致错误的业务改进动作和决策,最后变成“数据分析都不靠谱,与业务没关联,根本没用”这个粗暴的结论。
03 数据对象的定义缺乏标准化
- 简单点的,有些产品命名是拼音,有些是英文缩写,有些是中文名。
- 复杂一些的,有些是以产品功能和系列来区分产品,有些是以套装、单品还是礼品装来区分产品,有些是以生产批次来区分产品……
所有的这些数据分析对象的不统一,最终都会导致花费大量的时间进行数据清洗和整合,最终可能清洗后都无法确保数据是否准确,是否有遗漏或者重复计算。最终,变成了“每次取数都要重新花时间清洗,这个工具根本不靠谱”。
04 数据收集的不标准,最终都会导致数据标签无法规范化
- 最直接的一个例子,就是大家对“购买意图”的定义不同。在团队A中是领取优惠券,在团队B中是加入购物车,在C团队中可能是多次点击产品详情页。这在最后做用户画像中,就有可能导致有高购买意图的用户画像,在品牌自有电商,淘宝和京东其实有不同含义。最终大家一起汇报的时候发现,品牌私域电商里有200万个高倾向用户,购买转化率是5%;但是在淘宝电商,高倾向用户的转化率变成25%。这背后可能并不是两个平台属性、用户群差异和特征,而是数据指标不统一的锅。
当然,这一问题的解决方法不止于数据标签的统一,也有对数据异动的识别,标签模型的优化等等。但是,数据标准的统一必然是这些解决方案的基础动作。
05 无法忽视的“房间内的大象”:概念、用词和数据指标的不统一
总结一下,现在企业面临的诸多营销数据的问题,源头都在于数据标准的不统一。包括ID的不统一、埋码的不同意、分析对象的不同意最终导致标签规则的不同意。这四种统一下,我们还需要一个统一的数据指标,作为切入点拉通内部用词。