在写这篇文章的时候,我看到有几个APP,已经给我发送了对话框,向我征询是否能够给它们授权,让它们能够获取我的IDFA。我选择了同意。
但我觉得更多的用户,会选择不同意。因此IDFA最终会变成鸡肋。
我们需要替代方案。
那么,IDFA有没有替代解决方案?这些解决方案靠谱吗?这一篇讲这个问题。
全文目录如下:
- 替代方案之一:CAID
- 运行逻辑
- CAID有什么优缺点?
- 苹果会封杀CAID吗?
- 类似CAID的其他方案
- 替代方案之二:IDFA分享
- 运行逻辑
- IDFA分享方式的优缺点
- 替代方案之三:隐私计算
- 隐私计算
- 运行逻辑
- 隐私计算方式有什么优缺点?
- 这些IDFA替代方案能有机会吗
01 替代方案之一:CAID
先讲讲CAID是什么样的逻辑。
大家知道,一个电脑或者手机,里面除了硬件的ID,其实还有很多系统运行的环境是有特征的。比如,操作系统是有版本号和语言的,浏览器也有自己的版本号和语言,还有屏幕的分辨率、通信运营商、某些底层软件的版本、JavaScript版本等等。
为了让开发者能够便利地开发相关的应用,这些环境特征信息都是要开放给开发者的,否则开发者就做不出来具有自适应能力的应用。
这些信息却成为用来追踪同一个用户的好办法。
这个道理很简单,举一个例子大家一看就明。
拥有同一个浏览器版本号和语言的用户,可能会非常多,但是同时拥有同样浏览器版本号和语言的用户,就会少一些。如果刚好还有同样的运营商、屏幕分辨率的用户,就会更少一些。把这些环境信息全部都综合起来,可以说,几乎没有两个人,拥有完全一样的环境信息。因此,综合大量的环境信息,能够实现对每一个用户的追踪。
这种方法,在网页浏览器时代,其实就已经被广泛采用。在cookie被禁用的时候,这种方式就成为最可用的替代方式,也被称为“指纹”。
CAID,其实就是这种方式。没有IDFA不要紧,反正还有好多系统运行环境的信息。这些信息包括:设备启动时间(秒)、国家、语言、设备名称(MD5)、系统版本、运营商、物理内存、硬盘、系统更新时间(秒)、设备型号、时区等。
苹果手机中的APP将这些环境信息收集下来,并将这些信息提供给CAID管理机构的服务器(中广协和信通院的服务器),在这个管理机构中,会用算法基于这些信息生成一个ID,这便是CAID。
这个ID会被返回到该APP中。这个苹果手机中的任何一个APP如果都采用这个方法,那么都会得到一个同样的CAID。这样APP之间的数据又可以相互打通了。
- 尽管技术上不容易干掉这种方式,但是苹果可以威胁禁止所有利用这种方式的APP上架应用市场。
- 使用CAID是需要付费的。如果CAID的请求量每天在1000万左右,需要每年付费10万元左右。如果CAID的请求量每天在1个亿以上,则需要支付年费100万元人民币每年。也能理解,毕竟CAID生成需要算力,也需要带宽。
- 准确性肯定不如IDFA。如果手机中的运行环境发生了变化,生成的CAID也会相应发生变化。这样前后数据可能就无法打通。当然,这个事情一定会发生,但在大量设备基数的情况下,概率不是非常高。
苹果会封杀CAID吗?
这是一个比较敏感的博弈。如果不考虑任何其他因素,苹果一定会封杀CAID。但是,考虑到CAID具有的官方背景,以及中国市场对苹果手机的重要性。苹果会不会网开一面?
不仅如此,国内的一些媒体和广告主,也都表示对CAID的支持,例如腾讯、阿里、宝洁等。苹果会不会反而会更加愤怒?
相信一些谈判是少不了的,生死难定,我对CAID的前景表示非常非常谨慎的乐观。
不过,封杀这个事情我要多啰嗦两句。
第一,苹果对于IDFA的新政,乃至于可能对CAID的封杀,并非纯粹的出于隐私,而是有它很重要的商业利益的考量,在之前的文章我也已经说过。事实上,IDFA新政加强了苹果的垄断地位和垄断能力。
2019年,美国众议院司法反垄断委员会主席、众议员大卫·西西林(David Cicilline)就曾表示,他越来越担心科技公司利用保护隐私作为反竞争行为的借口。如果美国没有强有力的隐私保护法案,苹果等公司将利用自己作为事实上私人监管者的角色,获得更大优势。
Facebook也在多个场合公开反对苹果IDFA政策调整。扎克伯格甚至直接炮轰该政策:“限制个性化的广告将大大减少小型企业的机会,以至于可能会在宏观经济层面上感受到。这是政策制定者真正想要的吗?”
第二,对行业的影响太大了。而当ATT政策上线后,IDFA获取率极大下降,导致在iOS不存在可用的设备标识符,归因和定向都面临瘫痪风险,两者均会极大影响到投放效果,而投放效果又会影响到广告主预算和行业规模,长久以来建立的行业平衡将被打破。据中国广告协会主办的刊物《现代广告》公布的数据显示,因苹果IDFA新政的推行,预估中国有将近2000亿元的互联网广告业务受到影响。就这一条而言,我就支持CAID或者类似的ID方案。
第三,IDFA新政背后有数据主权问题。这个问题消费者感觉不到,但是却关系到国家的数据安全。苹果推出的SKadNetwork作为替代方案,但SKadNetwork归因方案可能将在中国境内收集的用户重要数据,传输到境外进行分析,存在将中国公民数据出境的风险。
类似CAID的其他方案
类似于CAID,或者说原理基本上相同的方案,还有中国信息通信研究院泰尔终端实验室推出的卓信ID。
02 替代方案之二:IDFA分享
不过,难点在于,一个APP获得了授权,手机里其他安装有数字联盟的SDK的APP,怎么能知道自己和其他APP都在一个手机中呢?
过去,APP们知道自己属于同一个用户,是因为大家共享同一个IDFA。现在,IDFA都没有了,怎么能知道这些APP是同一个用户手机中的呢?如果都不知道是同一个手机的APP,那就算一个APP中的数字联盟中的SDK获得了这个IDFA,也不知道该传给哪些APP。
如果传错了,那还不如不传。
因此,为了知道不同的APP属于同一个手机,还是需要利用前面讲到的“指纹”技术。不同APP中的数字联盟的SDK,捕捉到相同的指纹环境信息如果完全相同(或在一定置信度下是相同过的),那么就认为它们是同一个手机中的APP,没有拿到IDFA的APP,也就可以通过SDK请求服务器端而获得IDFA。
上图是官方网站中的截图。图中所讲的弱特征,其实也就是类似“指纹”的特征。
IDFA分享方式的优缺点
优点:实现的方式逻辑是简单清晰的。
缺点:
- 如何让APP都用这个SDK是有难度的。如果只有少量APP使用这种方案,那么这种方案的价值就会降低。
- 至少有一个APP能够被用户授权获取IDFA。
- 还是要应用到指纹,但指纹的准确性不如IDFA。
03 替代方案之三:隐私计算
想要了解隐私计算的方法的原理,我们首先需要大致理解隐私计算是指什么。
隐私计算
隐私计算(Privacy Computing)也称为隐私保护计算(Privacy-Preserving Computation)、联邦学习,或者多方安全计算。它是指,在数据所有者不泄露自己数据的情况下,能够由其他第三方处理这些数据,并且得到可被验证正确的结果。
举个例子,我自己有很多客户和用户的数据,有他们的电话号码,他们的个人属性,数据量极大。这些数据,其实是可以有很多用处的,比如,如果提供给我的合作方使用,能够让我的合作方更好的服务于我。
但是,问题是,这些数据都是敏感的隐私数据,我不能直接拿给我的合作方,如果拿走了,我将失去对这些数据的控制。
那么,怎样才能既让我的合作方利用到这些数据,却又不能真正看到,更不可能真正拥有这些数据?
答案是隐私计算。
在隐私计算的方式下,我的合作方可以操作我的数据,也可以计算我的数据,得到的数据结果,也可以被他们利用。但是,他们对数据的操作、计算,但就是不能看到这些数据的原貌。
行业中常常用两个亿万富翁比富的例子来做说明。
说,有这么两个亿万富翁,谁也不知道对方多少财产,但是他们想要比较谁的财产更多。为了能够进行比较,他们两个就必须向对方说明、证明自己的财产,否则就无法比较。
但两个富翁谁也不愿意暴露自己的家底。那么怎么办?隐私计算来帮忙。
这两个富翁于是都向一个隐私计算的节点提供自己的财富数据,不过这些财富数据都是加密的,隐私计算的节点也不知道具体数据是什么。但是,没关系,不影响在这个节点上对这些数据进行计算,以及求出谁的财产更多的结果。
这就是隐私计算。
隐私计算比较容易理解的一种实现方式,是同态加密(但不是唯一方式)。就是说,明文数据被加密为密文数据之后,用同样的方法进行计算(无论是对明文进行这样的计算,还是对密文进行同样的计算),明文和密文二者的计算结果都没有区别。有了同态加密,在不泄露原始数据的情况下,可以处理、计算这些数据,也就有了应用这些数据的可能。
运行逻辑
好,讲了这么多,现在说说隐私计算怎么用在解决广告投放归因上。
为了理解隐私计算在这中间发挥的作用,我们先看看在IDFA新政前后发生了什么。
在IDFA能够正常获取的时候(新政前),媒体端可以将广告受众(看到或者点击广告的人)的IDFA和相关信息,提供给广告主,让广告主可以归因。因为广告主手上也有可以依赖的IDFA(广告主可以通过各种方法,例如用实名信息转换为IDFA,或是由合作方提供),因此媒体端的IDFA和广告主端的IDFA可以打通,从而实现归因。
IDFA新政后,IDFA不再可靠。大家没有了共用的ID,归因不再可行。
所以,需要这样一种ID。前面讲的“指纹”当然是一种办法,不过,除了指纹之外,其实还有其他一些ID,一直都存在着。这些ID,分为两类,一类是实名ID,简单讲,就是手机号码。另外一类ID,指那些可以唯一映射到某一个具体的用户,但却不是实名ID的那些ID。比如,与手机品牌和操作系统无关的硬件ID,典型如IMSI号,是运营商可获得的,手机的SIM卡的唯一标识ID。这个ID照样可以唯一定位每一个手机用户。这个ID,本质上也类似于实名ID(因为跟电话号码一一对应)。这两类ID,可以被统一称为“可验证ID”或“可信ID”。
不过,直接应用这些可验证ID是敏感的,就像两个富翁比富,谁都不愿意拿出自己的实名ID给别人看到。那么,隐私计算就是一个很好的办法。
媒体拿出自己的实名ID,或是让运营商获得媒体自己的用户的IMSI之类的ID。然后广告主也拿出自己客户或受众的实名,或者IMSI等ID。
这些ID不会立即用来匹配,而是加密后交给隐私计算的节点,在完全都是密文的情况下进行匹配。因为有类似于同态加密这样的隐私计算技术,所以匹配的结果肯定可信,但匹配的ID是什么,则对所有参与方都不可知。
这样,实际上,大家仍然在共用一个统一ID:实名的电话号码,或者运营商的IMSI,但是大家都无法知道对方的ID是什么——在ID完全保密的情况下,实现了数据的打通。
目前,利用包括实名ID(电话号码或者用户 User ID)在内的可验证ID的方法进行数据打通匹配的解决方案,与利用运营商的ID的解决方案在国内都有。
前者(利用可验证ID的方法)例如Liveramp(链睿),他们的解决方案被称为ATS(Authenticated Traffic Solution,经过身份验证的流量追踪解决方案),如下图所示:
上图中的IDL,就是指的通过隐私计算之后的可以做匹配的ID。
在这个方案中Liveramp提供隐私计算的环境,媒体、广告服务器、投放服务商、广告主,都基于隐私计算下的加密ID来完成数据打通。在上面的不同投放服务商和广告主中,即使是同一个受众个体的被加密的ID也可以不一样,这样避免了广告主以及平台之间直接的数据打通所可能导致的数据泄露,但这些被不同加密算法生成的ID,在Liveramp的隐私计算环境中,都可以跟媒体进行打通。LiveRamp ATS希望实现一种“持久性”的ID打通——不仅可以抵御第三方Cookie的缺失,还可以抵御包括IDFA在内的其他Device ID的缺失。这种方式实际上需要基于大量的用户授权的ID使用,因此适用于Apple提出的新的隐私框架(ATT)。
后者如中国商务⼴告协会和酷云互动联合推出的“品效协同指数”方案。
在这个方案中,监测链接是很核心的一个东西。这个链接实际上由运营商提供,被附着在投放的广告上,并通过很多宏替换(API的方法)让媒体提供相关的广告信息。因为是运营商提供的链接,因此在这个链接被请求的时候,运营商会捕获相关的设备信息,例如IMSI号。同样,在广告主端(企业端)也将自己的一方数据(手机号码、设备ID、或同样在流量落地环节中用运营商监测链接或监测技术捕获到的数据)上传到隐私计算节点。媒体平台的数据和企业的数据,能够在隐私计算节点上被打通。
不仅如此,不同媒体平台因为都采用了运营商的监测链接,因此同一个受众在不同媒体上的数据也可以被打通。
这样,跨媒体的广告归因就能得以实现。
隐私计算方式有什么优缺点?
这种方式,有什么优缺点呢?
优点:
- 显然是数据归因会比较准确,因为直接用了实名ID或者类似实名的ID,因此准确性比CAID采用的“指纹”方法要更准确。
- 而且这种方法理论上需要经过消费者授权,尤其是利用消费者实名的情况下。因此,被苹果封杀的可能性相对较小。
缺点:
- 需要媒体端接受这种方式,也需要媒体对提供隐私计算节点的第三方保有信任。
- 在依靠运营商的情况下,也需要与多家运营商都建立合作,才能覆盖足够多的受众,否则可能变成采样数据。
04 这些IDFA替代方案能有机会吗
The end.