
如果抛开一切灰色因素,广告追求的唯一效果应该就是找对人。而人(即受众)作为广告三要素(广告位置、创意、受众)中唯一无法提前确定的因素,其不可预测性,让无数广告人食欲大减、彻夜难眠。
我们用尽一切办法,找到对的人。比如电视广告的曝光,很讲究不同渠道、节目、时间点对不同人群的覆盖;楼宇广告与楼盘、地理位置相关,以明确不同人群的购买力;杂志广告则与杂志对应的行业主题紧密相关。这是一个不需要解释的逻辑。但在互联网上,这个逻辑就面临挑战,因为互联网的虚拟世界与现实世界有很大的不同。
不同的是,相较于传统世界,互联网是一个更能“监视”每个人的地方。每个人在互联网上(无论是桌面还是移动端)的很多痕迹都会被各种组织或个人或明或暗地记录和存储,然后用于各种其他用途。这些痕迹是什么?我稍后会详细介绍。
这些目的中最重要的一个就是为了广告。既然我们可以监控一个人,理论上我们就可以知道他(或她)是谁,然后判断他是不是“对的人”。如果是的话,我们就让他下次出现在网络世界时,我们的广告就出现在他面前,或者直接“骚扰”他。这种方式的效果肯定会比传统广告好很多。
因此互联网上的广告可以脱离广告载体本身,直接针对每一个具体的人群。传统广告是先考虑广告载体(电视台或节目、杂志内容、地址或楼盘等)来反向推断受众是什么样的人,然后投放出每个人看到的一模一样的广告(而且载体的物理条件也是有限的,不可能每个人都看到不一样的广告);互联网广告则完全可以通过你在互联网上的种种踪迹,知道你是一个什么样的人,广告的内容和创意可以根据你的具体情况来安排,而不必根据网站上的内容(或者手机APP的类型)来给每一个来这个网站的人投放一模一样的广告。
这个逻辑简单而又吸引人,几乎彻底改变了互联网广告的格局。如果你足够细心,就会发现现在互联网上的很多广告都和你在互联网上的某些行为相关联。比如你在淘宝上浏览了某款商品之后,会发现很多页面都有类似商品的广告。几乎所有的传统互联网广告公司都以精准定位人群的能力为卖点,强化人们对其效果的信心。专门根据互联网用户的个人信息识别投放定向广告的公司也突然激增,到2015年已有近百家。专门“监控”和刻画互联网上每一个个体的第三方公司也开始出现,2015年就有十多家,增长速度飞快。运营商和互联网巨头也开始向外界提供自己的一些用户数据。对互联网世界不同类型人群的识别和刻画工作也被更简洁地描述为人群画像,或者用户画像。
人群画像突然间成为了互联网营销不可或缺的一块金字招牌。这块金字招牌到底是什么?与之相关的哪些说法靠谱,哪些不靠谱?我希望通过一系列的文章来澄清这些问题。
人群肖像的经典元素
群体画像从字面意思上来讲就是用数据的形式来描述人群的情况,群体画像和个体画像并不完全一样,不要混淆。
给个体画像,是指对不同的个体进行描述的过程。在广告行业中,描述个体的方法叫做“贴标签”,这和电商中给商品贴标签很相似——商品上的标签包含了商品的唯一标识SKU,以及名称、价格、产地、生产日期、保质期、原材料等信息。给个体贴标签,也是将人的信息以规范的方式进行整理和存储,并附加到人的唯一身份上。这里我想补充一点,互联网上对人进行唯一身份标记的手段包括cookies(主要是PC端),或者IMEI、IDFA等(主要是移动端)。如果一个人在互联网世界里没有唯一身份,那么就无从谈起这个人的画像,因为谁知道谁是谁?所以,人群画像最基本的前提就是标记一个人的唯一身份。
人群画像与个体画像有很强的关联性,人群画像必须建立在个体画像的基础上,但又高于个体画像,反映的是人群作为一个群体的整体特征,人群是个体的集合,人群画像是以广告营销的目标受众为对象。
受众)或细分目标受众
比如iPod厂商的人群画像明显是针对喜欢听音乐的人群,而NB运动鞋厂商则想描绘运动时尚人群。
群体画像与个人画像的相似之处在于,都是对人的描述。但群体描述需要概括群体所呈现的共性,而不是多样化的特征。然而,正如没有两个人是完全一样的,个人的画像也不可能完全相同。当不同的人聚集成一个群体时,需要用一定的方法找到他们的共同点,并建立这些共同点与营销策略之间的逻辑关联。
群体肖像的经典要素由此而生成。它包括三个关键构成要素:个体身份识别、个体画像(即贴标签)、群体共性特征的抽象。前者是一切的前提,后者是基础,后者则是对前者的结合、抽象、分析和利用。
在下文及后续的文章中,我们将逐一详细了解这三个组件的秘密。
唯一标识符
在互联网世界中匿名“旅行”是每个人的基本权利(至少是部分权利),这使得追踪一个人的行踪变得困难。既然我们不能使用真名,我们至少应该给他们起个名字。
这个名字与真实世界的名字有很大区别,一来它是一串随机字符,没有任何意义,二来当事人可能根本不知道这个名字的存在。
比如你访问一个网站的时候,不管你注册没注册,网站都会给你一个名字,下次来的时候,即使你继续不登录,网站也会知道你在这里。这个东西太常见了,现在几乎所有的网站都在用它,它的名字就是cookie。
即使是同一个人,各个网站也会给这个人一个不同的 cookie 名称,这很好理解,因为各个网站都有自己的命名规则。因此,唯一标识符是相对的,对于同一个网站,不同的人应该有一个唯一的标识。但如果这个人去了别的网站,理论上是别人的事。这个人会被其他网站以不同的名字命名,其他网站无从得知。这就引发了一些问题,下面我们很快就会谈到。
随着移动终端的发展,使用cookies作为唯一标识符已经不那么简单了,因为移动终端使用量大,cookies必须和网站一起存在,APP上是没有的。不过没有cookies也没关系,移动终端还有其他东西可以识别人。在移动终端上,最常用的唯一标识符就是手机的IMEI号,或者IDFA(苹果手机的人机识别号),或者很多其他的ID。各种ID有些类别理论上是和手机硬件唯一绑定的(不同手机有不同的数字,手机不变这个数字也不会变),比如上面提到的IMEI和IDFA(IMEI和IDFA其实是可以修改的,不过可以算是很接近和手机绑定了),不会根据手机里安装的APP或者手机上的网站的不同而改变,所以这种识别号看上去比cookies好用。
那么,这些唯一标识符在现实世界中有用吗?
有人说现实就是一个大坑,我想反驳这个观点,但看来现实世界真的在强化自己的“坑”。都说知易行难,我们知道这些东西很好,但不一定能用好。我们继续读下去吧。
PC 上的唯一 ID
首先我们来看PC上的Cookie。在PC上,每个网站只能创建自己的Cookie。所以如果一个网民去了别的网站,这个网站就看不到他了。对于网民来说,这是好事,他不用担心别人知道他去了“苍老师”的网站。但是对于做广告的营销人员来说,这非常糟糕。因为不同的网站对人的标识符是不一样的,那么一个人在浏览不同的网站时,将无法追踪他的行为,也无法确定这个人的喜好是什么,画像的依据也就不复存在了。为了解决这个问题,一些广告公司想出了一个办法,让同一个人访问不同的网站,享有相同的Cookie。这个Cookie不属于网站,而是属于广告公司。简单来说,广告公司给这个人起一个名字,然后允许这个人在任何网站上仍然有这个名字,这样就可以确定这个人访问过哪些网站。 这种 Cookie 叫第三方 Cookie,原始 Cookie 叫第一方 Cookie。第三方 Cookie 是个好东西,它可以跨不同网站识别同一个人。只有跨不同网站识别同一个人,才能实现对每个人进行画像的前提。
问题好像解决了,但是突然有一天,我们发现cookies越来越不靠谱了。原因就是“隐私保护”!人们不喜欢cookies,谁愿意在不知情的情况下被第三方跟踪呢?第三方cookies尤其如此。因为第一方cookies毕竟只能限于一个网站,而第三方cookies的作用范围更广。欧洲人抗议得最激烈,所以欧洲立法要求网站在使用cookies时,必须在网站弹窗警告访客,征得用户同意后才能保存此人的cookies。虽然中国没有立法,但普通人不知道cookies是干什么用的,反正可能有害就一定有害。因此,出现了很多可以禁用或清除cookies的浏览器,支持者也不少。Cookies越来越不受欢迎了。 由于频繁的清除、禁止,能识别同一个人的Cookies平均生命周期越来越短,现在只有30天左右,而第三方Cookies受到的限制就更多了,很多甚至没有机会被建立。
有没有更好的办法替代cookies?在PC端,有很多替代方案,但很抱歉,真的没有真正替代cookies的方法。比如有人说用电脑的MAC(网卡硬件号)来识别,是个好办法!但这个事情没那么简单,第一,你有什么技术可以识别这个?第二,识别这个是法律禁止的!也有人说用Flash
Cookie(Adobe 公司的 Flash 的唯一用户识别信息)至今仍被浏览器禁用,并且 Flash 受到的批评日益增多,支持它的网站数量也在减少。
有人采用另外一种技术手段,似乎能够在一定程度上增加Cookie的寿命。其方法是:利用一种名为“钩子算法”的计算机程序,将同一个人的旧Cookie(清除Cookie之前)和新Cookie(清除旧Cookie之后分配的新Cookie,理论上两个Cookie是完全不同的)关联起来,从而延长Cookie的生命周期。但这种方法的致命之处就在于其准确性。对于数以百万计的Cookie来说,每次“钩子”连接都只有一定的准确率,误判在所难免。即便每次钩子的准确率是90%,那么五次之后,准确率就会不足一半。
这些方法都无法从根本上解决Cookies生命周期逐渐缩短的现实问题,如果只是在很短的时间内识别出上网者,Cookies还能用,但识别一个人的时间越长,Cookies的准确率就越低。
所以对于PC识别,很多人要想很多办法来追踪硬件号,但这个办法是违法的,追踪之后不能直接用来做广告。理论上来说,人群画像不应该以PC硬件识别号为依据,如果这个办法不能用,那我们只能接受不完善的cookies来进行短期的人群识别。
现在你应该明白了,如果一个广告主告诉你,他们已经积累了同一批人几个月甚至几年的PC行为数据,那是一个不靠谱的谎言,在这方面,只有有账户体系的大型互联网媒体才能做到这一点。
上次我们讲了互联网人群画像的构成要素结构,PC用户唯一身份标识的理想情况与现实情况,这次我们开始讲移动用户唯一身份标识与跨终端(跨屏)的情况,这也是一个理想与现实并存的故事。:)
移动终端唯一ID
移动端的唯一标识符似乎比PC端更好,因为没有人能轻易摆脱手机的IMEI号,而且很少有人知道如何清除苹果手机中的IDFA。所以移动端的唯一标识符应该简单而美观。
但事实并非如此。
移动环境的复杂程度甚至比PC还要大,首先在移动设备上使用的网站和APP大约占了一半,光这一点就比PC痛苦多了。不过为了让大家更好的理解在移动设备上的情况,我们先假设两种最简单的情况:移动设备上只有网站的情况和移动设备上支持APP的情况。
如果全世界的移动设备都只支持网站而不支持App,那我们基本可以把移动设备当成PC,用Cookie来解决这个问题。但是,即使在移动设备上,Cookie本身的缺点也是一样的。不过你可能会说,移动设备不是有IMEI或者IDFA号码吗?它们不能弥补Cookie的缺点吗?遗憾的是,移动设备上的网站无法利用这些与手机捆绑在一起的识别号来唯一地识别人——无论网站进行怎样的技术改造,网站都无法获取这些ID。因此,如果移动设备只支持网站,那你可以认为它和前面提到的PC上的情况没太大区别。
如果全世界的移动设备都支持APP呢?那就另当别论了。前面提到APP不能使用cookie,但APP跟踪可以使用IMEI或者IDFA等。但是,它们真的能很好地发挥作用吗?
我们先来看IMEI,IMEI准确吗?如果世界上没有水货、翻新机,所有通讯设备都是经过工信部审核通过的,那么IMEI是最可靠的。但是在中国,水货横行,翻新机也不少,这些不知名的手机IMEI可能被人为修改过,所以很多手机共用一个IMEI号,或者IMEI号为0的情况也很多,这种情况使得IMEI这个唯一身份的识别率不一定比cookie高。另外IMEI是机器硬件的编码,这些硬件编码涉及到硬件安全和隐私问题,不能明目张胆地使用。
替代IMEI的解决方案叫OpenUDID,这是一个开源的解决方案,被各大广告平台广泛使用。但是随着AppStore开始拒绝接受使用UDID的应用,OpenUDID无法被不同应用共用同一个值,上述ID注定要被淘汰出历史舞台。
需要提醒的是,IMEI这个绑定在手机硬件上的识别符只在安卓手机上有效,苹果iOS系统已经屏蔽了安卓手机,所以不能作为唯一身份,除非是越狱过的iPhone。
但苹果并没有堵死所有路,它关上了所有的门,而是“良心发现”(其实也是不得已),打开了一扇小窗,就是IDFA。IDFA是苹果手机独有的唯一用户ID,这个东西可以实现APP上用户的唯一标识,我们还有救吗?
是比较好,但是只能用来识别自己开发的APP的唯一用户,别人开发的APP的用户的IDFA你根本无从得知。因为IDFA不像上面说的第三方cookies,可以由广告公司控制,IDFA完全由苹果控制。在做人群画像的时候,用户唯一身份的服务提供者几乎不是APP开发者,而是几乎所有的第三方(广告公司或者第三方数据公司)。所以只有跟很多APP开发者合作,才能拿到同一个用户在多个APP的IDFA,还能对同一个用户进行画像。这基本不是技术问题,而是纯商业问题。商业问题的难点在于,跟一两家合作容易,跟一两百家合作就太难了,而且也是“偷虎视眈眈”(拿别人的机密数据信息),毕竟你不是BAT那样在市场上占据主导地位的厂商。
所以从用户画像上看,安卓手机要比苹果手机好,原因就是苹果比较封闭,第三方的生存空间非常狭窄。
以上这些还不是最麻烦的问题。
工程师告诉我,移动设备最大的问题就是终端的极端多样性,硬件、操作系统、软件等都是碎片化的,而且不同人使用各种不同的识别方式,互相之间无法互通,因此在移动设备上进行唯一身份识别确实非常困难。
然而,这只是我们假设的最简单的两种情况!
在现实世界中,手机端既支持网站,也支持应用,基本上同一个人可以同时使用手机和应用。我们能否实现跨手机和应用的唯一用户识别,并在此基础上建立人群画像?
目前还没有技术解决方案。虽然有一些变通的方法,比如建立一套APP和网站通用的ID体系,或者要求同一个用户先使用APP再使用网站来实现某项功能,但这些变通方法只能在非常小的局部范围内使用,根本不是通用的解决方案。这离我们做群体画像所需要的所有网民的唯一身份还很远。
因此,移动端也没有一个准确的唯一标识,也就是说,我们没有一个全局的上帝视角,无法记录任何用户在移动端使用的所有网站和应用的相关信息。或者说,大多数网站和应用的相关信息都很难获得,更不用说全部了。甚至仅仅知道这些网站的网址和应用的名字都不太可能。
跨设备唯一标识
最后说一下跨设备唯一身份识别,我猜你已经迫不及待了,这个领域曾经被热议,但似乎没有在人群画像中用到的案例,后来好像被“抛弃”了,原因是什么呢?
事实证明,既然没有通用的解决方案可以在移动设备上的应用和网站上识别一个人,那么对于使用多台设备的人来说,就更没有通用的解决方案了。早上你用手机,中午用电脑,晚上用 iPad 上网。很难让广告商(或第三方服务提供商)知道同一个人在使用这些设备。
一些互联网服务提供商(过去通常是一些媒体)拥有跨设备唯一识别用户的能力。比如他们有强账户体系。所谓强账户体系,就是无论你在PC还是手机上使用他们的服务或内容,都需要登录账户。这就意味着他们能够“天生”知道你是同一个人。
还有一些服务商可以通过判断不同的设备是否经常同时出现在某个IP段来判断这些设备是否属于同一个人。这种方法是可行的,因为获取设备的IP地址并不困难,无论是APP还是网站。这样,不需要强大的账号体系就可以判断这些设备是否属于同一个人。如果算法得当,数据充足,这种方法的识别率随着时间的推移是可以变得相当准确的。当然我说的相当准确是可以有30%以上的识别率,80%以上用这种方法基本是不可能的。
如果没有强账号,也没有技术手段,那么最后一类跨设备唯一标识,就是通过一些营销手段来实现。比如需要在手机上扫码(比如领优惠券),然后在PC上实现某项功能(比如完成购买)。这听起来麻烦,但总比没有办法好。当然,这种跨设备唯一标识的范围极其微小,因此不具备人群画像所需的普适性。
但问题是,如果要获取一个人(或一群人)的画像,仅依赖一家互联网服务商不太可能做到。因为这个人(或这群人)的互联网使用行为肯定不会局限于这家服务商的范围内,而是会遍布互联网的各个角落——他们会用百度搜索东西、用腾讯QQ聊天、用淘宝买东西——没有哪个第三方可以同时获取同一用户在不同设备上使用各种互联网服务的数据。即便可能,也是极其困难的。
所以,不可能用全网的用户数据来做人群画像,所有的人群画像都只能基于本地数据。而跨设备唯一身份识别,除了少数服务商外,基本只是口头上的成就,这与数据处理能力、大数据无关,数据能力再强也没用,这是现实世界的事实。
好了,我总结了一下PC端和Mobile端各种用户身份识别方式的优缺点,并不是量化的,所以仅供大家参考:
各种唯一标识方法的优点:
点击上图查看完整版本
各种确定唯一身份方法的缺点:
点击上图查看完整版本
下一期,我们将继续探索互联网营销人群画像,接下来,我们将对人群画像的第二个组成部分——“个体画像标签”进行深入探讨,敬请期待!
原文链接: