WIFI探针,是数据金矿还是数据噪音?

 

【摘要】WIFI让人们方便地接入互联网,并因其具备室内位置信息而成为线下营销数字化进程中的重要环节。WIFI探针作为通讯设备的衍生品,具有成本低廉、部署简单,并且不打扰客户的优势,但也因其天然技术局限,...



【摘要】WIFI让人们方便地接入互联网,并因其具备室内位置信息而成为线下营销数字化进程中的重要环节。WIFI探针作为通讯设备的衍生品,具有成本低廉、部署简单,并且不打扰客户的优势,但也因其天然技术局限,而需要通过补充技术手段,克服数据衔接的各种困难,才能实现“准确识别、有效匹配、精准触达”,最终达到主动集客、精准转化的目标。



汽车行业关注(autochat.com.cn)5月13日报道——

一、WIFI,可能是“最好用的”线下场景的客户连接手段

过去10年内,WIFI显著改变了中国人的日常生活,甚至有人已经将WIFI增补到马斯洛需求层次论中,当然这只是个玩笑。但毫无疑问,WIFI就如水电一样,已经成为重要的基础设施,人们已经非常依赖WIFI带来的无线连接能力。

WIFI不仅仅是个通信管道,更是数据的集散途径,而且具有丰富线下场景属性。之所以说WIFI可能是“最好用的”线下场景客户连接手段,不仅是因为人们已经习惯于在家或者单位接入WIFI而外出通常不会主动关闭,更有全国数以千万计的WIFI热点及探针已经构成了一张信息丰富的场景地图,在此基础之上的数据分析具有良好的条件。

因此,关于WIFI的大数据应用前景,始终是数字营销中的炙热话题,其中最有吸引力的有以下三个:

1、客流统计:对手机MAC(WIFI网卡地址,可用于每部手机的唯一识别信息)的侦测和分析,实现商家区域内的客户数量统计及分析,例如来店量、新老顾客比例、停留时长、来访周期等,实现自动化的流量转化管理能力。

2、群体画像:打通位置信息、支付数据、会员数据、消费数据、营销数据,形成完整的用户画像,实现对客户的洞察,有的放矢,支持营销决策。

3、精准营销:根据用户所处的场景进行互联网广告投放,甚至直接进行互联网短信、电话呼入,以获得销售线索和成交机会



二、基于MAC地址的线下数据应用,至少要克服5大环节的困难

应用前景固然美好,但现实仍然很残酷。到目前为止,WIFI数据的上述应用还处于探索阶段,实际创造的价值非常有限。这是因为,以下因素制约了客户数据的有效应用:

1、仍然只是抽样,而非全量大数据

实际测量结果表明,大概只有20-40%的手机MAC地址可以被有效探测并记录。这首先是因为相当一部分客户关闭了WIFI,更重要的是苹果iOS系统已经广泛启用了WIFI反侦测技术,通过发送随机MAC地址来保护客户的隐私。

为了解决iOS发送随机MAC地址而导致客户ID无法识别的问题,唯一的办法是通过伪造用户曾经链接过的WIFI热点(例如:CMCC、Starbucks、McDonald等等),诱导苹果设备自动连接以便获取其真实MAC地址。但是,这一方面会导致客户网络中断,其仿造知名企业服务途径的方式更属违法欺诈行为,只能遮遮掩掩而无法大规模应用。

因此,希望长期合法运用技术手段来获取营销和服务能力的企业,应该意识到,用好MAC数据,首先要接受其“不完整”的先天条件。

2、场景定位不准,基础数据噪声巨大

WIFI技术用于客户的线下场景定位,具有很好的优势,尤其与室外定位的GPS形成互补。因为,一旦手机进入建筑物当中,GPS信号被严重遮挡就会导致无法定位。而WIFI探针则可以对所有打开WIFI功能开关的手机,进行信号采集并分析强度,来判断该客户是否就在附近,从而实现对客户进行定位。

遗憾的是,这种定位是建立在很强的通讯信号容错性前提下的附属功能,误差可比GPS的米级别(三角定位后通常是3-10米)要大得多了,如果仅以设备信号强度与距离成反比的简单关系计算,实际定位误差会高达30-50米。这是因为,不同手机的WIFI信号强弱差异巨大,而且同一部手机在正常通讯与节电静默状态下的WIFI信号强度甚至会相差十倍以上,加之环境遮挡与反射带来的信号抖晃,使得WIFI探针捕捉到的信号强度会在非常大的范围内波动。如果采用简单的线性换算关系,结果将体现为该用户距离WIFI探针的位置忽而只有2-3米,忽而又远至40-50米。对于线下零售场地而言,几十米,已经完全是另外一个场景了。

无论是零售门店(服装店、便利店、汽车4S店),还是营销活动场地(车展展台、路演场地),离开边界5-10米,就已经进入另外的店或者不同性质的场地。也就是说,本来希望侦测一家4S店内的客户ID,却由于定位误差而得到周边公交车站人群、其他商家的客户。这显然从源头上就导致了数据“不干净”。

因此,如果希望在这些线下场景部署WIFI探针,以统计客流量和获取客户ID用于分析,就必须采用更高精度的WIFI信号定位技术,例如三角定位、指纹定位等。

3、客户ID匹配度低,大数据难以真正打通

基于客户定位作为线下场景标签,与线上数据打通,实现完整的消费者特征与行为分析,是WIFI数据应用的重要方向。但目前还只有少数商用WIFI服务商、提供WLAN接入的电信运营商的DMP(数据平台)中存在MAC字段可供匹配整合,加之电信运营商长期以来对MAC地址数据的不重视以及分散数据管理模式,导致最终可以统筹匹配的数据非常有限。

由第三方的长尾App联盟提供的数据匹配更是因其数据背景的复杂、不透明而很难保障有效性,实际通常只能完成20-40%的MAC地址与后台数据匹配,这大大降低了WIFI数据的应用价值。2017年下半年,Android版本升级后也禁止了App调用手机MAC地址,这使得从应用端获取MAC及直接应用更加困难,因此长尾App相关的数据联盟对于WIFI数据应用的能力大幅下降。

相对而言,电信联通以及BAT三巨头拥有更好的数据条件,可供完成WIFI数据整合和应用。尤其电信,掌握全国大部分的公共WIFI热点及光纤路由器,并且其大数据平台较早完成了集中化管理,未来将会在WIFI数据的应用方面占据较大优势。

4、画像只能重复常识,无法带来新认知

通过客户白天和晚上所在位置判定其工作属性生活形态、通过近期浏览的垂直网站或购物分类判断其消费偏好,这是用户画像的基本思路。随着用户上网行为越来越向超级App集中,并且大部分超级App自身的信息封闭性很强,使得用户数据实质上已经形成了围绕着BAT集团的几个孤岛,BAT岛内信息将越来越丰富,并且能够有效帮助BAT们不断提升客户运营效能,这也是巨头们通过数据优势获得超额收益的前提。

而在画像领域更为活跃的第三方数据公司,情况就变得不那么乐观,直接从BAT获取数据难度非常大,而长尾App中的有效信息越来越少且更加碎片化。因此,基于线下WIFI信息的客户画像,存在大量灰色地带,画像供应商更像是个黑盒子,只能输出结果,而无法解释或者证明该结果的真实性、有效性。

相对而言,客户画像的基础服务,未来必将基于BAT的生态体系或者基础电信运营商数据。

5、精准营销的触达困难,存在法律风险

基于对每个客户的了解,在恰当的时机、通过恰当的途径,把恰当的内容传递给每一个具体客户,这是所有企业梦寐以求的“精准营销”。在以客户关系管理为核心的售后领域,这种甲乙方关系,能够非常有效提升服务质量进而提升客户忠诚度。但在售前领域,考虑到对用户隐私的保护,拥有基础数据的电信运营商或者头部App企业,必须对用户数据进行脱敏处理,通过群体画像的方式,为广告投放提供方向指引,而避免一对一的广告投放行为。



三、挖掘WIFI探针数据价值,必须基于每个行业的独特场景进行工程适配

能否克服上述5个环节的实际困难,直接影响了WIFI探针数据的实际应用价值。正如很多基础性的技术一样,WIFI数据在不同行业的应用,必须适配该行业的具体特点,要解决非常多的工程问题。

相对而言,客群基数大、定位精度要求低、客户分类模式简单、甲方自身拥有的客户数据丰富,这几个条件越好,WIFI数据的应用难度越小。例如,房地产领域,通过WIFI探针数据,能够对潜在客户的区域分布、职业特点有效洞察,以实现针对性的楼盘规划;零售卖场或者购物中心,则可以通过遍布购物中心的WIFI热点(探针)来实现客户动线分析,以及门店实际客流量分布的判断,一方面可以优化场内业态组合,另一方面则能够深度分析商场客户属性来想办法提升他们的重复到店、停留时长,实现更高效能的客户运营。

而对于小型零售店(面积太小导致定位误差大)、汽车4S店(消费者数量少,工作人员占比高)等场景,就需要先从采集环节入手,在确保客户信息采集有效的前提下,一步步实现数据应用。以汽车4S店为例,在前述的三个层次应用中,需要关注以下问题:

1、客流统计:需要补充MAC探测之外的手段,来完成客流量的全量感知和记录

如前文提及,相当一部分客户来到店内时,手机WIFI开关并未打开或者因iOS特点导致无法被WIFI探针有效侦测。为了尽可能获取全量客户信息,通常采用摄像头或其他传感器进行客户感知。但是,汽车4S内人员进出结构复杂,真正消费者的占比往往不足10%,单纯使用摄像头也会导致客户数量的高估。因此,可行的方式有以下两种:

A、通过WIFI探针信息结合摄像头的统计量,利用机器学习的方式,对实际客流量进行拟合建模,以实现后续的客流量测算。

B、直接采用人脸识别技术,对所有到店者进行分类,去除工作人员后得到最终属于消费者的人数。

无论哪种方式,这都需要基于每一家4S店的具体情况,进行一段时间(通常是2周)的初始化采集,才能保障机器学习的效果具备实用性。上述方式,可以将客流统计的误差水平从数倍下降到10-30%左右,即精度水平实现数量级的提升。

2、客户画像:先解决客户ID数据的准确性,再选择真正拥有可靠数据的平台合作

客户画像的前提,是输入大数据平台的种子数据是高质量的。这在纯互联网的线上体系是具备天然成熟条件的,例如访问过公司官网的客户、通过某个渠道完成注册的用户等,他们的性质可以被准确判断,并用于下一步画像比对分析。

线下数据,一旦定位识别精度不足,就会导致客户性质判断错误。前文提及的WIFI探针定位上的能力缺陷,在汽车4S店内也会遇到很大挑战。目前,具有实用性的方案至少可能包括:

A、多点定位方式,尤其是需要建立具体场地指纹库来保障判别准确,以实现场内外判别精度至少应在80%以上;

B、基于手机设备的行为模式来实现数据有效清洗,如停留超过半天、每周出现3天以上可以作为工作人员而剔除。

毫无疑问,用于画像的数据本身的信噪比,对于画像结果的影响是决定性的,只有先确保清洗结果中包含的非客户数据比例极低(例如


    关注 汽车行业关注


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册