ACM CIKM, Mobvista
2020-10-23

厉害了!M星反作弊团队论文被ACM CIKM录用,并出席大会分享相关成果

随着移动广告行业的迅速发展,移动应用安装作弊也日渐猖狂。一直以来Mobvista的工程师们始终站在反作弊攻防这一战场的最前线,为增强移动广告行业的透明度并推动行业规范化发展而奋斗。

Avatar

10月22日,Mobvista的高级算法工程师姚天峻及资深算法工程师李青携带在移动广告反作弊领域的最新研究成果,出席了第28届国际计算机信息与知识管理大会(ACM CIKM2020),并在 “Applied Research Track Advertising I”环节分享了Mobvista在移动广告反作弊领域的最新研究成果。

ACM CIKM

ACM CIKM是信息检索和数据挖掘领域的顶级学术会议之一,本届CIKM会议共收到投稿920篇,其中录用论文193篇。

此次Mobvista反作弊团队被录用的论文,题为:BotSpot: A Hybrid Learning Framework to Uncover Bot Install Fraud in Mobile Advertising。是在集团副总裁朱亚东指导下完成的,并得到了中山大学梁上松教授的指点和帮助。论文中展示了Mobvista反作弊团队研究并实现的一种新型的Bots安装作弊检测模型——BotSpot,以及该模型取得的成果。

Bots安装作弊:

Bots安装作弊,是指作弊者通过 Bots来模拟真实用户的应用安装行为,从而窃取广告主的广告预算。Bots安装作弊之所以难以检测是因为Bots看起来很像真实用户,它具有真实的IP、Device等,甚至可以进行应用内的事件,如:在指定时间打开应用,加购等。

在所有移动应用安装的各种作弊类型当中, Bots安装作弊无疑是当前最难识别的,同时也是占比较大的一种作弊类型。

根据AppsFlyer在2019年的一份报告显示,  AppsFlyer在2017年至2019年三年期间检测到超过16亿次安装作弊,其中Bots安装作弊高达9亿多次。

Evolution of Mobile Ad Fraud

让人感到遗憾的是,尽管Bots安装作弊如此猖狂,但却很少有关于安装作弊,尤其是关于Bots安装作弊的研究。

“目前,许多基于机器学习的移动广告作弊检测方法都旨在解决广告展现或点击作弊问题,大多数采用了集成方法等技术,例如:Random Forest和XGBoost等,尽管这些方法能够通过复杂的特征工程挖掘出丰富的作弊模式,但由于它们无法利用结构信息来构建实体之间的各类关系,因此这些方法并非最好的解决方案。”

——集团副总裁:朱亚东博士

在此背景下,我们的反作弊团队提出了一种混式学习方法,该方法结合了图神经网络(GNN)和梯度提升分类器,能够同时考虑局部上下文信息和全局上下文信息,以此来更好地检测移动广告中的Bots安装作弊。

工程师们并未直接利用现有的GNN模型,而是根据Mobvista的具体业务和Bots安装作弊的特点构建一个异构图并设计了一种新颖的消息传递机制来提取局部上下文信息;以及通过一个Pre-trained的梯度提升分类器模型来提取全局上下文信息。

 BotSpot模型的架构如下图所示:

the model architecture of BotSpot

通过在Mobvista上对真实数据进行的实验结果显示,BotSpot模型在检测Bots安装作弊方面具有更大的优越性。在指定精确率(Precision)为90%的情况下,BotSpot模型在两个离线数据集上相比所有其它Baseline方法在召回率(Recall)方面分别提高至少2.2%和5.75%。在整个市场鲜少有机构针对Bots安装作弊做研究的背景下,这一研究成果无疑将为整个行业带来深远的影响。

除本次论文外,值得一提的是,今年5月份, Mobvista针对移动广告作弊问题,还发布了《移动广告反作弊白皮书2.0》,详细阐述了当前的移动广告领域的作弊情况、作弊方式及相应的反作弊策略等。

“Mobvista始终站在移动广告反作弊攻防这一战场的最前线,希望通过此次论文的分享,能够为行业带来更多的思考。”

——集团副总裁:朱亚东博士

点击链接,获取完整论文

https://www.mobvista.com/en/college#botspot

Share