【Wiztalk腾讯广告专场】系列分享来袭,第四期由南开大学计算机学院副院长、网络空间安全学院副院长刘哲理老师为大家深度介绍 《隐私集合交集算法研究》。在不久前由中国国际智能产业博览会组委会、中国网络空间安全协会主办的“2020数据安全高峰论坛”上,本方案荣获“2020年数据安全典型实践案例”,其基于腾讯与南开大学双方联合研制的算法,实现了在数据保密前提下,不同平台或企业之间的商业价值挖掘。

这条广告点击来自哪里?

你有过“感觉仿佛被广告轰炸”的感觉吗?比如苹果的iPhone11发布以后,街边公交站是它的广告,打开社交app有它的广告,打开视频app有它的广告,打开购物app还有它的广告,简直全方位覆盖不留死角。

不过广告投放可并不是这么简单地就结束了,广告主往往都希望能够知道来自不同渠道的广告点击访问分别有多少,以便追踪观察自己的营销和广告投放策略。一种简单易用、广泛通用的做法是,在点击广告之后跳转的页面的URL地址后面添加下面这样格式的参数:

其中用 “utm_source=weibo” 表示这条点击来自微博,用 “utm_medium=social” 表示媒体性质是属于社交平台。

这样一旦这个带参数的URL地址被访问了,它也就把访问来源记录下来了。比如XX品牌为A商品在不同平台投放了广告,希望广告点击后都可以指向同一个页面。那么在添加参数之后,不同平台的广告点击之后跳转的页面URL很可能分别是:

腾讯视频
‐www.xx.com/a_main.htmlutm_source=tencentvideo&utm_medium=video

微信
‐www.xx.com/a_main.htmlutm_source=weixin&utm_medium=social

腾讯网
‐www.xx.com/a_main.htmlutm_source=qqcom&utm_medium=web

用这样的方式,即便不同平台投放的广告指向的是同一个页面,广告主也能简单清晰准确地了解每次点击的来源,然后用一些常见的流量统计分析工具得到统计结果,了解广告在不同平台的投放效果如何。这样的统计方式也正对应了在线广告的常见广告收费方式之一,“按点击收费”CPC,广告在不同平台上的点击量既是广告主自己关心的直接业务指标,也是向广告平台付费的核心依据。

大数据隐私保护

这条广告曝光的效果如何?

在线广告还有另一种收费模式,按照广告的曝光收费CPM,而且CPM也已经成为了主流的广告收费模式。这一方面是因为人(也就是观看广告的潜在客户)的行为是复杂的,他很有可能观看多次广告以后被打动了,产生了购买行为,但他并不是点击广告购买的,这就无法被点击量和点击来源统计覆盖;另一方面也因为广告是复杂的,有相当比例的广告并不直接推销产品,这部分广告更看重宣扬品牌形象、建立消费者认知,并不追求观看者的直接点击购买,也就很难用点击指标为广告定价。

对在线广告平台而言,按照曝光收费是更合理的,毕竟广告平台有能力较准确地控制广告的曝光次数,而点击乃至购买行为就很大程度上受到广告自身的影响了。不过广告平台也希望能够协助广告主了解广告曝光之后的效果,即从广告曝光到广告点击乃至商品购买的转化率如何,或者反过来,购买了某个商品的消费者中有多少曾经看到过平台上曝光的广告。

隐私问题是难关

以XX品牌的A商品为例。消费者购买商品的网购平台记录了A商品的所有订单信息,准确地知道谁买过A商品;广告平台也掌握着广告曝光数据,知道有哪些用户看到了平台提供的A商品的广告。理论上来说,只需要网购平台和广告平台都把数据拿出来核对,找到同时出现在两个平台数据中的用户,就可以准确追溯哪些购买了商品的用户看过广告平台上的广告,从而计算广告曝光效果。

但在实际中,这种直接核对的操作是绝对不可行的。不仅因为网购平台和广告平台经常不是同一家企业,仅仅出于保护商业机密就不可能向对方直接透露信息;更因为这些都是消费者的个人隐私数据,不可以泄露,也不可以用来识别消费者的身份。

不过,追溯广告曝光和购买之间的关系,毕竟有巨大的商业价值,网购平台和广告平台都会对这个结果感兴趣。研究人员们还是希望能够找到一些方法进行计算。

在线广告类型及其隐私问题

在加密保护下协作利用数据

如何在双方数据都保持保密的前提下计算双方数据的重合部分,也就是寻找数据交集呢?

在期刊 《Future Generation Computer Systems》 上发表的由南开大学、英国密德萨斯大学、腾讯合作完成的论文**《Unbalanced private set intersection cardinality protocol with low communication cost》**就提出了一种隐私交集算法来解决。

这个方法的核心是加密。双方都要把数据集中的每一条数据用一定的加密函数加密,加密后的数据对方无法解密、无法读取。网购平台方、广告平台方的加密函数分别是f(x)、g(y),为了能实现加密条件下的数据交集计算,经过精巧的设计让f(x)和g(y)满足交换加密。即:

当数据库中的数据条目x=y时,f(g(y))=g(f(x))

这样,双方只需要把自己的数据库逐条加密再发送给对方,接收到对方发送的加密后的数据库后再进行一次加密,得到了两种不同加密顺序后的结果。加密后的结果不会泄露原始数据,可以直接对比,也就知道了双方数据库的交集大小,完成了广告曝光效果溯源。

挖掘数据交集中的更多信息

除了**“完成了购买的用户有多少观看过广告”**之外,购物平台和广告平台还可能会对一些相关的其它数据感兴趣,比如计算交集得到的这部分用户的总消费金额。以隐私集合交集运算为基础,结合同态加密等技术,可以得到交集用户消费总金额的同时也依然保证了无法得知这些用户的身份。

在通过加密方法达成目标的这个层面之外,隐私交集算法本身在使用中的安全性也需要经得起检验。在论文中作者们对方法的安全性进行了谈论和验证,证明它足够安全。而且,作者们还考虑了双方不对等的情况,其中一方可以是低功耗的IoT设备,计算能力非常有限,那么它就不需要加密另一方的数据;当广告平台方的数据远多于购物平台方的数据时,算法会具有很高的执行效率。

通过隐私交集算法,不同角色的平台或企业之间可以在数据互相保密的前提下寻找到其中的重合数据,找到隐含的商业价值,比如本文提到过的追溯购买了某产品的消费者中有多少观看了广告平台上的广告,乃至找到交集消费者的总消费金额,就是典型的例子。

隐私集合交集及其应用

Wiztalk是腾讯高校合作组织的系列产学融合知识分享讲座,鼓励用更加科普式的知识传播方式,讲解近代及当代技术发展中的大事件,让读者能够系统性了解在过去、现在、未来中,科学研究如何为人类的社会发展创造更多可能性。

点击链接,查看完整讲座

拓展阅读

【广告技术】揭秘!腾讯广告是如何有效划分用户群体的

【广告技术】用张量分解预测广告库存,广告投放更可靠!

【广告技术】使用图神经网络进行信息聚合与推理,解决多证据事实验证问题

【广告技术】隐私集合交集运算结合同态加密,在保障数据安全的同时追踪广告效果相关推荐

  1. 追踪广告效果保护用户隐私 —— 隐私集合交集算法可以得兼

    01 这条广告点击来自哪里? 你有过"感觉仿佛被广告轰炸"的感觉吗?比如苹果的iPhone11发布以后,街边公交站是它的广告,打开社交app有它的广告,打开视频app有它的广告,打 ...

  2. 26. 隐私计算时代的全同态加密处理器

    新浪科技讯 12月16日下午消息,由新浪财经客户端.新浪科技联合主办的"2022科技风云榜"线上年度盛典今日开幕.中科院计算所副教授.硕士生导师路航发言指出,人和计算系统的关系正在 ...

  3. 【广告技术】如何提升定向广告效果?腾讯广告提出高质量负实例生成新方法

    基于CCF-腾讯犀牛鸟基金的平台支持,腾讯广告与清华大学李勇老师团队围绕分布式大规模推荐算法开展了深入的合作研究.双方最新的合作成果入选了信息检索和数据挖掘领域顶级学术会议之一ACM CIKM 202 ...

  4. 安全多方计算之隐私保护集合交集

    作为安全多方计算领域具有广泛的应用场景的一类协议,隐私保护集合交集技术在近年来得到了极大的优化,达到了在某些场景下与目前正在使用的非安全交集技术同一量级的运行复杂度. 摘要:隐私保护集合交集(Priv ...

  5. 5、隐私计算--同态加密

    目录 同态加密 同态加密研究进展 同态加密原理及方案 同态加密分类 HE方案安全性 同态加密与区块链 同态加密应用 全同态工程实现开源工具 参考推荐: 同态加密_federated的博客-CSDN博客 ...

  6. 【广告技术】使用图神经网络进行信息聚合与推理,解决多证据事实验证问题

    [Wiztalk腾讯广告专场]系列分享来袭,第三期由清华大学计算机系副教授.博士生导师刘知远老师与清华大学计算机系硕士生周界为大家深度介绍 <基于图结构的事实验证>. 从浅显的文本处理走向 ...

  7. 【广告技术】用张量分解预测广告库存,广告投放更可靠!

    [Wiztalk腾讯广告专场]系列分享来袭,第二期由中国科学技术大学计算机学院.特任教授张兰老师为大家深度介绍 <基于大规模数据张量分解的广告库存预估>. "下个月会有多少用户看 ...

  8. 隐私计算之全同态加密

    [引]走近任何一个领域,都会发现自己的渺小和微不足道,会越发地敬畏技术和未知,隐私计算也不例外.读了一点儿文章和paper,觉得还是ACM 上的这篇综述(https://queue.acm.org/d ...

  9. 转载-联邦学习 - 基础知识+白皮书+杨强教授讲座总结+同态加密+ 差分隐私

    原文链接:https://blog.csdn.net/qq_41409438/article/details/102213895 联邦学习 兴起原因 概念 分类 横向联邦学习 纵向联邦学习 联邦迁移学 ...

最新文章

  1. Java快速入门-01-基础篇
  2. 查询阜阳2021高考成绩,2021年阜阳高考成绩排名及成绩公布时间什么时候出来
  3. eclipse新建Android项目
  4. 第一个Sprint冲刺成果
  5. 密码字典生成工具crunch的简单使用
  6. Jsp/servlet面试题
  7. 只需三步即可将 Python 程序转换成 exe 文件
  8. 内网入口——代理搭建端口转发
  9. css实现带边框,半透明气泡定位浮层效果
  10. (五)DDR协议命令波形时序二——(Precharge、Refresh、Self Refresh、Power Down)
  11. java代码审计手书(三)
  12. 语音标注必须了解的基础知识点
  13. 【LeetCode】详解环形链表141. Linked List Cycle Given a linked list, determine if it has a cycle in it. To
  14. eclipse使用代码质量管理审查工具整理sonarlint(第一篇)
  15. 再获肯定,云畅科技旗下腾云畅翼入榜2021腾讯云启创新生态企业年度榜单
  16. 开源Python-单元测试
  17. CSDN2011年重大IT安全事件回顾
  18. Teamcenter二次开发客户端环境配置
  19. 【Python】P1747 好奇怪的游戏
  20. 基于SSM框架汽车美容管理

热门文章

  1. 持有至少百万美元钱包本周增至66,540,增长了150%
  2. SAP License:SAP S/4HANA就是答案
  3. SAP License:系统退货处理流程
  4. SAP License:杂谈-珍爱生命,远离SAP
  5. 入门:HTML表单与Java 后台交互(复选框提交)
  6. 统计单词个数(codevs 1040)
  7. 实用的设计模式【二】——类的组织
  8. SQLcode错误代码汇总和sqlstate=37000的解决方案
  9. 到今天上了一个月班了,功能基本实现了.
  10. 爬取100页京东商品评论