相似人群拓展(Lookalike)技术作为2018腾讯广告算法大赛赛题,考察选手的算法能否在大量备选人群中准确标定与种子人群包特征相符的人群。本次大赛联动腾讯各方资源,携手知名学术专家为行业带来一场广告算法竞技盛宴,助力营销。

“Lookalike”简单理解是一个人或事物和另外的人或事物非常相似。在互联网商业应用中,许多广告主在“搜寻潜客”时,都会遇到如难以识别高潜人群、难于平衡成本与规模等问题。该技术可以利用广告主第一方数据,基于少量的种子用户,通过大数据分析和机器学习拓展出和种子相似的用户人群。而这些拓展出的相似人群同时也有很大可能成为客户的目标人群(比如,APP的下载激活、商品的收藏购买,目标粉丝的扩展等等)。

Lookalike技术如何赋能商业?

近几年来,各大互联网公司纷纷推出Lookalike相关的产品和技术,应用其商业项目。如Google推出的“Similar Audiences”根据用户近期的浏览和下载APP行为,为广告主推荐扩展人群。Facebook推出Lookalike Audiences,可以根据Custom Audiences所筛选出的用户名单为参考,再筛选出与其相似的受众,让广告主可以将广告投递给此名单内的用户。阿里推出达摩盘(DMP)Lookalike 模型根据对店铺或品牌最忠实的那批用户(种子用户),并通过Lookalike 模型找到与这些种子用户相似的人来增加店铺的有效浏览和转化。

腾讯社交广告团队最早在 2013 年开始调研探索 Lookalike 定向技术,基于种子用户画像和关系链寻找相似用户,即根据种子人群的共有属性进行自动化扩展,以扩大受众覆盖面,提升广告效果。例如,家庭、社会身份、地位、相关群体等社会因素,文化、次文化等文化因素,以及行为、动机、兴趣等心理因素等都能形成相似人群拓展Lookalike的筛选标准。以社交关系链为基础,腾讯社交广告可以助力广告主寻找相似线索、捕捉高潜客户。

通过邀请大量广告主进行测试,实验效果表明具备社交关系链数据基础的相似人群拓展功能,可以更好的拓展“高潜”用户。如对目标受众(Target Audience)的亲朋好友投放广告,也能够有效的影响到目标受众的购买决策。

Lookalike技术为何引得各大商业公司趋之若鹜?

  1. 相比显式用户定向标签(如人口学,兴趣,行为等)需要大量广告主人工参与试错,隐式 Lookalike 几乎不需要广告主参与。部分平台只需要广告主上传具有特定目标(如曾经有过购买行为的)的种子用户的ID或设备ID。而腾讯社交广告团队最新推出的oCPA自动扩量,则完全不需要广告主进行任何操作,即可在满足广告主设定的目标(如平均转化成本)下,通过Lookalike技术扩大潜在人群,大幅增加广告主的转化量;

  2. 虽然目前广告系统都提供了丰富定向接口:人口学、LBS/地域、兴趣、行为、再营销等等,但是依然很难满足很多广告主的个性化需求。如果要为每个广告主打造定制化标签,不仅周期长、成本高,而且很难通用。而Lookalike技术可以根据种子数据自动发现相似人群,有效规避了自定义标签面临的问题;

  3. 高潜力用户难寻、精准与规模之间难取平衡点是广告主所面临的两个主要难题,其核心仍在于对大规模潜在用户的有效触及。效果和规模之间达成“帕累托最优”(最理想状态)显得相对棘手——随着流量数量的增大,人群的聚焦性也必然逐步降低,寻找目标人群的难度加大,致使非目标人群的比例也随着流量的增加而增加。而Lookalike技术通过大数据分析和复杂模型学习归纳高质量人群的人口特征,然后在更大的流量范围内,寻找具有类似人口特征的人。

在未来,Lookalike还有哪些可能?

Lookalike技术已经发展多年,并且在业界取得了良好的反响。但是,未来该技术仍然有极大的发展空间:

  1. Lookalike当前的解决方案都是以“人”到“人”的方式,未来可能结合“物”的特征也是一种方式。比如一条新的广告到来,可以根据广告的图片、描述等自动扩展一批相似或喜好人群;

  2. 虽然lookalike扩展效果总体上很好,但机器模型难保证没有失误的时候。因此在商业应用的时候就需要一个逐步探索扩展的过程,而不是一次性扩展大量人群。在广告投放上这种需求更加迫切,如果扩展人群数过多必然导致精准性差,反之则会影响广告的曝光展示量。如果能够结合扩展的效果动态的调整扩展人群数,则提供了一个很好的扩展节奏;

  3. Lookalike扩展人群的可解释性:虽然可以通过一系列的大数据分析和机器学习技术拓展了一批用户,但是拓展的途径、人群的行为特征等都需要一个直观的解释。比如扩展的人群在哪些特征或行为上匹配种子用户,而未被拓展的人群,又是怎么样的? 但目前绝大多数平台都无法回答这一问题;

  4. 降低种子用户的敏感性:种子用户是拓展的前提和基础,种子用户的质量往往也是lookalike效果好坏的关键。但广告主很难提供数据量足够大且足够宽泛的种子包。这个时候就需要考虑如何在少量种子包且种子不一定能覆盖全局特征的情况下,进行有效的数据预处理和模型学习。

作为“技术+数据”完美结合的技术产品,Lookalike正在成为广告主在数字营销当中不可忽视重要助力。在未来,腾讯社交广告将不断推动Lookalike算法和技术升级。我们不妨共同期待,Lookalike的无限可能,将在未来绽放更大的数字化营销价值。

腾讯广告算法大赛 | 专家开小灶,独家解析Lookalike那些事儿相关推荐

  1. 腾讯广告算法大赛“视”界杯专题直播来袭,腾讯专家助你赛场争先!

    ​ 自4月30日初赛开赛以来,各大技术达人纷纷在2021腾讯广告算法大赛上尽情展示着自己的技术实力.为了帮助选手们更好的理解赛事赛题,掌握TI-ONE和Angel操作平台的使用方法,提高选手们的参赛体 ...

  2. 【专家有话说】如何用TI-ONE与Angel框架玩转腾讯广告算法大赛?

    2020腾讯广告算法大赛除了在赛题.奖金池.评委阵容上实现了全面升级之外,更是拥有腾讯云智能钛机器学习平台(TI-ONE).腾讯大数据 Angel 深度学习引擎两大机器学习平台强势加持. 为了让选手们 ...

  3. 2020腾讯广告算法大赛十强名单出炉!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale推荐 2020年腾讯广告算法大赛 - 决赛答辩 经过近3个月的激烈角逐,202 ...

  4. 百万奖池,鹅厂offer,2020腾讯广告算法大赛等你来战!

    允中 发自 凹非寺  量子位 编辑 | 公众号 QbitAI 2020腾讯广告算法大赛再度起航,即日起至5月31日,赛事正式面向全社会启动线上招募,一场算法之间的"巅峰对决"即将上 ...

  5. 最强战队出炉,2020腾讯广告算法大赛圆满落幕

    8月3日,2020腾讯广告算法大赛决赛在深圳腾讯滨海大厦顺利举行. 十强战队集结腾讯,花式解密"逆算"难题. 腾讯广告副总裁蒋杰.微众银行首席AI官杨强.科大讯飞副总裁刘鹏.腾讯数 ...

  6. 腾讯广告算法大赛高分秘籍来袭!大咖直播详解TI-ONE与Angel框架

    2020腾讯广告算法大赛自开赛以来,已经吸引了近两万名技术人才关注.目前算法大赛已进入初赛阶段,针对参赛选手的真实问题反馈,为提升选手的赛事体验,特开启腾讯广告算法大赛系列直播课程,邀请大咖在线答疑解 ...

  7. 冠军奖金50万,2020腾讯广告算法大赛广发“英雄帖”

    由腾讯广告主办,腾讯云.腾讯大数据.腾讯招聘及腾讯高校合作等合作伙伴联袂举办的2020腾讯广告算法大赛现已启动,5月31日前皆可报名参加! 百万奖金池重磅加码,"逆算"赛题趣味竞技 ...

  8. 腾讯广告算法大赛已启动,逆向算法,等你来战

    2020年 腾讯广告算法大赛广撒"英雄帖" 面向全社会召集技术人前来一"战"! 腾讯广告算法大赛步入第四年 已经为来自海内外的企业和研究人员 提供了富有研究价值 ...

  9. 官宣,重量级评委团强势加持腾讯广告算法大赛

    ​ 自2017年开展首届以来,腾讯广告算法大赛已成功举办四届,随着赛事影响力的不断扩大,腾讯广告算法大赛已然成为全球最受瞩目的算法竞技赛事之一.2021年腾讯广告算法大赛更是与国际顶会ACM Mult ...

最新文章

  1. 再见了,公司的“烂系统”
  2. tomcat5配置常见数据库连接池的例子.
  3. json解析详解 java_Java解析Json数据的两种方式详解
  4. VTK:彩色海拔地图用法实战
  5. 一起谈.NET技术,从.NET中委托写法的演变谈开去(中):Lambda表达式及其优势...
  6. 优先级队列,代码参考范例
  7. LeetCode 2090. 半径为 k 的子数组平均值(滑窗)
  8. Android单元测试研究与实践
  9. HTTP的长连接和短连接
  10. 【keras】数据增强之---ImageDataGenerator
  11. poj 2356 Find a multiple
  12. 51单片机模拟交通灯c语言程序,51单片机protues仿真——LED模拟交通灯
  13. 主编编辑器怎么把文章转成长图?
  14. Gym - 101808K Another Shortest Path Problem (Damascus University Collegiate)【并查集+LCA】
  15. 计算机共享文件夹不要用户名密码怎么设置,Win7电脑怎么设置不用密码也能访问共享文件?...
  16. js重力感应小球游戏
  17. 为什么毕业后五年,你们的贫富差距越拉越大
  18. 数学建模MathType输入平方的三种模式
  19. Win7系统彻底删除打印机驱动
  20. C. Hilbert's Hotel

热门文章

  1. 周小川:数字人民币不会取代美元 也不会威胁全球货币体系
  2. SAP License:WBS结果分析
  3. SAP License:瞎搞!你真的懂什么是ERP、中台和低代码吗?
  4. 谈谈疑似中介规则策略
  5. 固定权重 关于Mxnet的一些基础知识理解(1)
  6. 【转载】关于Python脚本开头两行的:#!/usr/bin/python和# -*- coding: utf-8 -*-的作用 – 指定文件编码类型...
  7. Jetty与Tomcat的区别 转
  8. 解决 phpmyadmin #2002 无法登录 MySQL 服务器
  9. Could not find artifact com.sun:tools:jar:1.5.0
  10. 使用C#创建Windows服务 并发布Windows 服务