本文原创:纷析咨询高级分析师 张依侬

你是否遇见过一些奇特的情形。例如,刚刚研究了某个产品,这个企业的销售就打电话到你的手机;或者,中午聚餐的时候跟朋友们提起某个你感兴趣的东西,下午在信息流广告上就看到类似产品的推销。

这样的广告已经不仅仅是在为我们带来方便。它们更让我们“毛骨悚然”。我们很容易认为,我们很私密的行为,甚至对话,被窃取并被别有用心的商家作为“搞定”我们的武器。

这类广告的背后是否真的是我们的个人信息的泄漏,尤其是我们本该不让任何第三方知晓的信息发生了泄漏。还是真的是巧合?

这篇文章,对六个常见的“信息窃取”用于广告投放的场景进行分析,以还原客观事实。

为什么刚退出一个教育网站,立马接到课程培训的电话?

你使用手机搜索了“成人教育”进入网站,浏览后没有留下信息直接退出网站。但,没几分钟,就接到教育培训课程的推销电话。或者是刚看了房价走势信息,立马接到推销最新楼盘的电话。

这种点击网页,手机号瞬间被抓取的技术有个高大上的名称:手机访客营销。

目前网上有很多提供此类服务的工具,按单条手机号码或包月的形式收费。付款安装代码后,会给你一个后台。当有访客点击网站后,会立马获取用户的信息。如下图所示,除了电话号码,包括搜索词等信息都可以知道。

图片来自网络

其实,是因为这些网站被植入恶意代码,当用户访问网站时,信息会被窃取。整个过程,用户是全然不知的。具体如下图所示:

上图中,我们注意到手机号泄露的一个关键点,就是“请求运营数据接口读取手机号”。首先,被泄露的手机号码的用户一般是在非wifi环境下访问网站时发生的。用户使用手机流量访问网页时,手机号会包含在通信字段中,正常情况下电信运营商是对此字段加密的。很可能是不法分子,掌握了加密技术,从而破解加密的手机号码;更有可能是,电信运营商的手机查询接口被第三方滥用。提供手机访客营销的服务平台,都表示自己拥有电信运营商的接口,不同商家拥有的接口也不同。例如,A家说自己有移动的接口,B家的说有电信和联通的。

除了可以获取自身网站访客的手机号码外,没有加密传输的http网站、app等也都可以抓取。不同的是,别人的网站需要系统建模,返回号码的时间无法实时(大概需要7天)且收费比较高。

现在这个情况已经被运营商意识到,因此已经减少很多了。但是,仍然还有网站在这么做,命真的不是一般的硬。

谁在偷窥我?在京东上看的东西,又出现在抖音上!

上午,你在京东上搜索蓝牙音箱,浏览一番就退出了。晚上,躺在床上刷抖音时,刚好给你推荐音箱,甚至连型号都一模一样。这场景,对投放人员来说并不陌生,但对普通用户来说却感觉不适。甚至怀疑是抖音窃取用户信息。

图片来自微博

背后到底是道德的沦丧,还是人性的扭曲?其实都不是,这个是通过程序化广告来实现的。

首先,无论是京东还是抖音,各个平台都会根据用户基本信息、用户兴趣和用户行为等给用户设置标签。当你在京东上搜索和浏览商品,都被标签记录下来。

后续,你在刷抖音时,此时要给你推送广告;抖音发出”通知“,包含你的行为信息和设备唯一识别号,有意向像你展示广告的都可以竞拍这个展示机会。京东通过唯一识别号,发现你就是那个刚看过蓝牙音箱人,通过ADX系统拍下这个广告位。然后,就出现了上述的情景:你又看到了这个音箱的广告。

这种广告形式在今天的中国乃至全世界都非常常见。这种广告利用你的数据是否合法呢?

是否合法一般取决于你在注册使用抖音或者京东或者其他任何app时签订的“隐私协议”。如果这个协议中明确提及将收集你的个人信息用于广告的投放等,并且你点击同意,那么这种广告形式并不违法。

但如果没有这样的同意,情况可能会不同,不过,我们国家针对性的相关法规还没有出现,因此,在没有用户授权同意下使用他们的设备唯一识别号,也就是设备ID进行广告定位,是否违规存在很大争议。由于在这个过程中,使用的并没有包含一个人的实名信息(主要是他的电话号码和姓名住址等),而只是利用了他的设备ID,因此,并不能简单认为,这是获取了个人的隐私——广告投放相关方并不真的知道这个人具体是谁。因此,最终是否违规违法,需要国家最终解释。

巧合?打开今日头条,为什么会看到上午逛过的4S店的广告?

当你打开今日头条,优酷时,发现都推送了今天去过的4S店的广告。这真的只是一个巧合吗?甚至不只是推送广告,有些电话甚至打到你的手机上,问你是否对某某品牌的汽车感兴趣,这个品牌正是你逛4S店的品牌。

其实,问题是发生在那家4S店,有人(并不一定是4S店的人,有可能4S店自己都不知道)利用WiFi探针(如下图)收集你的数据并进行了广告投放

图片来自网络

上图可以看到,这些wifi探针并不贵,而且体积很小,塞入一个随身包中完全没有问题。因此,如果有人偷偷用一个小设备在4S店收集来往顾客的信息,这种可能性完全存在,并且4S店也很可能毫不知情。

当然,这并不意味着4S店就能摆脱嫌疑。

在已经被“植入”WiFi探针的商城或商店,用户进入探针信号覆盖区域且WiFi设备是开启状态的,它就会获取设备的MAC地址。此时,仅仅是获取MAC地址的话,还是无法知道你是谁。只有,MAC地址与电信运营商或者是拥有用户画像的数据公司合作,就能清楚了解你是谁。经过多次换代升级的WiFi探针已经可以收集分析如客户性别、消费水平、收入情况、购物偏好、生活轨迹等信息。

而这些数据,应用场景也十分丰富。除了上述可以用于广告投放,也会用来实体店铺新老客户的精准服务。

图片来自网络

甚至,有一些第三方数据公司,它们提供将MAC地址转变为手机的device ID(设备ID),甚至进一步转变为电话号码的能力。因此,你收到询问是否你考虑购买某某品牌汽车的电话,很可能就是通过这样的方式泄漏的。

你一定会问这种方式是否合法。事实上,在被央视的3·15晚会曝光前,这种方式大行其道,但被央视曝光之后,这一方法显然被划定为非常不合理的用户数据收集行为。

但是否合法呢?从目前的法律看,将MAC地址转为电话号码而不征得消费者的同意是非法的,如果买卖或者利用了这些电话号码更是非常严重的侵权违法行为。而直接收集MAC地址,尽管在该文行文时尚没有明确的成文法律提及MAC地址(除了国标35273,但国标并不是成文法),但也普遍认为,没有经过用户的同意,该用户的MAC地址不能够被采集。

聊天被监控?微信聊天提到日本旅行,就在朋友圈看到日本樱花游的广告。

之前,有不少人反应自己的微信聊天内容与公众号和朋友圈推送的广告一样。上一秒,刚提到想去日本玩,下一秒就在朋友圈刷到日本樱花游的广告。很多人怀疑是不是微信在监控聊天内容,再依据内容推送广告。

对此微信团队表示:微信不会监测用户的聊天记录。出现这种情况的原因是一方面是腾讯广告投放的人群广,且是基于用户点击行为呈现;第二是,当时属于旅行旺季,存在个别巧合。

微信确实是不太可能会监测你的聊天记录,并非技术问题,而是对它来说弊远大于利。但输入法却有可能泄露你的信息。输入法不仅可以监控你的输入,还可以直接读取你的剪贴板,甚至监控你的键盘轨迹。这样,你打出但又删除的内容,一样可以获取。

在今年的315晚会上,就有点名璧合科技借助讯飞输入法的数据,判断用户的性别年龄等个人信息。甚至,知道用户正在搜索什么,依此精准标记出高质量的人群属性标签。用于电销和精准广告投放。

输入法这么做是否是合法的?由于输入法并不一定直接利用了你的实名信息,而可能只是通过设备ID或者其他比较匿名化的“假名信息”来定位你,因此这一情形是否属于非法目前有很多争议,因为在本文撰写时,互联网业界仍在等待国家立法靴子的落地。在具体法律落地之后,这些数据如果没有经过用户的明确授权同意而被采用,肯定是不合法的。

饿了么在偷听我的聊天?和同事说想喝奶茶,打开饿了么就看见推荐奶茶!

有不少网友抱怨,怀疑饿了么和美团等外卖APP偷听自己的聊天内容。和同事闲聊说想喝奶茶,结果打开饿了么上推荐商家首位,就出现奶茶的信息。

首先,APP通过监听来实现精准广告推送,在技术上是可以实现的。但成本高、效率低、风险高,这个不划算的生意平台是不会做的。同时还存在诸多问题,例如:

  1. 录音功能会消耗巨大的手机资源,APP会运行缓慢甚至卡顿;

  2. 录音文件占据大量的存储空间,用户不可能发现不了;

  3. 录音文件如果是实时上传,会消耗流量,用户也是会发现的;

  4. 录音数据本身有效的数据价值低,存在很多噪声,不够精准;

  5. 目前语义分析技术还不能完全理解人类语音,特别是方言;

综上所述,即使能解决上述的问题,通过录音来推送广告还是一件低收益且违法的行为。

回到上面的场景,饿了么是如何实现广告推送的呢?和微信聊天推送的情况相似,可能是巧合。但这个巧合是有一定数据依据基础的,因为要清楚我们在网上基本上是裸奔的状态;各类APP都通过我们的注册信息、搜索信息、浏览记录和社交关系,标记我们是谁以及与我们相似的人群的购买偏好。

“您好,我是XXX金融,您是不是需要贷款”

大家是不是也经常接听到陌生的推销电话,他们能知道你的性别、和最近的需求。但是,令人疑惑的是,我们没有在网上留下电话,他们怎么知道的一清二楚呢?

这种情形,很可能是用户个人信息被黑市出售。

用户信息从哪里来?主要是下面几种:

  1. 各类APP过度索取授权,背后大量的用户数据;

  2. 不法分子假借APP为由,暗中收集买卖用户数据;

  3. 平台或运营商内鬼泄露用户数据;

  4. 黑客攻击盗取用户数据。

被买卖的用户数据包括:性别、学历、收入、电话(现在不会直接给号码,会给拨打的接口)、兴趣爱好和购买偏好、有的身份证等信息都在售卖的范围内。被买卖的数据其中就有被用在精准营销。特别是金融借贷、房地产和医疗保健等行业,是主要的需求方。

以一个超利贷的用户为例,一般他们会同时在多个app进行贷款。所以,一旦知道他借了超利贷,马上打电话让他来自己平台借款,是一个非常有效的获客方式。而且这些用户一般被反复售卖,这也就是你会频繁接到许多家借贷平台的电话的原因。

这种场景下,如果没有得到用户的授权可以将他的相关信息转移给第三方,那么上面的所有行为,是严重违反了现行的中国法律,例如违法了中华人民共和国《网络安全法》。已经有人因为违反该法律买卖个人信息被追究法律责任。

小结

上面的六种情况,可能你遇到过其中的一种或者多种。事实上,你也能发现,大部分的情形是普通人无法避免的,只要你用app,或者你去了某个地方浑然不知道那里有wifi探针,你的相关信息都可能被用在广告上。

这一情况不仅仅在中国,在全球都正发生。相信在我们发布这篇文章之后的很短时间内,我们国家就将出台更清晰明确的法律,进一步界定我们上面所提到的暂时还没有明确界定的情形。

「 更多干货,更多收获 」

推荐系统教程之九:解密“看了又看”和“买了又买”(Item-Based)

每天超50亿推广流量、3亿商品展现,阿里妈妈的推荐技术有多牛?

feed流设计:那些谋杀你时间的APP

一名女大学生的反思:深度揭露大学最露骨生活!

全面揭秘快手和抖音的内容推荐算法

今日头条推荐系统原理

feed流设计:那些谋杀你时间的APP

如何搭建一套个性化推荐系统

从零开始搭建创业公司后台技术栈

关注我们

智能推荐

个性化推荐技术与产品社区

长按并识别关注

一个「在看」,一段时光!?

你的个人信息真的被偷走了?——那些过分“精准”的广告推荐的背后相关推荐

  1. 电子科技大学信息与软件工程学院考研初试时间规划和用书推荐

    背景 上个月底,电子科大软件学院的复试结果出来,笔者幸运地被录取为学硕.这两天心情平复下来后,趁着单位也没什么事儿,就想结合自己的考研经历,向后来考研人推荐一下初试的时间规划和复习用书,一家之言,仅供 ...

  2. 因特网人群信息的应用-通过人群性格特点投放定制广告

    Psychological targeting as an effective approach to digital mass persuasion 如果广告内容-劝说手段(persuasive a ...

  3. 速卖通排序规则,优化产品信息,让店铺引流更精准

    在速卖通开网店,流量是最关键的,这也是很多速卖通卖家做网店最关心的方面.那么,速卖通的流量搜索规则是什么呢,怎么把产品发布到网店上面能获得尽量多的流量呢,下面博主为各位卖家朋友做个分享. 其实,速卖通 ...

  4. cpc卡内计费信息异常包括_抖音CPC是什么?广告的优势在哪?抖音CPC广告转化率高吗?...

    抖音广告如何收费呢?这也许是每个想要在抖音平台投放广告的广告主都想知道的答案.抖音支持CPC.CPM以及CPA等多种广告计费方式,其中CPC是最常见,也是最多人选择的计费方式,让我们了解CPC. 一. ...

  5. 机器人演唱邓丽君是真的吗_“骗”了我们51年的邓丽君,背后不为人知的一面...

    众香国里失春色,东风无处觅芳魂. 自君拂袖归仙去,期君唯有梦中寻. 在万千少男的心中,心灵深处都会住着一个邓丽君. 她就像上天赋予我们的礼物一般,长相甜美,声音也异常甜美柔和,身上自始至终都带着一股& ...

  6. 王者荣耀如何修改服务器信息,王者荣耀定位怎么更改设置 修改定位方法推荐...

    王者荣耀定位是决定我们的荣耀战区的,所以有些玩家小伙伴还是比较看重的!那么现在小编要给你们推荐带来的就是王者荣耀定位怎么更改设置的攻略,小伙伴们想知道那就一起来看一下吧! 最近火热版本:王者荣耀云游戏 ...

  7. 苹果微信点开才会收到信息_苹果手机这些无用的功能关掉,续航大增

    苹果手机的功能非常繁多,但是并非所有功能都是我们日常需要用到,这里以最新的iOS 14为例,说说觉得可以关掉的几个功能.在设置的信息选项中,可以看到一个iMessage信息功能,它可以理解成是一种网络 ...

  8. 协作机器人 ai算法_如果我们希望人工智能为我们服务而不是不利于我们,我们需要协作设计...

    协作机器人 ai算法 by Mariya Yao 姚iya(Mariya Yao) 如果我们希望人工智能为我们服务而不是不利于我们,我们需要协作设计 (If we want AI to work fo ...

  9. 入职Facebook四年了!

    今天给大家分享一位大佬在Facebook担任ML Engineer四年的工作总结与感悟,目前已去CMU继续攻读AI phd,国外与国内虽然工作环境不同,但很多工作方法与思考都是可以互相学习的,以下为原 ...

最新文章

  1. C语言常用算法 脚本之家,C/C++常用算法手册 秦姣华 中文pdf扫描版 22.5MB
  2. 浪潮存储linux登录密码,登录存储系统CLI管理界面(用户名+密码)
  3. Spring学习总结(2)——Spring的常用注解
  4. matlab 除噪点,MATLAB应用在基于噪声检测的图像均值去噪法
  5. 初试Ajax.Net !
  6. 绕过网关访问图片上传并解决跨域问题
  7. BugkuCTF-Reverse题NoString
  8. JAVA中的那些名词解释
  9. Qt 5.14 稳定版发布,带来更好的 HiDPI 支持和改进 3D 模块
  10. 惠普电脑怎么用access_学习如何使用access帮助系统
  11. AliSQL-5.6.32编译安装
  12. C#使用AForge连接摄像头并且拍照
  13. 手机输入法,谁能笑到最后?
  14. java加密文件夹_怎样用JAVA给文件夹加密,拜求各位大侠!
  15. MapReduce之Map join操作
  16. html鼠标键弹起事件,js鼠标按键事件和键盘按键事件用法实例汇总
  17. Python re模块 —— 从零基础开始入门正则表达式
  18. Java制作简单小画板
  19. 记一次服务器被攻击经历
  20. 提醒大家有关越狱组it学院vip会员有猫腻,要小心。。。

热门文章

  1. ChaiNext:市场情绪对行情影响开始减弱
  2. 丹麦红十字会与多家公司合作推出区块链支持的灾难债券
  3. Mina Protocol将主网候选版本发布时间延后一小时至3月17日8点
  4. TokenInsight:BTC新增流量稳定,但泡沫指数已超17年峰值
  5. SAP License:与猎头的亲密接触之你不得不知的潜规则
  6. 记-ItextPDF+freemaker 生成PDF文件---导致服务宕机
  7. 【AC军团周报(第一周)第一篇】线段树从入门到入土【1】
  8. PE知识复习之PE的各种头属性解析
  9. 结构体,宏,枚举,函数,指针
  10. 在webstorm中新建模板