1

最近各种大促特别多,各家电商都在摩拳擦掌准备好好在年底收获一把。

各种APP的促销推送和商品推荐也是昼夜不停,要让大家把手留下,干干净净过个好年。

这么看来,最大的受害者就是老家等着要压岁钱的熊孩子们了。

他们不仅要不到钱,可能还要被双手空空的长辈们反向撸羊毛,小小的年纪就要承受命运的重拳。

说到APP推送以及商品推荐,很多人都有一个恐慌性的顾虑。

那就是怀疑自己的APP在对自己录音。

经常出现一个状况是,自己和人谈论一个事物,然后不久后,自己在购物APP或者搜索引擎或者浏览器或者APP的广告业中就看到了相关的广告,让人非常恐慌,觉得有一双神秘的眼睛在看着自己,非常害怕。

怎么说呢,我觉得大家的想象力过于丰富了,这种猜测是合理的,只不过既对也不对。

对的是,我们的生活确实是被各种精准推送给占据了,各大APP也确实有一定程度上的【猜测】行为,目的也的确是让你掏钱。

错的是,没人给你录音。

实际上科技和大数据发展到现在这个程度,录音属于非常没有效率的玩法,音速不够快。

我们高科技镰刀,都是光速的。

2

为什么说没有公司用录音来做信息采集和广告推送呢?

不是说公司良心发现,商业公司有良心其实本身就是一件很诡异的事情。

而是任何事情都要讲一个目的,广告推送的目的是要追求转化率,要让自己的利益最大化,成本最低,卖家也是要看性价比的。

从方案成本收益的角度,录音属于效率低,利润低,误差率高,成本高的沙雕方案,所以没人做。

那些大胆尝试录音方案的朋克们,大部分都是投入产出失衡后破产了,所以你很少见到市面上有完整商业录音解析方案,当然安防另算,安防对于投入产出的理解和商业不同。

想想看,如果你要做录音方案,首先你绕不过的就是APP资源占用,持续的录音,对于一个APP而言是很大的负载,导致的结果就是APP运转效率低下,耗电发热大幅增加,跑起来和吃了翔一样别扭。

而且吧,录下来的音频你要怎么保留?本地保留?这个音频文件会大到超乎想象,一个APP到录音录一天,最后录音文件几个G,而且有朋克的用户,直接看你源文件夹,一旦发现录音,你可以等待铁拳打击了。

在线传输?用户的流量是要钱的,而且用户定期看手机流量记录的时候,发现就你一个APP耗流量特别大,还不是视频类或者游戏类APP,分分钟就暴露了。

本地直接解析?只留存文字?这倒是可行,但是最大的问题在于,你要小心竞争对手反编译你的安装包,一旦被人看到相关代码和模型,底裤都没有了。

实际上很少有互联网公司把复杂模型布置在本地,因为太容易被对手直接破译;

而如果用云模型的方式做录音解析,流量消耗和网络稳定性也会让准确度大大降低。

从技术上,录音是不太合理的方案,不是说不能做,而是做起来成本高,破事儿多。

与道德无关。

3

录音如果仅仅是破事儿多就算了,一个东西如果好用,破事儿多其实并不是很大的问题。

痛并快乐也是一种生活。

但录音方案最致命的问题在于,消耗了大量资源后,准确率过于辣鸡。

俗称吃的是肉,产的是屎。

想想看,如果你手上的APP使用了录音监控方案,那么面临的第一个问题是,需要分辨到底是谁在讲话?是不是手机的主人在讲话?声源就是一个大问题。

试想我走过你的身边,大喊一声我爱杰士邦,然后你打开手机,看到了杰士邦的广告,你觉得是不是非常沙雕?你会不会是得觉得我在性骚扰你?

当解决了录谁的音的问题(声纹类方案)后,你会遇到第二个问题,需要识别语言准确度问题。

我们所处的日常环境是非常嘈杂的,会有大量的杂音,而且很多人的普通话并不标准,机器没法有效识别,实际上绝大多数方言,机器都无能为力,识别出来各种沙雕。

尤其是温州话,那是恶魔的语言,战争年代可以当密码用的神奇语言。

假如解决了语言准确度问题,那么还有第三个问题,那就是音频实时语义识别问题。

这个问题在当前属于几乎无解的难题,所有人工智能遇到音频实时语义识别都容易变成智障。

注意,我说的语义识别不是所谓的把你讲的话翻译成文字,那个东西难度不大,我说的是,真正理解你语言中的含义。

例如死鬼这个词,男人跟女人说,男人跟男人说,女人跟男人说,男人跟死对头说,都是完全不同的含义,但都是死鬼。

人类理解语意是要结合具体场景,甚至具体说话的人(同一个词,不同人讲出来都不是一个意思),这些都是现阶段机器做不到的。

别说机器做不到,很多人都做不到,例如:弹性工作制=别想着准点下班,这谁遭得住。

尤其是APP录音,需要快速记录下人们在实际生活中的快速出现的场景未知的对话对象未知的普通话不标准的神奇对话,还要记录分析下来,还要精准获得含义。

要是真有哪个公司有这个本事,还做个屁推送,直接就诺贝尔奖了。

以上三问,我喜欢称之为录音方案灵魂三问,在三问之上,还有终极一问。

记得我前面说做录音方案的大部分都破产了么,那还有小部分,那小部分去哪里了?

小部分因为收集隐私被抓进去了,彻底财务自由了,毕竟监狱不用花钱。

闭上眼,用心去感受正义的力量,奥利给。

4

当你读到这里的时候,你肯定既恍然大悟,又迷惑。

恍然大悟的是觉得确实不会被录音,迷惑的是那为什么出现了我说什么,不就之后APP就出现了相关推送?

我给你这么说吧,没有公司做录音,不代表没有公司利用声音来收集资料。

只不过这个收集资料的方式不是你以为的大段录音监控,而是通过特定关键词唤醒。

举个例子,假如你用苹果,你会【Hi,Siri】来唤醒siri功能。

假如你用小米,你会【小爱同学】来唤醒收集。

其实很多APP的推送,是用了类似的方案的,就是说,根本不记录你说了什么,也不去分析你说了什么,只要你说出了特定词,那么就会被唤醒,只不过这个唤醒不是亮屏幕之类的,而是推送逻辑被唤醒给你推送相关物品。

再举个栗子,假如是外卖类APP,这种唤醒词库可能包含【奶茶】,【披萨】,【烤串】,【麻辣烫】,【哈密瓜】等等等等等等词,只要你说出了类似的词汇,那么可能就会唤醒推送。

例如OTA类APP,这种唤醒词库可能包含【旅游】,【泰国】,【签证】,【酒店】,【度假】等等词,只要你说了类似的词,那么可能就会唤醒推送。

再例如购物类APP,唤醒词库可能包含【口红】,【靴子】,【裙子】,【水果】,【笔记本】等等等等词,只要你说了类似的词,那么可能就会唤醒推送。

每个APP的词库,可能都有数千乃至数十万的词,基本覆盖了你可能性的消费场景,磨刀霍霍。

很多很神奇的功能,拆穿了也就那样,就和魔术一样。

一个唤醒脚本+词库的事情,给搞的那么神秘。

挺魔幻的。

5

虽然词库唤醒逻辑是比较切合实际的方案,但是在实际的信息收集中,有更多更主流和有效的信息让商家们知道你是谁,要怎么卖东西给你。

这些你忽略的东西,才是真的关键,我随便提2个简单的。

第一个是输入法。

谁知道你的一切?当然是输入法了。

别总是怀疑什么APP监控你的聊天记录,你首先要怀疑的是,你的输入法有没有卖你。

只要你打字,你一定躲不过的就是输入法,你输入了什么内容,在什么地方输入(搜索引擎?社交软件?地图?短信?卖家讨价还价?),这对于输入法都是透明的。

而且你经常输入哪些词,代表了什么意思,并不难获得或者分析,上面说的语义分析难是真对纯音频的,纯文本的语意分析可是相对成熟的技术。

另外所有输入法都是越用越好用,越用越懂你,那么,到底是怎么懂你的?

可以思考下。

第二个是推送SDK。

什么叫SDK?你可以理解为是软件包,嵌入APP中执行特定功能的特定模块。

最流行的SDK是推送类SDK,就是你手机收到的各类APP推送消息,是有专门的公司做成SDK嵌入到各大APP里,然后专门负责推送,比自己开发要好用很多,而且专业SDK往往对于各类手机和应用的适配做的很好,所以一般APP都是外采推送SDK的。

你手机上30个APP,可能都是同一家公司提供的推送SDK,那么对这家公司而言,你的手机基本是透明的,而且很显然会知道一台手机到底装了哪些APP,用户到底常用什么APP,甚至用户对于手机的应用轨迹,应用行为。

这些行为就可以被做成标签,然后打包交易,这个市场目前很成熟。

国内推送SDK的巨头,不超过5家(最大的就3家),对外出售标签数据都挺积极的。

你看,当你知道输入法和SDK的时候,你对于世界的认知会发生变化。

当你收到广告的时候,你甚至可以去分析到底是哪个卖了你。

是搜索引擎还是你在搜索引擎时候用的输入法,还是监控你手机APP活跃度的SDK,还是你的一些语言出发了词库?

很多人其实被卖的时候都不知道自己是怎么被卖的。

猜谁卖你这个事情其实很有意思,只稍微有点黑色幽默。

6

本文只是简单科普一下录音的谣言以及最基础的信息收集渠道,很多更隐蔽甚至更有想象力通过逻辑勾稽来做用户画像的方法还没有说,主要是真的说起来可以写本书了,书名叫《作者已被各大公司吊起来打》。

数据收集,画像制作以及广告推送的技术以及产品逻辑,这些东西其实也不是什么秘密,甚至有专门探讨广告推送逻辑原理乃至策略的技术书籍。

这是一个严肃的科学,高科技韭菜学。

我认可技术无罪,但是我同时也认为技术需要约束,或者说技术背后的人,需要被约束。

在这个人人都近乎透明的年代,我们其实需要对所谓大数据加以警惕,也需要法律约束。

因为数据可以让生活变得更方便的同时,失控后也会造成灾难。

当我知道你的一切数据的时候,某种程度上,我比你还了解你,我就是你。

所以需要约束人的行为,所以需要增加作恶的成本。

毕竟人,是复杂的;人性,是自私的。

我不希望有一天,我们成为大数据下的棋子。

被设计好的世界,恐怕也不再有趣。

- MORE | 更多精彩文章 -

  • 热乎的面经:为了拿到字节跳动offer,鬼知道我经历了啥...

  • C++之父:比特币是用C++开发的,我为此感到遗憾。

  • 网传"梅姨"照片竟然是电脑合成的!仅需 100 行代码,你也能做到!

  • GitHub 长期被中国人“霸榜”?看完榜单我呆了...

如果你喜欢本文,

请长按二维码,关注 Hollis.

转发至朋友圈,是对我最大的支持。

好文章,我在看❤️

刚跟朋友说完想买啥,某宝就给我推荐是咋回事?相关推荐

  1. 2999元起?一加8系列外观配置价格全曝光:看完想买!

    近日,一加方面发布预告宣布,他们在CES 2020期间在拉斯维加斯将有场特别活动,不出意外的话一加将在CES 2020旗舰推出全新的一加8系列机型,可能是其中一款,也可能是全系列机型.随着发布时间的临 ...

  2. 题目95:百鸡问题:一只公鸡值5元,一只母鸡值3元,而1元可买3只小鸡,用百元买百鸡。现有n元钱,想买n只鸡。问有多少种买法?(钱要用完)

    题目转载:http://python.wzms.com/s/1/85 题目描述: 百鸡问题:一只公鸡值5元, 一只母鸡值3元,而1元可买3只小鸡,用百元买百鸡. 现有n元钱,想买n只鸡. 问有多少种买 ...

  3. 题目54:百钱百鸡 一只公鸡值5元,一只母鸡值3元,而1元可买3只小鸡,用百元买百鸡。现有n元钱,想买n只鸡。问有多少种买法?(钱要用完)

    题目转载:http://python.wzms.com/s/1/50 题目描述: 百鸡问题:一只公鸡值5元, 一只母鸡值3元,而1元可买3只小鸡,用百元买百鸡. 现有n元钱,想买n只鸡. 问有多少种买 ...

  4. 运动耳机哪家强?运动耳机排行榜有你想买的品牌吗?

    不知道大家近期有没有关注,2022年11月运动耳机排行榜刚刚火热出炉,很多新的运动耳机品牌登上了排行榜.在下文中我会位大家介绍几款排行榜上排名靠前,公认音质好的运动耳机品牌. 可能有些人对运动耳机还没 ...

  5. 厦门java工资水平2018_8290元!厦门最新平均工资出炉!看完想跳槽......

    原标题:8290元!厦门最新平均工资出炉!看完想跳槽...... 一周又过去了,7月又要结束了 年初制定的目标实现的怎么样了? 你脱单了没? 你脱脂了没? 你脱贫了没? 再告诉你们一个心塞的消息 &l ...

  6. 看到1元保险就想买?小心被割韭菜!

    前不久,有个朋友在公众号后台和学姐倾诉这样一件事: 他在某平台花1块钱买了一份保险,结果第二个月自动扣了344元,他才知道那份保险只是首月1元- 后来他想办法进了他们的保险群求助后,有别的小伙伴好心提 ...

  7. 学计算机买宏基好吗,想买轻薄笔记本,宏碁蜂鸟是不错的选择

    想买轻薄笔记本,宏碁蜂鸟是不错的选择 2020-10-06 10:21:11 15点赞 5收藏 11评论 提起轻薄本许多人会想到Apple MacBook Air,毕竟是乔帮主首次将能装载牛皮纸信封的 ...

  8. 想买车的注意啦!一针见血,点评100多款在产汽车

    想买车的注意啦!!!!!一针见血,点评100多款在产汽车来源: 刘志伟的日志 大众系列:      上汽大众:依靠桑塔纳赚了很多钱,但是这是他们应得的报酬,不要忘记,改革开放后我国与其他品牌谈合资时, ...

  9. 程序员:我只想买件没有格子的衬衫,怎么就这么难?

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 说到程序员着装,大家会想到什么? 自然是格子衬衫了. 但一个外国程序员,终于对此厌倦,他不想再穿格子衬衫或条纹衬衫,于是他打开了亚马逊网站 ...

最新文章

  1. 数据安全最佳实践案例库建设项目案例征集
  2. webpack+vue搭建基础
  3. ubuntu 10.0.4安装小企鹅(Fcitx)输入法
  4. Windows Live Messenger 8.5 抢先试用
  5. cakephp视图用php文件,CakePHP - 扩展视图( Extending Views)
  6. Spring mvc参数类型转换
  7. 《趣学CCNA——路由与交换》一2.3 网络层协议概述
  8. 后台审核管理 ergo_Kogito,ergo规则:从知识到服务,轻松自如
  9. 草稿-xpath了解-python 操作xpath小例子
  10. java hashmap getitem_java中HashMap使用
  11. oracle实例名,数据库名,服务名等概念差别与联系
  12. 蓝桥杯 ALGO-52 算法训练 排列问题
  13. Idea不能显示类的继承关系,pom文件的右键属性中也没有Diagrams选项(已解决)
  14. 2060. 奶牛选美
  15. 一个完整的物联网项目管理流程
  16. 软媒魔方6.13正式版:软件管家开启多线程极速下载
  17. 黑苹果电池电量补丁_修改DSDT实现电量显示方法【转载】
  18. 计算机技术在风景园林中的应用和选择,现代信息技术在风景园林中的应用
  19. 怎么获取大量新鲜可用的迅雷白金会员账号!?
  20. 空间三点确定圆心坐标及半径

热门文章

  1. Windows下,Python导入rarfile后使用open、extractall报错cannot find work tool 或Unrar not installed?
  2. ios13怎么打开科学计算机,Apple支援:iOS 13 分屏如何操作?iOS 13 分屏显示在哪设置开启?...
  3. php r n没有换行,php r n 不换行怎么办
  4. 微信公众号图文编辑志愿岗位申请
  5. 计算机地球一小时word处理,地球一小时策划案
  6. 轻量而敏捷的工业组态软件UI设计工具-机械组态篇
  7. linux英伟达显卡内核不匹配,Linux 5.11内核将支持英伟达RTX 30系显卡
  8. 【角点检测】 基于各向异性高斯方向导数滤波器实现图像角点检测附matlab代码
  9. MVC通过PartialView部分加载刷新页面
  10. 贵州大数据产业集聚区再添引擎