戳蓝字“CSDN云计算”关注我们哦!


作者: 刘丹

 

我们通过卖东西收集数据,数据是阿里最值钱的财富。

——马云

春天万物复苏,沉睡了一个冬季的爱美之心呼之欲出,连衣裙在姑娘的心里发了芽,不过这次有些意外,它竟然在热搜里先火了一把。

最近,网上掀起了一个关于“连衣裙客单价低于128”的讨论,竟然有人说具备这种特征的女孩不适合用来当女朋友。连衣裙客单价低于128是什么梗?“连衣裙客单价”是在淘宝搜索“连衣裙”弹出的衣服单价,这是淘宝针对消费者的消费水平做出的“特殊定制”。而一个女生的“连衣裙客单价低于128”,则意味着她搜索的连衣裙价格都低于128元,间接反映了她消费水平低。

其实,这句话最早出现于某知名财经博主,于2019年2月24日中午发布的一条微博,指出“连衣裙客单价低于128”是爱计较的女生的特征之一,原文如下:在我们电商行业,找女朋友有一条不为人知的铁律。不能找淘宝好评率低于98%,滴滴低于4.8,搜索核心词连衣裙,客单低于128的。以上三条同时满足的人,难伺候。

如此扎心的搜索,让不少年轻人纷纷打开淘宝,迫切的试探自己在电商平台究竟占据什么地位,而自己到底是不是所谓的“低价人群”,面对朋友圈疯狂的晒单背后,大数据的落地实际案例再次呼之欲出,那么关于大数据算法的讨论也一度受到业内的关注。

1

账单背后:大数据的力量

 

我们通常会遇到这样的情况,在淘宝京东等电商平台中,当我们搜索一件物品时,系统将会自动推荐同类物品,这是大数据在我们日常生活中最贴近的例子。而在我们购买一件物品时,账单背后,同样离不开大数据的支撑。

账单背后是一组不可小觑的数据,首先,庞大的用户基数,在浩瀚的网络中留下了海量的数据;其次,巨额的交易数据,记录了消费方式的变迁;最后,强大的大数据技术支持,每一笔的数额、时间、交易类型、手段等都被清清楚楚地记录并分析。

通过大数据账单,使得购物数据可以较为清楚的展示消费能力与偏好、理财数据展示财力、缴费还款数据展示信用价值。更值得探究的是,当我们的行为被大数据所记录的同时,大数据账单也同样影响着我们的消费习惯与生活习惯,比如当系统经常推荐我们低价或者高价的物品时,我们也会不自觉得跟着数据作为;在比如当年度账单统计出来时,我们迫不及待的宣告自己是一个剁手党时,也许下一年你会更加沉浸在“买买买”的痛快之中;再或者当你看到自己超额消费决定摆脱月光族,于是将自己的收入放入金库或进行科学的理财。这一系列被大数据影响的行为,同样是数据带来的魅力。

而更深层次的看待用户账单,我们发现数据不仅可以分析个人的消费能力,同样可以反应全国各地的各种状况,比如,区域经济发展状况、不同社会阶层的经济能力、不同地域的消费习惯与理念。当数据累积到一定程度时,我们甚至可以直接看出哪个群体是投资主流、哪个群体是消费大军、哪里最有钱。当搜索一条连衣裙都可以占据热点话题时,它背后的数据与算法终要见天日。

2

数据背后:社会的焦虑

即使是日常生活中,我们也就能感受到大数据背后的力量。可是,我们再回过头看看“低价人群”这一标签,多么讽刺与无奈,既然有低价人群,那一定就有“高价人群”,从最近朋友圈汹涌的“晒图“浪潮中可见一斑,他们晒出的连衣裙价格不仅高于128元,甚至还会出现上千上万价格的推荐,这无疑不是一种炫富手段,从而彻底找到了自己的存在感和认同感。

那么,淘宝究竟有没有这样的规则,是否给用户打上过这样刺眼的标签呢?对此,淘宝方面表示,根本不存在128元这条线。淘宝负责算法人员解释道,个性化推荐的初衷是满足用户多样化和实时变动的需求。用户的偏好不是静态的,算法难就难在要满足用户多样化场景下的需求,以及购物的差异化需求。“淘宝的系统是建立在大数据、实时计算等复杂技术体系下的AI系统,是对用户多元化、动态需求的理解和预测,不是简单的标签逻辑。”

也就是说,单一的消费数据绝不可能支撑“算法”, 即便为某个个体打上标签也需要多个维度的研究,比如手机号、住址、性别等基础数据,购买类别、客单价、购物频次等消费数据,浏览商品的类别、浏览时长、对于淘宝直播等其他内容的偏好,这些数据,都可以勾勒用户行为,最终描绘出用户画像。

其实,这个热点背后最让人不舒服的其实在于,“连衣裙低于128元的低价人群”被称为难伺候的主儿。那么,好评率长期保持在100%的人群,就是可以当做女朋友的最佳人选了吗?从不差评、从不麻烦客服,这就是一个人可以得意洋洋的地方吗,甘愿放弃维权的机会,笔者认为也可以称为懦弱的表现啊。

的确,有淘宝卖家称一件低于100元的衣服,本身是不怎么赚钱的,但是如果遇到精打细算,反复需要售后的消费者,其消耗的成本,最后这笔交易就真的不赚钱了。算法将用户挑选并分类出来,最后打上标签,好让商家可以对用户进行判断。讽刺的是,“低价人群”通过这次事件,不断地想要提高自己的客单价,而“高价人群”肆无忌惮的炫耀着自己的成绩。大数据给出的逻辑,有时更是野蛮的。在人们不愿被打上“低价人群”标签的同时,同样显示出了大数据背后人们的恐惧与不安。

3

准确or失败 数据预测为什么这么难?

大数据就像是个冰山,浮出水面的只是冰山一角,真正的价值在于水下的巨大部分。挖掘和了解水下的冰山需要反复利用大数据并不断地分析处理以得出有力的结论。

举一个很著名的例子,在美国调查超市里最好卖的馅饼(Pie)是什么?每个人都回答是苹果派。看起来美国人最喜欢苹果派,但通过对大数据的分析,调查人员发现,如果超市改变了馅饼的大小,那样一个家庭就不必为了对方而妥协,选择大部分人能够接受的苹果派,当馅饼变得足够小,小到只够一个人吃的时候,大家才会真正选择自己喜欢吃的,此时,苹果派只能排到第四、第五的位置。

也就是说,有时候大数据给我们的这一冰山一角,在没有更加细致的数据做支撑时,结果往往是不够准确的,就像“128元连衣裙”这个数据一样,当搜索出连衣裙价格真的低于128元,难道真的说明我只配穿低廉价格的衣服,是所谓的“穷人”吗?结论当然不是,毕竟当我想买LV、GUCCI、CHANEL的时候,也不会在淘宝上搜索购买吧。

所以,大数据真的有那么牛吗?大数据最根本之处在于信息收集方式出现了重大变化与革新。大数据的出现与大量信息直接在网络呈现关系非常紧密。微博、天猫、淘宝、微信等等都直接产生了大量包括定位、消息记录、消费记录、评价、阅读等等殊为庞大的信息,可以说互联网企业都自然的带有数据企业的标签。不过如果我们从数据的源头看的更仔细一些,还是会发现,其实很多数据依然是有巨大的采集与归类的需求。

现在人人都说大数据,但其实大家说的是 facebook,twitter等站点上每天产生的信息,而真正有效的数据并不完全在网络上,要依靠原始的方法来收集。从“128元连衣裙”热点背后,我们发现,数据方面还有很多基本层面的问题值得我们去探讨。

4

隐私难界定 大数据也不是万能的

大数据将我们暴露在众目睽睽下,甚至给我们打上了各式各样的标签。在大数据下,隐私难以界定,监管就成了难题。数字时代,人们最关心的就是隐私问题,但是对于隐私的界定仁者见仁,比如当你开车去机场赶飞机,路上交通很堵,这时候地图软件恰如其时的提醒你另一条路更加顺畅,这样的提醒贴心便利,自然受欢迎。但是,假若此时你去的是一个不愿让别人知道的地方,那么同样的情境下,如果地图软件的提醒不仅会暴漏自己的隐私,还会带来极其不爽的体验;再比如,最近你想出去旅游,查阅了很多攻略,随之旅行社推送的度假信息,你是非常接受的。但是如果制药厂商发现你有艾滋病,向你推送艾滋病药,相信没有多少人会接受这样的推送消息。

所以,隐私是分场合的,但厂商很难清楚地知道消费者所处的时间位置等具体情况。数据算法让我们尽享便利与捷径,但随之尴尬有时也会不请自来,而关于隐私泄露更是人们最为在意的一部分,由于很难界定隐私,所以在监管方面,同样考验着监管者与业界的智慧。

综上,大数据技术为人类社会带来了新的机遇,但大数据绝不是万能的,在其价值被认同的同时,也不能被刻意的夸大,当我们盲从于大数据,就容易产生片面错误的分析。首先是结果的不确定,其次是逻辑无规律,最后大数据是对过去已发生的事件进行经验总结,本身不具备创新性。这也就不难理解《流浪地球》预测10亿票房,却飚升到50亿,以及平时购买过LV的消费者,也在网络中搜出来128元连衣裙这样的事情了。所以,大数据为我们的生活带来了巨大变化的同时,切记盲目屈从与它。

福利

扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!

推荐阅读:

  • 女神节 | 那些奋斗在IT领域的“女神”们

  • 云漫圈 | 如何给女朋友解释什么是HTTP

  • 趣挨踢 | 跳槽季,让我们一起攻克算法吧!

  • 互联网没有春天

  • 学 Python 没找对路到底有多惨?| 码书

  • 这份“插件英雄榜Top20”才是Chrome的正确打开方式!

  • 剧情反转! 创始人去世事件再爆新料, 1.8亿美元难道去了天堂?

喜欢就点击“好看”吧

大数据背后的无奈与焦虑:“128元连衣裙”划分矮穷挫与白富美?相关推荐

  1. 大数据为何让传统银行焦虑?

    毫无疑问,大数据正以其神秘的魔幻之力征服了世人,在各个领域恰风光无限.在金融领域尤其如此,大数据的运用,对传统金融原有的理念.模式与渠道形成了强烈冲击. 大数据为何让传统银行焦虑? 毫无疑问,大数据正 ...

  2. 大数据背后的神秘定理:贝叶斯公式

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 引子 昨天下午趁着出去调研在湖滨银泰的星巴克做网易机器学习实习生岗 ...

  3. 如何让隐藏在大数据背后的价值发挥出来?

    对于普通人来说,大数据离我们的生活很远,但它的威力已无所不在:信用卡公司追踪客户信息,能迅速发现资金异动,并向持卡人发出警示;能源公司利用气象数据分析,可以轻松选定安装风轮机的理想地点;瑞典首都斯德哥 ...

  4. 窥尽大数据背后被遮掩起来的财富

    当我们在谈大数据的时候,我们在谈论什么?大数据产业火爆的背后,有着深厚的利益驱动性,于是各大商家与企业纷纷趋之若鹜,想要窥尽大数据背后被遮掩起来的财富.毫无疑问,变现,是大数据火爆的背后原因. 大数据 ...

  5. 大数据背后的神秘公式:贝叶斯公式

    大数据.人工智能.海难搜救.生物医学.邮件过滤,这些看起来彼此不相关的领域之间有什么联系?答案是,它们都会用到同一个数学公式--贝叶斯公式.它虽然看起来很简单.很不起眼,但却有着深刻的内涵.那么贝叶斯 ...

  6. 大数据背后的神秘公式(下):“贝叶斯革命”

    在上一篇文章<大数据背后的神秘公式(上):贝叶斯公式>中我们讲到贝叶斯公式在联邦党人文集作者公案和天蝎号核潜艇搜救中大显身手后,开始引起学术界的注意和重视,而其上世纪八十年代在自然语言处理 ...

  7. 大数据背后的神秘公式:贝叶斯公式(万字长文)

    大数据.人工智能.海难搜救.生物医学.邮件过滤,这些看起来彼此不相关的领域之间有什么联系?答案是,它们都会用到同一个数学公式--贝叶斯公式.它虽然看起来很简单.很不起眼,但却有着深刻的内涵.那么贝叶斯 ...

  8. 线下活动 | 揭秘大数据背后的京东虚拟平台(免费报名中)

     ▍仅需两步: 1.在社区认真提一个问题. 发布问题请补充详细的背景/条件信息,字数不少于60字,否则无法通过审核喔.点击立即认真提问 2.添加小助手的微信(pmcaffzs2),并发送你的问题截图. ...

  9. 大数据背后是个万亿市场

    2014年的GDP中消费占比已经超过了50%,标志着中国经济正在向市场经济转型,消费占GDP50%-70%是中等发达国家向市场经济过渡的一个表现,未来中国经济增长最大的引擎应该来源于消费,特别是个人消 ...

  10. “数据不会说谎”,如何看穿大数据背后的真相?

    我们生活在一个数据爆炸的时代,数据的作用被无限放大.美国管理学家.统计学家爱德华·戴明有一句名言:除了上帝,任何人都必须用数据说话.然而,这也带来了一个问题:数据也许是客观的.科学的,但是分析和处理数 ...

最新文章

  1. 抽象类的作用之一:sdk 传递你需要的参数
  2. rpm出现error: %preun( ) scriptlet failed, exit status 1问题
  3. 在linux上安装docker
  4. SAP Spartacus 服务器端渲染的三种可能情形
  5. 2020地区mysql表_2020年甘肃省军队文职考试职位表下载:张掖地区招13人
  6. 【转】想象5年后的你
  7. 只需这10步,通过历史控制文件恢复数据库
  8. oracle数据库同步异步优劣点,ORACLE数据库异步IO介绍
  9. Repast HPC1.0.1实例运行总结
  10. 机器人教练SWOT分析_用SWOT方法分析中国智能机器人的发展现状
  11. 积沙成塔之VC不规则按钮的创建
  12. 最全官方win10系统安装教程,教你如何用u盘安装win10系统?
  13. 代价高昂的免费机器人课程{人工智能与机器人教育之个人感悟}
  14. 清北学堂学习笔记 第一期
  15. 用树莓派搭建公网个人下载平台aria2-pro,推荐6个优质种子资源站
  16. linux开启swap(磁盘缓存)操作
  17. 地震——《孩子,快抓紧妈妈的手》
  18. oracle group by 行转列 分析执行计划
  19. python爬虫——爬取起点中文网作品信息
  20. JAVA编程常见错误集锦

热门文章

  1. thinkphp6自定义日志驱动,增加显示全部请求信息
  2. 中移动入侵防御设备集采,总限价1.6亿;爱立信斩获95个5G商用合同
  3. css中表格内容从顶部开始,CSS粘性定位固定表格thead部分元素小方法
  4. 【自学Python:Day3】放假的心该怎么冷静下来学……
  5. QQ聊天记录统计可视化分析
  6. 想了解3D结构光,看这份拆解就对了
  7. Android 测试(Unit Test Instrument Test)
  8. 自动化测试框架[Cypress测试实例凸显其优势]
  9. python sl4a_SL4A - 随风飘落的雨滴 - 博客园
  10. 树莓派用USB蓝牙适配器连接蓝牙设备