发际线堪忧的小 Q,为了守住头发最后的尊严,深入分析了几十款防脱洗发水的评价,最后综合选了一款他认为最完美的防脱洗发水。

一星期后,他没察觉到任何变化。

一个月后,他用卷尺量了量,发际线竟然后退了 0.5cm!难道防脱要经历一个物极必反的过程,先脱再长?小 Q 不甘心,决定继续坚持。

两个月后,小 Q 心如死灰,忍不住和小 Z 抱怨。

这句话,平地一惊雷,炸出了小 Q 惨痛的网购回忆。

他,屡屡冲着卖家秀而去,却屡屡化身买家秀而归。

说好的椰子!?

我想买两个杯子来着,怎么变成了一个!?

小 Q 曾经因为网购吃亏太多,而为自己的颜值和智商担忧。但经过小 Z 的点拨,他认定了一件事:活成卖家秀,并不是自身的问题,而是万恶的假评价误导了自己的消费决策。

为了自己,为了让更多的朋友免受误导,他和小 Z 一拍即合,决定用数据思维来鉴定刷单。

经过一番翻云覆雨,终于总结出了用数据鉴定刷单的两板斧。

第一板斧:评销比

购买——使用——评价是一个完整的购后链路。消费者在购买了产品之后,一定会使用,但评价则需要一定场景来触发。

比如这个产品超出预期,我要感谢卖家!或者这个产品在侮辱我的智商,我要骂街!

当然,还存在一部分为了刷积分而评价的人,不过正常情况下,主动评论的人占总人数的比重是维持在稳定水平的。

如果有通过大规模红包返现或其他人为手段刷的好评,在同样购买人数的前提下,参与评价的人大概率是高于正常的。

怎么衡量这个比例是否合理呢?这里,我们引入一个叫做评销比的指标。

评销比 = 单款产品总评论数 / 单款产品总销量 * 100,以此来衡量平均每卖出 100 单位的产品,对应着多少条评价。

接下来,我们导入爬取的脱敏真实数据(为了去重广告嫌疑脱的敏)来实践一下:

增加一列计算评销比:

看看评销比分布形态,数据在 20 左右分散开来,略微偏右:

从评销比分布图,可以看出在 40 处有二次下跌,我们暂且把 40(一般也可以尝试平均值)设置为一个筛选阈值,高于阈值的判定为有刷单嫌疑。

第一版斧挥过,12% 疑似刷单的产品应声倒下,小 Z 露出了欣慰的微笑。

小 Q 却眉头紧锁:“这个鉴定逻辑是有一定道理,但是,我买的那款洗发水竟然逃过了筛选!”

不要慌,我们还有第二板斧保驾护航。

第二板斧:内容重复度

第二板斧整个判别逻辑极其简单粗暴:对于一款产品,如果存在不同的用户,在不同的时间,评论了相同的内容,那妥妥的是刷啊!

直接上案例数据,我们爬取了小 Q 购买的那款防脱洗发水评价,共计1706条:

为了让鉴别更加科学,先换位思考:除极端情绪外,我们自己在评论时总会用“还行”、“一般般”、“刚收到,还没用”等短评来敷衍。这些短评非常容易重复,但也不能说是刷的评价。

so,我们在用重复度鉴别时,可以先预设一个评论长度作为筛选标准,比如只对超过 15 个字的评论进行重复度匹配:

长度筛选之后,正好还剩下 1200 条评价,下面开始正式匹配。大家如果想更精细,可以考虑用文本挖掘等高阶方法,在这里我们用最最最简单粗暴的文本排序:

前 6 条评价,有 3 个不同的客户,分别在 19 年的 10 月 16 日、24 日和 21 日发表了相同的内容,他们都受高考压力影响,脱发严重,每天房间、床铺、地上掉满他们的头发。

幸好!!!他们在秃顶前遇到了这款洗发水!用了几次不仅比之前掉的少,还新长出来了一些小碎发!

177 个字,洋洋洒洒,令人动容!

但这到底是偶然的巧合还是有组织刷的评价呢?我们不能这么简单下定论。

继续看一看,这些长篇大论一字不差的重复评论有多少条:

注:A、B、C 三条内容完全一样,则统计为 3 条重复评价

1200 条超过 15 个字的评价,有 378 条是虚伪的,占比高达 31.5%。

他们文风多变,除了“高考压力”,还有“为父分忧而买”、也有“被微博广告安利”、甚至有“担心被骗,用第二套才敢评价的”。

可谓情真而意切,感人而至深!

小 Z 看过评价,深深不能自拔,瞬间理解了小 Q 为什么被忽悠。

“你跺你也麻啊!”

幸好,以后有了这两板斧保驾护航,再也不用担心这些虚评假意了。

Python 教你识别淘宝刷单,买到称心如意的商品相关推荐

  1. 浅析淘宝刷单--我们如何网购

    淘宝刷单指淘宝店铺为了获得单品或者店铺在淘宝搜索中获得较好的排名而采取的作弊行为,可以看成一种建立在欺骗基础之上的营销行为,虽然这种行为被淘宝明令禁止,但刷单方式却层出不穷.本文将从如下几个方面解析淘 ...

  2. 亚马逊、速卖通、wish、Lazada、shoppe、ebay、煤炉测评跟淘宝shua单区别在哪?

    国内淘宝刷单一般都是卖家发送空包裹 买家货物都看不到直接好评 所以是有一定的不真实性的 商家这种行为是属于欺诈的 而且现在国家已经有明确的法律规定了 亚马逊.wish.Lazada.ebay.shop ...

  3. 兼职淘宝刷好评的工作靠谱吗,商家补单时应该注意些什么?

    自从淘宝新规则实行之后,对虚假交易这块是查得越来越严格了,无论是规则推出前还是后都会有商家依旧进行补单操作,但是这其中也不妨有不懂的市场行情,那么作为兼职的淘宝刷好评的工作可信度是多少呢? 兼职工作淘 ...

  4. 淘宝补单怎么防止降权?如何避免降权?

    对于淘宝店铺来说,权重非常的重要,淘宝商家们需要想办法去提升淘宝店铺的权重才可以哦,而且淘宝商家们还可以通过补单的方式来达到店铺的基础哦,那么淘宝补单怎么防止降权呢? 淘宝补单怎样不被降权? 1.选择 ...

  5. 淘宝补单发货地不一样可以吗?正确补单流程是什么?

    在淘宝平台中,很多的淘宝商家们都会去补单,淘宝商家们可以通过补单的方式去打好店铺的基础哦,而且淘宝商家们补单的话,也需要去进行发货的哦,如果淘宝补单发货地不一样可以吗? 淘宝补单发货地不一样可以吗? ...

  6. 使用 Python 全栈打造淘宝客微信机器人

    1 .前言 1.1.什么是淘宝客 相信很多人都听过或者接触过各类导购 APP.QQ 群.微信群分享一些淘宝商品的优惠券或是其他的优惠信息. 用户可以在这些渠道上获取到相较于从淘宝平台搜索出来的商品更加 ...

  7. 淘宝刷单被降权订单会取消吗?

    淘宝刷单被降权订单会取消吗? 大家好,电商行业的竞争很激烈,有许多的小店铺在淘宝上举步维艰,没有流量没有点击,自然也就没有转化,所以就有了刷单的出现.那么淘宝刷单被降权订单会取消吗? 订单不会取消的. ...

  8. 天猫补单-淘宝补单平台哪个最安全,如何找口碑好优质正规靠谱的补单平台?

    开网店最重要的就是销量,为了提升店铺销量,很多商家会选择淘宝补单平台.所以网上就出现了一些不法分子利用淘宝卖家急切提升销量的心理,通过伪造补单平台而骗取淘宝卖家的钱.下面来教大家如何辨别伪造补单平台. ...

  9. python如何赚外快 淘宝_业余时间怎么赚外快?用Python赚钱的5个方法!

    Python作为一门编程语言,一门技术,就一定能够为我们所用,至少赚个外快是绝对没有问题的. 渠道一:淘宝搜python程序 可以到淘宝上搜,Python程序,到相应的店里找客服,就说你想做程序开发, ...

最新文章

  1. JavaBean规范
  2. 【Python基础】数据项目总结 -- 蛋壳公寓租金分析!
  3. IOS之Label画一条删除线
  4. 【抽奖】若川诚邀你加前端群,长期交流学习~
  5. java获得电脑性能_Java:使用SingletonStream获得性能
  6. 讓combobox也綁定數據表
  7. 救救孩子?强制实名游戏不足四成 青少年视力保护状况堪忧
  8. 【日期类问题】例2.2 Day of week
  9. 算法导论笔记(四)算法分析常用符号
  10. v割与邮票孔_pcb板V割和邮票孔的区别
  11. Android抓包工具tcpdump
  12. 计算机启动时默认输入法设置,电脑开机输入法设置 开机默认输入法设置教程...
  13. [RK3288][Android7.1]调试笔记 --- 内置高版本的APK编译User版本出错解决
  14. Win11新Bug任务栏图标不显示的解决方法
  15. html实现图片裁剪,【前端】图片裁剪(二)Jcrop实现裁剪
  16. 数据中心常说的IDC,EDC,ODC,DC分别指什么类型机房?
  17. python 热度图_keras CNN卷积核可视化,热度图教程
  18. ios设备管理软件imazing 2.16.2官网下载,2022年强悍来袭!
  19. Tableau:画桑基图(详细版)
  20. Struts1.x 登录实验-无数据库版

热门文章

  1. c语言编程一个乘法scanf,几道简单的c语言编程题
  2. Need BLUETOOTH_PRIVILEGED permission
  3. php读取字符阿拉伯数字,php 阿拉伯数字转中文数字 方法
  4. java语言程序设计第三版答案郎波著,太完整了!
  5. 携万钧之力 趣享付春雷计划搅动2019创业市场
  6. 2009年国庆再回桂林(有图片)
  7. 【原创】赔率、胜率、水位的计算方法
  8. BCGSoft BCGControlBar for .NET托管代码工具包
  9. app式成语_成语大全四字成语下载-成语大全appv2.2.2 安卓版-腾牛安卓网
  10. excel一张图绘制两条曲线