随着餐饮行业进入线上线下、堂食外卖并重的“双主场”时代,面对铺天盖地的用户评论数据,如何用数字化手段优化经营成为餐饮企业降本增效的关键。今天带来的分享案例是黑蚁资本如何借助 PaddleNLP 情感分析技术开发了用户评论洞察系统,实现降本增效的例子。一起来看看吧

黑蚁资本,是一家来自上海的深耕消费领域投资的企业,成立之初就决心让“投后服务”成为机构的核心能力之一,而“数字化”正是黑蚁服务被投企业的重要内容。为了帮助被投企业提升评价数据的处理效率,黑蚁投后数字化团队基于PaddleNLP情感分析技术,开发了用户评论洞察系统,帮助品牌高效深入了解用户反馈,自动抽取出高价值信息,实现量化统计分析,从而降低经营成本,优化产品和服务,提升市场竞争力。

据悉,情感分析技术(Sentiment Analysis Technology)是一种当前流行的旨在对带有情感色彩的主观性文本进行分析、处理、归纳和推理的技术,在消费决策、舆情分析、个性化推荐等领域都拥有广泛的应用前景。

情感分析示意图

初衷:想以更低成本,聆听用户声音

正如哈勃望远镜,哈勃舆情取“哈勃”二字是希望通过工具看见别人所看不到的东西,其开发的最初灵感来源于黑蚁投后团队对消费行业数字化的洞察。

2021年初,黑蚁资本运营董事Jeru刘湛带领黑蚁投后数字化团队在对被投品牌做调研时发现,用户的反馈对驱动产品迭代、改进服务非常重要,但是聆听用户声音的成本却很高

Jeru介绍,过去一个品牌想获取用户评论情况,如NPS净推荐值,包括推荐意愿和复购意愿,需要经过一系列的调研分析:请第三方公司采用问卷调查、实地拦截、线下采访等方式进行调研;完成调研后再找打标签的公司,人工在产品用户评论下抽取约2000条评论,在Excel表格里打标签标记。

上述这种方式存在明显的问题。一方面,调研采集到的样本的数据量有限且真实性有待考证,大大影响后续分析的客观性和准确性;另一方面,人工打标签的方式不仅标注不统一,主观性强,而且操作成本非常高。

Jeru回忆到,当时市场上大多数的产品只是单纯用陈旧的技术做评论分析,精准度和精细度并不是很高。他就思考,如何将用户评论洞察自动化,让非结构化的评论数据变成结构化的数据呢?因为只有结构化的数据才方便量化统计分析,使经营者更直观快捷地了解用户,获得科学的指引,从而实现精准的产品运营决策。

瓶颈:PaddleNLP解研发燃眉之急

在经过半年的市场调研后,Jeru迅速组织技术专家投入到研发中,在团队共同努力下,历经两年时间,黑蚁终于自主研发出用户评论洞察系统哈勃舆情,截止到目前,黑蚁已经发布了30多个系统版本,基本上每周都会更新迭代一次。

哈勃舆情类似于一个智能化“顾客情感温度计”,它能从不同的维度来感知顾客在不同指标上的情绪并进行分析,比如,用户会对某一种品牌的评价经常提到某一项(提及率,代表用户的心智),在一句评论中可能会表达多个“观点”,这些“观点”往往包含三要素:维度、观点词、情感。维度一般是名词(比如菜品、价格),观点词一般是形容词(比如辣、丰富),两者合在一起表达的是一种某东西怎么样的观点,哈勃舆情可以判断顾客所表达观点情感是正向还是负向,最后将情绪指标得分以量化的形式呈现给经营管理者,从而帮助品牌商找到问题。

哈勃舆情系统图

研发过程并非一帆风顺。哈勃舆情刚开始研发模型做情感预测时,他们只能判断整句评论(粗粒度)的好坏,而无法对多观点独立(细粒度)做预测情感,致使情感预测结论数据准确率不高,研发进入了瓶颈。

2022年5月,一次偶然的机会,Jeru在GitHub上看到PaddleNLP开源了通用信息抽取技术UIE,他当时感觉UIE非常适合哈勃舆情的研发,或许可以解决困扰他们已久的难题。

据了解,UIE是一个大一统诸多任务的开放域信息抽取技术方案,开创了基于Prompt的信息抽取多任务统一建模方式。PaddleNLP结合文心大模型中的知识增强NLP大模型文心ERNIE 3.0,发挥了UIE在中文任务上的强大潜力,推出面向通用信息抽取的产业级技术方案。

由于PaddleNLP在情感分析能力上表现优异,能够完成涉及句子级情感极性分类、属性抽取、观点抽取、属性级情感极性分类等多项情感任务,并提供可视化能力,帮助用户快速分析业务数据,这极大帮助了黑蚁投后数字化团队开发哈勃舆情,也帮他们节省了大量的训练成本。

“没有出现通用模型之前,开发者需要分行业去训练模型,要知道一个行业要用到10万以上量级的标签来训练模型,才会取得比较好的效果。”Jeru感慨到训练成本太高。

Jeru进一步解释说,在预训练大模型出来之前,传统的技术方案下,几乎所有的NLP公司都倾向于找打标签的人员通过打标签的方式来训练自己的模型。但有了预训练大模型后,整个行业的玩法发生了改变。现在大家只需要使用一个通用的大模型,无需标注,或仅需少量标注,就能对独立观点进行精准情感预测,这样就极大降低了开发成本。同时基于UIE的技术方案不限定行业领域和抽取目标,可零样本快速冷启动各类信息抽取任务,加上强悍的小样本微调能力,使得观点抽取查全率与精准率大幅提升。

具体来说,在UIE-base和fp32精度下,相较人工至少需要一天时间来统计1000条样本的情况,该系统的细粒度抽取观点效率约为30条/分钟,粗粒度情感判定约为135条/分钟,经过行业微调后的数据准确率达到了85%以上

终极:希望以交互方式回答人类问题

据了解,哈勃舆情系统不仅供黑蚁的投资团队用于行业分析报告研究,还帮助黑蚁投资的诸多品牌倾听用户的声音,实现降本增效。

例如,黑蚁为被投企业某区域火锅品牌做菜品分析时,系统针对菜品建立专门指标体系,进行评估量化,逐月分析菜品的变化,帮助品牌找出了可优化的菜品,调整更新了口味、配方和原料,最终让火锅店用户对菜品的评分从60分提高到90分。

此外,黑蚁团队在开展县域中青年消费需求研究时,将田野和定量调研回收的数据交由哈勃舆情来处理,凭借其强大的语义解析AI模型帮助团队更高效地了解具体品类下县域消费者心智。

关于未来的产品规划,黑蚁将花更多时间精力针对不同行业进行样本微调,不断完善模型的识别能力。

Jeru谈到,“我们希望系统未来能以交互的方式给出回答。当我问系统‘为什么某品牌的用户忠诚度更高‘的问题时,它不再是以词语的方式给出答案,而是以人类语言的方式组织观点,更直观地告诉我答案,我认为这是一个终极。”

如今,利用人工智能技术促进经营转型已经在消费行业获得越来越多的认可与推崇。餐饮、电商、零售……新消费浪潮下的各个品牌正在新品开发、品牌建设、销售服务等方面推进智能化升级,通过AI优化业务场景,努力与用户建立更有温度的联接,不断提升企业的市场竞争力。

未来,飞桨将携手更多金融投资机构持续助力消费行业,在情感分析能力方面,通过情感倾向分析、评论观点抽取、对话情绪识别等场景化能力,以AI技术赋能消费行业数字化转型,共同探索“深度学习+”消费的创新之路,为消费行业智能化升级注入更强大动力。

参考

  • PaddleNLP 情感分析方案

https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications/sentiment_analysis

  • PaddleNLP 项目地址

https://github.com/PaddlePaddle/PaddleNLP

10w+训练标签?成本太高!PaddleNLP情感分析赋能消费“回暖”相关推荐

  1. 很多人认为,因为我们是平民,做生意试不了错,输不起,试错成本太高

    很多人认为,因为我们是平民,做生意试不了错,输不起,试错成本太高.有钱人,富二代,做生意,有钱,可以输得起.这话一半对一半不对. 不管是平民还是富二代,都折腾不起.我们老百姓,亏了十几万都觉得天要塌了 ...

  2. 成本太高,京东配送扛不住了?

    对于中国快递业来说,每年春节都是酝酿涨价的好时机,但快递行业想涨价并不那么容易,各家公司联合涨价最多也就只涨那么一元两元,因为彼此之间的市场竞争关系要远远大于利益合作关系,涨价实则是快递公司因成本上涨 ...

  3. 马云以2750亿财富第三次成为中国首富;扎克伯格:AWS云服务成本太高;小米否认冰箱由海尔代工 | EA周报...

    EA周报 2019年10月11日 每个星期7分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事.掌握IT核心技术. 热点大事件 任正非:鸿蒙最快1年即可媲美iOS和Android 据报道,华为创始人任正 ...

  4. 鸿蒙荣耀x10max,网曝荣耀X10 Max起售价2千元 屏幕成本太高

    中关村在线消息:博主@数码闲聊站 爆料,荣耀大屏手机X10 Max的6+64版本售价约为2千元左右,主要原因是屏幕成本占比高,换成普通尺寸会便宜很多. 荣耀X10 Max是本年度少有的7.09英寸大屏 ...

  5. 硅谷顶级VC发声:AI技术公司毛利实在太低,人工和算力成本太高

    赖可 编译 量子位 报道 | 公众号 QbitAI AI技术落地会遇到什么困难?毛利率低,难有通用解决方案,又难以形成技术壁垒. 硅谷顶级VC公司的文章中,把这些挑战挨个分析了一遍.并根据现有经验,提 ...

  6. 联想打印机7256显示更换墨盒_惠普打印机涉嫌垄断?只认自家“昂贵”墨盒,成本太高招架不住...

    近日,有人爆料称,所在公司购买的惠普打印机使用原装墨盒时可正常打印,更换其他品牌墨盒后也不能正常使用,因此认为惠普公司有行业垄断的嫌疑. 从细节来看,该公司购买了惠普同一型号但不同批次的两台打印机,一 ...

  7. ES VS CK,成本太高,效率太低?不存在的

    文章目录 ES占用内存多? Off-Heap ES占用存储多? ES指标型数据存储压缩 ES日志数据存储压缩 ES Schema On Read Searchable Snapshot ES的读写速度 ...

  8. 心理服务机构运营成本太高?《心理服务OA系统》来解决!

    21世纪作为一个互联网化.数据化的新时代,一切发展需要向数据化与互联网相靠拢,作为心理咨询服务机构更是如此,同样都会面临管理与发展的问题,究竟如何高效的推进自身发展是整个行业面临的一大难题,心悦灵自主 ...

  9. GAN成本太高!Python手动生成表情包小demo

    点击上方"机器学习与生成对抗网络",关注星标 获取有趣.好玩的前沿干货! 来源:https://urlify.cn/2aQfya 编辑:python开发者 一.项目说明 在日常生活 ...

最新文章

  1. 专属自己的二维游戏引擎【二】
  2. ACS AD 和本地验证SSL ×××
  3. 抄作业了!6 大 Flask 开源实战项目推荐
  4. C/C++学习之路: 继承
  5. 我的世界java手机版怎么调按键_博阅Likebook P6高配青春版使用评测
  6. 开发一个出生年份的下拉选择框供用户选择_关于下拉式菜单,这一篇足够了
  7. 将日期变为中文星期几
  8. c语言iec 103协议程序,IEC103通信流程详解.doc
  9. 谷歌安装FeHelper插件
  10. python安装numpy库教程_Python库之numpy库的安装教程
  11. Excel-散点图(相关性及数据分布)分析
  12. 我做过的本职之外的事情
  13. 东财《领导科学X》综合作业
  14. mysql子查询返回多于1行_mysql – 子查询返回超过1行
  15. 图形编辑器——Graph Editor(树图必备)
  16. 16-C++-基础-整型short、int、long和long long
  17. ARS408-21毫米波雷达笔记
  18. Android RecyclerView ItemDecoration 分割线
  19. Eclipse 中WebService简单应用:手机归属地查询
  20. 【SQLite预习课1】SQLite简介——MySQL的简洁版

热门文章

  1. Echarts Y轴单位自动转换
  2. 基于微信小程序的健身房私教预约管理系统+后台管理系统(SSM+mysql)-JAVA.VUE【毕业设计、论文、源码、开题报告】
  3. asp.net仓储物流管理系统
  4. 了解公司企业:PQA Testing
  5. Mendix发布2022年制造业七大趋势:智能工厂、超级自动化
  6. 豆瓣:“慢公司”,互联网营销
  7. Java字符串反转利用StringBuilder的api
  8. Oracle使用实例:exp和expdp导出数据
  9. 论文阅读03:深度文本匹配综述
  10. 浮雕雕刻作业设计的一款雕刻机