每一位消费者

都是与众不同的宝藏

每一位消费者都是独特的,他们购买产品的理由各不相同。在高客单价的行业里,如汽车行业或酒店行业,提供个性化的消费体验将至关重要。

在汽车行业,汽车制造商在不同系列车型的基础上,提供上百种可自选的配置方案,就是一种提供个性化产品服务的实践。

了解消费者独特的偏好将直接影响转化率,但企业如何在消费者进店之前就能了解他们并做出恰当的营销宣传甚至是产品功能的研发呢?相较于让客户填写长长的调查问卷,Stratifyd 选择在论坛中寻找消费者留下的“蛛丝马迹”

Stratifyd 团队通过分析垂直论坛的文本数据,也就是消费者在专业论坛上发表的意见言论来绘制精准的用户画像,为企业提供更深度的消费者洞察。

我们自动识别哪些是目标人群并判断他们为什么喜欢或讨厌你的产品,这样 Stratifyd 就能理解消费者的偏好并帮助企业提供个性化服务,有针对性地满足甚至超越消费者在第一次和企业接触时内心的期望。

“蛛丝马迹”中寻端倪

我们的主要挑战是:在中国最火的汽车垂直论坛中,通过分析 5,300 万论坛帖子为 800 万用户绘制精准画像。选用中国的论坛是为了验证我们的算法能够处理非常复杂的文本数据。最终,我们成功做到了!

可以看看下面的雷达图,这是基于注册用户的言论生成的偏好画像。你可以看到每一个用户关于“油耗”、“性价比”、“动力”、“内饰”、“外观”、“舒适度”、“空间”和“操控性”所表达的不同维度的偏好。这些结果是由我们的分析引擎在几个小时内自动分析生成的,对比原始数据我们的准确率达到了 90%。接下来,我们会拓展更多的维度进行探索尝试。

注意:以下数据均做过脱敏处理,不涉及用户隐私。

▲ 图 1. 雷达图:汽车行业消费者偏好精准画像

由 Stratifyd 分析引擎生成

实现精准画像的技术方法

嘘……偷偷告诉你,其实我们是花了大价钱雇用了一百万 Amazon Mechanic Turk 人工完成的。

哈哈,这当然是个玩笑!这么大量的数据,哪怕我们真的雇了同等量级的人工,他们也不会给出我们 Stratifyd 引擎给出的专业结果。因为不同人的判断标准很难统一,知识结构完全不同,所以结果会有很大误差。这就是 GPU 和机器带给我们的力量,我们通过深度学习就可以完成如此艰巨的任务。

数据准备:我们收集了汽车之家论坛的帖子和评论,总共有 5,300 万条活跃用户的文本数据!为了从文本数据中提炼偏好维度,我们从 J.D.Power 等数据来源另外获取了 150 万条带有评分和维度标注的汽车评论(见下表)来训练一个意图识别模型(Intent Detection Model)。

模型训练:之后我们构建了由 Stratifyd GPU 加速的混合神经网络(Mixture Neural Network,MNN)模型,这不到 3% (150/5,300 万)的数据帮我们实现了 93% 的准确率。我们的机器学习模型遵循 80-10-10 的比例设定训练集、验证集和测试集。

 ▲ 表 1. 用户评价数据样例

我们的预测模型最终甚至可以在脱离上下文的情况下识别短句甚至是词汇。比如,当消费者描述“这辆车看上去很 man”时,我们能识别出他是在讨论“外观”;或者当消费者提到“入弯”时,我们能推测他在说“操控性”。因此我们的模型在遇到长帖或文章时可以精细到短句的颗粒度来推测消费者讨论的维度。

  图 2. 分析流程:帖子被拆分成句子

然后分别打上标签并归类

了解消费者,实现精准营销

从宏观上看,我们发现该论坛中消费者集中讨论的前三个维度标签是“外观”、“油耗”和“动力”。如果添加时间序列,我们也能够看到焦点话题随时间的变迁。

▲ 图 3. 消费者偏好总览

提炼自消费者的文本数据

不同的汽车品牌和型号都有各自典型却迥异的消费者拥趸,这些汽车都是根据目标人群的偏好量身打造并进行营销定位的。

人们对不同维度的评价比如“这是好的”或“那是实用的”其实都是非常主观的评价,基本上没有绝对的好坏之分。因此企业需要关注的就是在微观层面上,对不同的消费者群体做出适合的产品和营销活动。例如,顾客 A 或者消费者群体 A 在购买汽车时认为“动力强劲”是最主要的考量,这时营销人员就可以有针对性地在和消费者接触时引导他们关注汽车的动力而不是外形或者内饰这些次要因素。

对于每个消费者或群体来说,如果我们横向比较这 8 个维度的占比时,我们直观上就可以快速了解消费者更关注哪些方面。

▲ 图 4. 消费者偏好可视化展示

用户 A 关于不同维度的偏好占比

正如图 4 中所展示的,“外观”和“操控性”是用户 A 在帖子中最常提到并发表见解的维度,我们可以合理推测这两点会在用户 A 进行购买决策时产生重要影响。如果汽车制造商可以有针对性地在营销宣传上更多地主打这两个维度,比如强调充满细节的设计以及更大马力,消费者 A 想必会更容易动心。

总结启示

论坛这种消费者反馈媒介让消费者能够自由抒发关于产品服务的真实情感。在这里找到非结构化数据并了解真实想法可以指导企业更好地和用户打交道,无论对营销活动还是产品研发都会很有帮助。

根据用户画像提供准确的产品功能和宣传内容,可以提升获客成功率并增加消费者满意度。联系我们获取更多详细内容。

您也可以点击文末阅读原文或在我们的微信公众号中尝试搜索自己的汽车之家账号,看看我们为每一位车友打造的专属论坛影响力报告!

关于 Stratifyd

CEO 汪晓宇(Derek Wang)博士来自坐落于美国夏洛特的北卡罗来纳大学,拥有计算机科学(Computer Science)博士学位,成立 Stratifyd。汪博士曾担任北卡罗来纳大学夏洛特可视化中心的教授,并积极参与当地社区的科教工作。Stratifyd 的事业源起自他的博士后以及美国政府项目上的工作,研究 AI 如何获取、分析并可视化展示非结构化数据。如今,Stratifyd 凭借其强大的商业和政府使用场景的适用性,成为数据分析和人工智能领域的佼佼者。他领导的 Stratifyd 团队成员包括来自 Bank of America,微软、Xerox、摩托罗拉、阿里集团等领先企业的软件工程师和科研人员。

Stratifyd 专注于利用人工智能技术挖掘消费者洞察。我们可以帮助企业了解客户忠诚的原因,他们的喜爱和讨厌什么,是什么影响了他们的购买决策,以及客户流失的风险等等。我们的人工智能技术会深入分析消费者在和企业互动中留下的数据并绘制精准画像。同时,我们的产品模式和行业经验可以帮助企业在第一天部署就能够开始提高消费者获取和留存的成功率。欢迎访问我们的官网进行试用:www.stratifyd.cn!

点击?阅读原文查查你的汽车之家影响力

Stratifyd AI: 5,300万数据,800万用户,利用垂直论坛评论绘制精准用户性格画像相关推荐

  1. 腾讯又“撒钱”了!奖励2.28万员工800万股,人均16.6万港元 网友:福利界天花板...

    1月22日消息,腾讯控股发布公告称,董事会已决议向不少于22800位奖励人士授予合共8004807股奖励股份.公告称,发行新股份的目的旨在嘉许奖励人士所作出的贡献并吸引及挽留集团持续经营及发展所需的人 ...

  2. hwd分别是长宽高_DS-2CD7A87HWD-XZS 海康威视800万AI人脸抓拍比对筒型网络摄像机

    DS-2CD7A87HWD-XZS 海康威视800万AI筒型网络摄像机 支持人脸抓拍 人脸前端比对 车辆抓拍 车牌识别 支持H.265编码 内置电动变焦2.8-12mm或者8-32mm镜头 DS-2C ...

  3. 以色列AI营养数据公司获800万美元A轮融资

    [数据猿导读]近日,以色列公司Nutrino宣布已完成800万美元A轮融资,总共获得的融资达到1000万美元 编译 | 金又南 官网 | www.datayuan.cn 微信公众号ID | datay ...

  4. 英国AI医疗保健初创企业snap40获800万美元融资

    编译 | 金又南 官网 | www.datayuan.cn 微信公众号ID | datayuancn snap40位于英国苏格兰爱丁堡,是一家基于AI的医疗保健公司,其使命是保护每个人的健康.近日,公 ...

  5. AI一分钟 | 传锤子和360手机正洽谈合并;吴恩达Woebot Labs完成800万美元融资;吴甘沙:AI技术中国排第二没问题

    整理 | 阿司匹林 一分钟AI 传360手机和锤子科技正在洽谈合并,目前尚未达成最终交易 IBM中国研究院研究总监称,AI统计数据发现夫妻俩一起生活可以降低心梗概率 驭势科技联合创始人吴甘沙表示,在A ...

  6. 医疗AI机器人Woebot获800万美元融资,帮助人们应对抑郁等精神疾病

    [数据猿导读] 3月2日,医疗AI机器人Woebot宣布已经完成了800万美元的A轮融资.公司的这款AI机器人旨在通过认知行为疗法帮助人们应对抑郁等精神疾病 作者 | 金又南 官网 | www.dat ...

  7. 以色列初创企业Skyline AI获300万美元种子融资,红杉资本领投

    [数据猿导读]Skyline AI是一家以色列初创公司,利用机器学习帮助房地产投资者识别有前景的房产.今日,公司宣布已从红杉资本获得了300万美元的种子资金.本轮融资将用于公司建立技术平台,并聘请数据 ...

  8. PHP群发300万,mysql 300万数据查询500多秒如何优化

    mysql 300万数据查询500多秒怎么优化啊 本帖最后由 dz215136304 于 2013-08-15 11:33:52 编辑 linux下 mysql 300万数据查询500多秒怎么优化啊, ...

  9. mysql5.7单表最大容量_mysql 5.7单表300万数据,性能严重下降,如何破?

    环境: DB: mysql 5.7.xx OS: windows server 2012 r2 CPU: E3 1220-V5 内存: 4G. 数据库配置(基本上是默认配置): join_buffer ...

最新文章

  1. WebStorm配置SVN
  2. 解决crond引发大量sendmail、postdrop进程问题
  3. chrome Native Client 让你可以使用 C 以及 C++ 语言开发 Web 应用
  4. CodeForces - 1547G How Many Paths?(强联通缩点+拓扑)
  5. java中ThreadPool的介绍和使用
  6. 程序开发天团必备单品,稳定输出还加持千元商务礼限时送!
  7. design php 如何使用ant_Ant Design Pro初探—添加面包屑
  8. typename的作用
  9. 记录平时发现的一些小知识点
  10. linux重启docker镜像都没了,linux – 没有响应的Docker命令挂起
  11. ant+testng 搭建
  12. API开放平台基于accessToken实现
  13. python内置max()、min()函数与Numpy自带的max()、min()函数性能对比分析
  14. Node.js常用console中的几种方法
  15. 调频连续波雷达基本原理(1)-测距原理详解
  16. 小学美术计算机教案模板,小学美术教案模板五篇
  17. 接口调用成功,功能实现但是返回404报错
  18. BlueCms v1.6 本地文件包含漏洞代码审计
  19. ffmpeg 视频抽取音频,视音频分离
  20. 希望各位博友解答一下

热门文章

  1. WDK编译libwdi
  2. 基于JAVA大学生个人博客网站计算机毕业设计源码+系统+lw文档+部署
  3. 边缘微数据中心部署的成本效益分析
  4. 计算机图形动画处理实训报告,西安石油大学计算机图形学 实验报告.doc
  5. php 微信公众号开发-自动回复之标梵分享
  6. Vue中使用e-icon-picker 图标选择组件
  7. 复数运算(对数,指数,正弦)
  8. 每日一练3.冒泡排序
  9. 0.96寸4引脚(IIC协议)OLED驱动程序
  10. 服务器收集系统清单,EAS的Linux服务器系统依赖包清单