作者:京东AI研究院

导言
过去几十年间,人类的计算能力获得了巨大提升;随着数据不断积累,算法日益先进,我们已经步入了人工智能时代。确实,人工智能概念很难理解,技术更是了不起,背后的数据和算法非常庞大复杂。很多人都在疑惑,现在或未来AI将会有哪些实际应用呢?
其实,关于AI的实际应用以及所带来的商业价值并没有那么的“玄幻”,很多时候就已经在我们的身边。接下来,【AI论文解读】专栏将会通过相关AI论文的解读,由深入浅地为大家揭秘,AI技术是如何对电商领域进行赋能,以及相关的落地与实践。人工智能技术在电商领域,有着丰富的应用场景。应用场景是数据入口,数据通过技术得到提炼,反过来又作用于技术,二者相辅相成。

京东基于自然语言理解与知识图谱技术,开发了商品营销内容AI写作服务。并将此项技术应用到了京东商城【发现好货】频道中。

通过AI创作的数十万商品营销图文素材,不仅填补了商品更新与达人写作内容更新之间的巨大缺口,也提升了内容频道的内容丰富性。

同时,AI生成内容在曝光点击率、进商详转化率等方面其实都表现出了优于人工创作营销的内容。

接下来让我们一起来看看,针对不同群体采用不同营销策略及不同风格的营销文案从而提高营销转化率是怎样通过AI来实现的。


与传统的文本摘要任务相比,商品摘要任务更具挑战性。一方面,商品给顾客的第一印象来自该商品的外观,这对顾客的购买决策有着至关重要的影响。因此,商品摘要系统必须能够充分挖掘商品视觉信息,反映商品的外观特色。另一方面,不同的产品有不同的卖点。例如,紧凑型冰箱的优点是节省空间,而环保型冰箱的优点是节能。因此,商品摘要应该反映商品最独特的方面,从而最大限度地促成消费者的购买。

本文接下来将介绍由京东 AI 研究院提出的一种电商商品的多模态摘要模型,该模型可以有效地整合商品的视觉和文本信息来生成卖点突出、流畅和简洁的商品文本摘要。

论文的标题为 :Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products ,发表于 AAAI 2020。

论文链接:http://box.jd.com/sharedInfo/2926429040ECC7D3


如下图1所示,商品广告含有大量的文字介绍,顾客很难在短时间内在这些广告中获取有价值的商品信息,尤其是当顾客想要比较多个商品时,将会耗费大量的时间,影响了购物体验。商品摘要模型可以为商品生成文本摘要,为潜在消费者提供了短时间内了解商品的便利。从消费者决策的角度出发,一个好的商品摘要需要反映商品的外观特色和卖点信息,这也是本文提出的商品摘要模型的出发点。

图1

论文提出了一种基于商品要素的多模态商品摘要方法,如图1所示,该模型将商品图像、产品标题和其他产品描述作为输入,生成商品文本摘要。该模型不仅可以有效地整合商品的视觉和文本信息,而且从商品要素出发,使生成的商品摘要尽可能的包含商品的特色要素,并提高商品摘要的流畅性和简洁性。

论文中构建了一个中文商品摘要数据集,该数据集包含约140万个“商品-摘要”对,涵盖家电、服饰和箱包品类。在该数据集上的实验结果表明,文中提出的模型在自动评价和人工评价指标上都显著优于其他对比方法。


如图2所示,论文中提出的商品摘要模型基于指针-生成器网络(Pointer-Generator)。采用了三种策略将商品图像信息融入模型中,包括使用商品图片的全局特征初始化编码器,使用商品图片的全局特征初始化解码器,以及使用商品图片的局部特征,通过注意力机制生成图片上下文向量参与解码。

图2

首先,对商品要素进行建模(所谓的商品要素,就是商品不同方面的属性。例如:对洗衣机而言,商品要素包括容量和能耗等),然后从商品的要素出发,对摘要的重要性、非冗余性和可读性进行建模。

(1)采用基于商品要素的RAML(reward augmented maximum likelihood)训练,鼓励模型生成的摘要涵盖商品的特色要素。如图2(b)所示,该商品ground-truth特色要素是容量、操控与电机,则该模型将会鼓励生成描述容量、操控与电机相关的文本;

(2)采用基于商品要素的覆盖度机制消除冗余信息。传统覆盖度机制仅能在词维度进行去冗余,难以处理相关词冗余问题。如图2(c)所示,“noise”、“quiet”和“tranquil”均在描述“运行声音”这一商品要素,如果仅对“noise”进行去冗余,难以保证“quiet”和“tranquil”不出现摘要中。本文提出的模型通过商品要素维度的去冗余,可以避免“noise”、“quiet”和“tranquil”同时出现在摘要中;

(3)通过商品要素放回跳机制提高摘要的可读性。如图2(d)所示,商品要素的回跳描述降低了商品摘要的连贯性,影响了消费者的阅读体验。本文提出的模型通过解码时禁用回跳要素词,有效地避免了这一现象。


如表1所示,本文提出的带有的多模态商品摘要模型,MMPG模型取得了比所有基于纯文本的模型更好的结果,这证明了商品视觉信息和商品要素信息在商品摘要任务中起着重要的作用。

表1


论文提出了一个多模态商品摘要模型,其可以利用商品图像、标题和其他文本介绍,为商品生成摘要。文中提出的模型可以有效地利用商品的视觉信息,并反映商品的特色要素,从重要性、非冗余性和可读性的角度对商品要素进行了有效的建模。

对于电商而言,海量商品的营销内容在由达人供稿的过程中,受限于达人写作的效率限制,商品更新速度明显高于营销内容上线速度,导致内容短缺。

AI生成内容在生成效率、曝光点击率、订单转化率等方面其实都表现出了优于人工创作营销的内容。该方法正在应用于垂直电商、综合电商、社交电商、新媒体平台等众多场景。

P.S 同时也欢迎对NLP、文本生成和自动文摘感兴趣的小伙伴加入我们。相关信息咨询,可在后台给我们留言哦~

京 东 AI 研 究 院
京东AI研究院专注于持续性的算法创新,多数研究将由京东实际的业务场景需求为驱动。研究院的聚焦领域为:计算机视觉、自然语言理解、对话、语音、语义、机器学习等实验室,已逐步在北京、南京、成都、硅谷等全球各地设立职场。

欢迎点击“阅读”了解京东智联云AI研究院!

京东商城背后AI技术揭秘(二)——基于商品要素的多模态商品摘要相关推荐

  1. 京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要

    来源 | 京东智联云开发者 过去几十年间,人类的计算能力获得了巨大提升:随着数据不断积累,算法日益先进,我们已经步入了人工智能时代.确实,人工智能概念很难理解,技术更是了不起,背后的数据和算法非常庞大 ...

  2. 安卓刷量技术揭秘(二) 高级攻防技巧

    标 题: [原创]安卓刷量技术揭秘(二) 高级攻防技巧 作 者: ckis 时 间: 2016-10-02,00:28:27 链 接: http://bbs.pediy.com/showthread. ...

  3. Github上开源仿京东商城项目-安装部署(二)

    Github上开源仿京东商城项目-安装部署(二) 2.用IntelliJ IDEA 2020打开项目,选择SuperMarket目录, 将会自动安装相关项目的依赖包,这个时间大约1个半小时. 3.安装 ...

  4. 奥斯卡大赢家影片:《瞬息全宇宙》背后的AI技术揭秘

    本文约1800字,建议阅读5分钟 本文介绍了奥斯卡影片<瞬息全宇宙>背后的AI技术. Runway 是一家人工智能视频编辑软件供应商.据了解,本届奥斯卡最大赢家影片<瞬息全宇宙> ...

  5. AlphaGo对战李世石谁能赢?两万字长文深挖围棋AI技术(二)

    编者按:李世石与Google Deepmind AlphaGo对战在即,围棋界和人工智能界对结果各有预测,但对于程序员来说,了解AlphaGo的技术路线可能更有意思.本文来自出门问问NLP工程师李理, ...

  6. 当当、卓越、京东商城货物配送流程揭秘

    电子商务:寒冬中直面配送短板 电子商务企业逆市成长 大城市配送速度力拼24小时内送达 萧条的经济让零售业感受到瑟瑟寒意,电子商务却成为这个寒冬里屈指可数的"暖行业"之一.互联网研究 ...

  7. 中国人工智能学会通讯——电子商务中的个性化推荐技术剖析 1. 基于人生阶段建模的商品推荐...

    1. 基于人生阶段建模的商品推荐 经典的基于协同过滤的推荐,通常结合用户近期行为,给用户推送已知范围内的商品.随着用户对推荐系统和产品期望的提高,也需要向其呈现部分他们需要,但自己尚不清楚的领域的产品 ...

  8. 商城微信小程序(二)——完成分类页面及商品列表页

    分类页面预览图: 分类页面主要代码 index.js // pages/category/index.js import {request } from "../../request/ind ...

  9. 第一百一十九期:支付宝历年双十一背后的技术揭秘

    和过去10年一样,2019年天猫双11又创造了一个全新的纪录.这个数字背后,是数代支付宝工程师们殚精竭虑.不断突破技术难关. 作者:蚂蚁金服科技 自从有了双十一这个电商节日,很多技术人的生命轨迹都改变 ...

最新文章

  1. 总结:被MySQL UTF8编码坑的惨痛教训...
  2. java集合框架史上最详解(list set 以及map)
  3. 推荐给程序员的经典书——八月图书推荐
  4. gen_cam_par_area_scan_division和gen_cam_par_area_scan_polynomial区别
  5. 字节/阿里/ 百度2021年Java岗发布+最新内部面试题
  6. Chapter 1 First Sight——17
  7. php errorcode,php中pdo错误处理方法详解
  8. 现在就开始使用AngularJS的三个重要原因
  9. Android--使用XMLPull解析xml
  10. 【开源项目】向Nginx-RTMP服务器推流
  11. 光耦驱动单向可控硅_光耦是什麽?
  12. html5列表菜单特效,HTML5 SVG汉堡包菜单按钮分段动画特效
  13. (翻译)Tricks of the windows game programming Gurus(Windows游戏大师之路) --- 前言(作者:ANDRE LAMOTHE 1999)...
  14. VMware提示此主机支持Intel VT-x,但Intel VT-x处于禁用状态怎么解决
  15. python_day12_html
  16. 小米回应造车传闻;饿了么就春节“套路”骑手活动致歉;Go 1.16 正式发布 | 极客头条...
  17. 算法笔记_面试题_7.颜色分类/荷兰三色旗问题
  18. 软件工程-软件小组的组织形式
  19. 电力仿真需要学的软件?5款有实力的电力仿真软件
  20. 或许你一辈子都是个小人物

热门文章

  1. 司法考试常用法律术语
  2. 风暴魔域服务器维护,风暴魔域野外首领在哪里 风暴魔域野外首领刷新时间地点一览...
  3. 计算机语言python课程名称,MOOC背景下的计算机语言课程的改革与发展——以Python语言为例...
  4. 传递正能量,拒绝负能量!加油
  5. 爬虫技术驱动的数据洞察力:解析Nifty Gateway上的NFT市场动态
  6. 【软考中级信安】第二章--网络攻击原理与常用方法
  7. 华硕2018春季发布会 三款新路由最吸睛
  8. 高通芯片为什么输苹果_一位软件工程师解释了为什么苹果要转向自己的芯片
  9. 面向对象 抽象类与接口类
  10. 【尖端干货】H.264编码下直播视频添加水印的优化