基于电子商务平台上亿级的庞大商品库,电子商务交易得以不断增长。

为了更好地支持日常业务,需要将这些海量的商品以一种更优的方式进行描述、存储和计算,并且需要支持融合不同来源的数据,建立实体之间的语义连接,因此采用了知识图谱这种数据构架

阿里巴巴积累了上千亿规模的商品数据作为商品知识图谱,这些数据来源于淘宝、天猫、阿里巴巴等在内的多个阿里旗下平台,囊括了品牌制造商、消费者、国家机构、物流提供商等多方利益相关者的数据。

从知识产权保护或购物体验的角度来看,商品信息的标准化和内外部数据的深度关联挖掘,对电子商务业务至关重要。

利用自然语言处理、语义推理和深度学习方法的最新进展,通过提供产品的全球概况、假冒产品治理、行业运营的完整产品信息,可以为搜索业务、推荐业务、平台治理、智能问答等开发人工智能相关服务,为消费者提供更好的使用体验。

目前,商品知识图谱包含标准产品、标准品牌、标准条码和标准分类四个关键组成部分,集成了公众情感、百科全书、国家行业标准等九大本体论数据集,运用实体识别、实体链接、语义分析等方法构建了大规模的知识图谱。

目前,商品知识图谱包含700多亿个三元组和300多万个规则,建立了一个完整而庞大的数据视图,极大地支撑了基于知识的项目服务。例如,商品知识图谱能支持语义搜索、智能问答、商品推荐等各种知识增强任务。

在阿里巴巴电商实际场景中,围绕商品知识图谱展开了一系列的技术研究和应用,其中主要业务场景包括商品分类、同款商品识别、商品推荐、商品标签发现、商品属性预测等。

为了在不同的任务中使用知识图谱信息,应用知识图谱预训练(Pre-trained Knowledge Graph,PKG)技术对知识图谱进行建模࿰

知识图谱应用实战案例100篇(一)-阿里巴巴超大规模知识图谱预训练实践:商品分类相关推荐

  1. 知识图谱应用实战案例100篇(二)-以知识图谱的方式打开预训练语言模型

    前言 关于"知识"的话题有两条不同的技术思路. 一条思路认为需要构建知识图谱,利用符号化的表示手段描述知识,才能完成复杂的语言理解和推理问题. 另外一条思路认为可以利用语言预训练模 ...

  2. 知识图谱开发实战案例剖析_我从剖析Web开发人员路线图中学到的知识

    知识图谱开发实战案例剖析 by Nicole Archambault 妮可·阿坎巴特(Nicole Archambault) 我从剖析Web开发人员路线图中学到的知识 (What I learned ...

  3. Django MTV - 模型层 - (专题)知识要点与实战案例

    Django- 模型层(models)知识要点与实战案例 (专题概述及索引) 概述:本专题以讨论Django中模型层相关的基础知识,这些基础知识在我们的日常开发中有着相当重要的作用.模型(models ...

  4. HTML实战案例6:制作阿里巴巴用户注册页面

    HTML实战案例6:制作阿里巴巴用户注册页面 一.完整的页面效果图 二.代码展示 <!DOCTYPE html> <html> <head> <meta ch ...

  5. TensorFlow 工程实战(一):在TFhub中下载预训练的pb文件,并使用 TF-Hub 库微调模型评估人物年龄

    实例描述 有一组照片,每个文件夹的名称为具体的年龄,里面放的是该年纪的人物图片. 微调 TF-Hub 库,让模型学习这些样本,找到其中的规律,可以根据具体人物的图片来评估人物的年龄. 即便是通过人眼来 ...

  6. GIS实战应用案例100篇(十五)-CASS插件应用:如何控制点属性与点名统一

    前言 图面上有100+控制点,图上点名注记和点的属性值不一致(下图所示),要怎么操作才能统一? 图上的点名注记是统一编号,手工修改的.也是最终确定的控制点点名.属性面板中看到"点名" ...

  7. GIS实战应用案例100篇(一)-GEE主成分分析(含代码)

    1.介绍 主成分分析是将众多具有相关性的数据指标,重新组合成一组新的指标,新形成的指标互不相关,并且前几个主成分能代表原始数据的大部分信息. 在GEE中,可能会遇到波段数非常多的情况,这时就可以考虑使 ...

  8. 深度学习核心技术精讲100篇(八十一)-NLP预训练模型ERNIE实战应用案例

    前言 基于飞桨开源的持续学习的语义理解框架ERNIE 2.0,及基于此框架的ERNIE 2.0预训练模型,在共计16个中英文任务上超越了BERT和XLNet, 取得了SOTA效果.本文带你进一步深入了 ...

  9. GIS实战应用案例100篇(二十一)-全国分省、市、县净初级生产力NPP数据制作实战(附代码)

    前言 净初级生产力(Net primary productivity, NPP)是研究陆地生态系统中物质和能量转换的重要指标,NPP的空间分布与区域气候.植被生长以及人类活动等因素息息相关,其变化能反 ...

最新文章

  1. 夫妻两人同一个银行各自存50万,银行破产了该赔多少?
  2. 电脑故障,路由器及网络
  3. leetCode 6. ZigZag Conversion 字符串 (上传费劲)
  4. Django:Web框架,WSGI,WSGI实现浏览器与服务器通信,路由route,WSGI实现页面访问
  5. Jmeter如何进行http接口测试
  6. Android APK 签名比对
  7. eclipse安装Maven插件M2E
  8. 用Python做童年回忆的游戏 贪吃蛇
  9. ArcGIS——Window Server2016中的安装10.2问题
  10. 【渝粤教育】国家开放大学2018年春季 0266-22T设计构成 参考试题
  11. C/C++ Linux 程序员必须了解的 10 个工具
  12. Android四大组件简介
  13. 区块链是大数据生态圈技术之一_ODC构建普惠金融生态圈|区块链+大数据
  14. linux分区btrfs,系统基础之Btrfs文件系统详解
  15. 怎么制作睡袋rust_创造与魔法让小伙伴复活的睡袋制作材料和其放置的位置图解...
  16. html显示隐藏内容点击显示数据表代码,js如何实现点击显示和隐藏表格
  17. 解决Macos中Python Matplotlib库中文显示乱码问题
  18. 前后端分离微服务管理系统项目实战SaaS-HRM项目(九)——文件上传与PDF报表入门
  19. STM32F429移植STemWin,STemWin函数应用
  20. 东芝笔记本自带蓝牙在ubuntu中的驱动问题修复方法

热门文章

  1. 光端机与光纤收发器的区别
  2. [渝粤教育] 江苏食品药品职业技术学院 酸奶及冰淇淋生产技术 参考 资料
  3. 【渝粤教育】国家开放大学2018年秋季 1320T关系营销 参考试题
  4. [渝粤教育] 中国地质大学 电路理论(新) 复习题 (2)
  5. zigbee物联网模块市场:LTE标准Cat.1和nbiot无线通信模块差异
  6. mysql timeout的单位_mysql的timeout-阿里云开发者社区
  7. Win10窗口侧边栏设置Win7模式
  8. 写cookies注意事项
  9. Java 将数据写入磁盘并读取磁盘上的文件
  10. numpy的使用数组的创建2