文章目录

  • 1 文章介绍
  • 2 应用场景:智能问答
  • 3 实现流程与原理
    • 3.1 语音识别模块
    • 3.2 意图识别模块
    • 3.3 实体查询模块
    • 3.4 实体推荐模块
  • 4 三大关键技术
    • 4.1 实体链接:根据特征与实体模板进行关联。
    • 4.2 知识整合
    • 4.3 自动化构建技术
  • 5 其他技术
  • 参考数据

1 文章介绍

知识图谱在小米的应用与探索,作者为小米公司的彭力(小米公司),发表在开放知识图谱公众号, 日期为 2020.11.18。作者彭力,ID小米AI Lab知识图谱高级软件工程师,参与IEEE p2807知识图谱的标准制定;在小米主要负责知识图谱的构建和探索知识图谱在公司业务场景下落地。已推动知识图谱在小爱同学、小米商城、游戏商城、虚拟助手、智能问答等业务开花结果。
相关阅读:《知识图谱标准化白皮书(2019版)》主编单位:中国电子技术标准化研究院,全书共200页。下载地址:https://pan.baidu.com/s/1FmDzr9K40aqPPhlljkvWqw 提取码:gi7t

小米知识图谱于2017年创立,已支持公司了每天亿级的访问,已赋能小爱同学,小米有品、智能问答、用户画像、虚拟助手、智能客服等互联网产品。通过引入知识图谱,这些产品在内容理解、用户理解、实体推荐等方面都有了显著的效果提升。本文的主要内容包括:

  • 小米知识图谱介绍:包括小米的商业模式、小米人工智能部、知识图谱在人工智能部的定位、小米知识图谱的发展历程、以及小米知识图谱的落地场景。
  • 小米知识图谱关键技术:小米知识图谱在成长过程中的技术积累。
  • 小米行业知识图谱探索:结合业务,跟大家分享下小米在行业图谱上的探索。

2 应用场景:智能问答

小米知识图谱的最重要的应用场景就是实时的人机智能问答,主要包括两种模式:一般问答模式和基于规则推理模式。在基于规则的推理中,同时还有多条件推理,多跳关系推理,还支持像求最大值,最小值这种基础推理算子。可以根据实际需求、应用场景和应用情况去选择,从而达到最好的问答效果。

3 实现流程与原理

小米对话包括以下四个模块,其原理图如下所示:

#mermaid-svg-ifvYHxOfYV0hF8kO .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .label text{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .node rect,#mermaid-svg-ifvYHxOfYV0hF8kO .node circle,#mermaid-svg-ifvYHxOfYV0hF8kO .node ellipse,#mermaid-svg-ifvYHxOfYV0hF8kO .node polygon,#mermaid-svg-ifvYHxOfYV0hF8kO .node path{fill:#ECECFF;stroke:#9370db;stroke-width:1px}#mermaid-svg-ifvYHxOfYV0hF8kO .node .label{text-align:center;fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .node.clickable{cursor:pointer}#mermaid-svg-ifvYHxOfYV0hF8kO .arrowheadPath{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .edgePath .path{stroke:#333;stroke-width:1.5px}#mermaid-svg-ifvYHxOfYV0hF8kO .flowchart-link{stroke:#333;fill:none}#mermaid-svg-ifvYHxOfYV0hF8kO .edgeLabel{background-color:#e8e8e8;text-align:center}#mermaid-svg-ifvYHxOfYV0hF8kO .edgeLabel rect{opacity:0.9}#mermaid-svg-ifvYHxOfYV0hF8kO .edgeLabel span{color:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .cluster rect{fill:#ffffde;stroke:#aa3;stroke-width:1px}#mermaid-svg-ifvYHxOfYV0hF8kO .cluster text{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO div.mermaidTooltip{position:absolute;text-align:center;max-width:200px;padding:2px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);font-size:12px;background:#ffffde;border:1px solid #aa3;border-radius:2px;pointer-events:none;z-index:100}#mermaid-svg-ifvYHxOfYV0hF8kO .actor{stroke:#ccf;fill:#ECECFF}#mermaid-svg-ifvYHxOfYV0hF8kO text.actor>tspan{fill:#000;stroke:none}#mermaid-svg-ifvYHxOfYV0hF8kO .actor-line{stroke:grey}#mermaid-svg-ifvYHxOfYV0hF8kO .messageLine0{stroke-width:1.5;stroke-dasharray:none;stroke:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .messageLine1{stroke-width:1.5;stroke-dasharray:2, 2;stroke:#333}#mermaid-svg-ifvYHxOfYV0hF8kO #arrowhead path{fill:#333;stroke:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .sequenceNumber{fill:#fff}#mermaid-svg-ifvYHxOfYV0hF8kO #sequencenumber{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO #crosshead path{fill:#333;stroke:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .messageText{fill:#333;stroke:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .labelBox{stroke:#ccf;fill:#ECECFF}#mermaid-svg-ifvYHxOfYV0hF8kO .labelText,#mermaid-svg-ifvYHxOfYV0hF8kO .labelText>tspan{fill:#000;stroke:none}#mermaid-svg-ifvYHxOfYV0hF8kO .loopText,#mermaid-svg-ifvYHxOfYV0hF8kO .loopText>tspan{fill:#000;stroke:none}#mermaid-svg-ifvYHxOfYV0hF8kO .loopLine{stroke-width:2px;stroke-dasharray:2, 2;stroke:#ccf;fill:#ccf}#mermaid-svg-ifvYHxOfYV0hF8kO .note{stroke:#aa3;fill:#fff5ad}#mermaid-svg-ifvYHxOfYV0hF8kO .noteText,#mermaid-svg-ifvYHxOfYV0hF8kO .noteText>tspan{fill:#000;stroke:none}#mermaid-svg-ifvYHxOfYV0hF8kO .activation0{fill:#f4f4f4;stroke:#666}#mermaid-svg-ifvYHxOfYV0hF8kO .activation1{fill:#f4f4f4;stroke:#666}#mermaid-svg-ifvYHxOfYV0hF8kO .activation2{fill:#f4f4f4;stroke:#666}#mermaid-svg-ifvYHxOfYV0hF8kO .mermaid-main-font{font-family:"trebuchet ms", verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .section{stroke:none;opacity:0.2}#mermaid-svg-ifvYHxOfYV0hF8kO .section0{fill:rgba(102,102,255,0.49)}#mermaid-svg-ifvYHxOfYV0hF8kO .section2{fill:#fff400}#mermaid-svg-ifvYHxOfYV0hF8kO .section1,#mermaid-svg-ifvYHxOfYV0hF8kO .section3{fill:#fff;opacity:0.2}#mermaid-svg-ifvYHxOfYV0hF8kO .sectionTitle0{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .sectionTitle1{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .sectionTitle2{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .sectionTitle3{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .sectionTitle{text-anchor:start;font-size:11px;text-height:14px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .grid .tick{stroke:#d3d3d3;opacity:0.8;shape-rendering:crispEdges}#mermaid-svg-ifvYHxOfYV0hF8kO .grid .tick text{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .grid path{stroke-width:0}#mermaid-svg-ifvYHxOfYV0hF8kO .today{fill:none;stroke:red;stroke-width:2px}#mermaid-svg-ifvYHxOfYV0hF8kO .task{stroke-width:2}#mermaid-svg-ifvYHxOfYV0hF8kO .taskText{text-anchor:middle;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .taskText:not([font-size]){font-size:11px}#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutsideRight{fill:#000;text-anchor:start;font-size:11px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutsideLeft{fill:#000;text-anchor:end;font-size:11px}#mermaid-svg-ifvYHxOfYV0hF8kO .task.clickable{cursor:pointer}#mermaid-svg-ifvYHxOfYV0hF8kO .taskText.clickable{cursor:pointer;fill:#003163 !important;font-weight:bold}#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutsideLeft.clickable{cursor:pointer;fill:#003163 !important;font-weight:bold}#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutsideRight.clickable{cursor:pointer;fill:#003163 !important;font-weight:bold}#mermaid-svg-ifvYHxOfYV0hF8kO .taskText0,#mermaid-svg-ifvYHxOfYV0hF8kO .taskText1,#mermaid-svg-ifvYHxOfYV0hF8kO .taskText2,#mermaid-svg-ifvYHxOfYV0hF8kO .taskText3{fill:#fff}#mermaid-svg-ifvYHxOfYV0hF8kO .task0,#mermaid-svg-ifvYHxOfYV0hF8kO .task1,#mermaid-svg-ifvYHxOfYV0hF8kO .task2,#mermaid-svg-ifvYHxOfYV0hF8kO .task3{fill:#8a90dd;stroke:#534fbc}#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutside0,#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutside2{fill:#000}#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutside1,#mermaid-svg-ifvYHxOfYV0hF8kO .taskTextOutside3{fill:#000}#mermaid-svg-ifvYHxOfYV0hF8kO .active0,#mermaid-svg-ifvYHxOfYV0hF8kO .active1,#mermaid-svg-ifvYHxOfYV0hF8kO .active2,#mermaid-svg-ifvYHxOfYV0hF8kO .active3{fill:#bfc7ff;stroke:#534fbc}#mermaid-svg-ifvYHxOfYV0hF8kO .activeText0,#mermaid-svg-ifvYHxOfYV0hF8kO .activeText1,#mermaid-svg-ifvYHxOfYV0hF8kO .activeText2,#mermaid-svg-ifvYHxOfYV0hF8kO .activeText3{fill:#000 !important}#mermaid-svg-ifvYHxOfYV0hF8kO .done0,#mermaid-svg-ifvYHxOfYV0hF8kO .done1,#mermaid-svg-ifvYHxOfYV0hF8kO .done2,#mermaid-svg-ifvYHxOfYV0hF8kO .done3{stroke:grey;fill:#d3d3d3;stroke-width:2}#mermaid-svg-ifvYHxOfYV0hF8kO .doneText0,#mermaid-svg-ifvYHxOfYV0hF8kO .doneText1,#mermaid-svg-ifvYHxOfYV0hF8kO .doneText2,#mermaid-svg-ifvYHxOfYV0hF8kO .doneText3{fill:#000 !important}#mermaid-svg-ifvYHxOfYV0hF8kO .crit0,#mermaid-svg-ifvYHxOfYV0hF8kO .crit1,#mermaid-svg-ifvYHxOfYV0hF8kO .crit2,#mermaid-svg-ifvYHxOfYV0hF8kO .crit3{stroke:#f88;fill:red;stroke-width:2}#mermaid-svg-ifvYHxOfYV0hF8kO .activeCrit0,#mermaid-svg-ifvYHxOfYV0hF8kO .activeCrit1,#mermaid-svg-ifvYHxOfYV0hF8kO .activeCrit2,#mermaid-svg-ifvYHxOfYV0hF8kO .activeCrit3{stroke:#f88;fill:#bfc7ff;stroke-width:2}#mermaid-svg-ifvYHxOfYV0hF8kO .doneCrit0,#mermaid-svg-ifvYHxOfYV0hF8kO .doneCrit1,#mermaid-svg-ifvYHxOfYV0hF8kO .doneCrit2,#mermaid-svg-ifvYHxOfYV0hF8kO .doneCrit3{stroke:#f88;fill:#d3d3d3;stroke-width:2;cursor:pointer;shape-rendering:crispEdges}#mermaid-svg-ifvYHxOfYV0hF8kO .milestone{transform:rotate(45deg) scale(0.8, 0.8)}#mermaid-svg-ifvYHxOfYV0hF8kO .milestoneText{font-style:italic}#mermaid-svg-ifvYHxOfYV0hF8kO .doneCritText0,#mermaid-svg-ifvYHxOfYV0hF8kO .doneCritText1,#mermaid-svg-ifvYHxOfYV0hF8kO .doneCritText2,#mermaid-svg-ifvYHxOfYV0hF8kO .doneCritText3{fill:#000 !important}#mermaid-svg-ifvYHxOfYV0hF8kO .activeCritText0,#mermaid-svg-ifvYHxOfYV0hF8kO .activeCritText1,#mermaid-svg-ifvYHxOfYV0hF8kO .activeCritText2,#mermaid-svg-ifvYHxOfYV0hF8kO .activeCritText3{fill:#000 !important}#mermaid-svg-ifvYHxOfYV0hF8kO .titleText{text-anchor:middle;font-size:18px;fill:#000;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO g.classGroup text{fill:#9370db;stroke:none;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);font-size:10px}#mermaid-svg-ifvYHxOfYV0hF8kO g.classGroup text .title{font-weight:bolder}#mermaid-svg-ifvYHxOfYV0hF8kO g.clickable{cursor:pointer}#mermaid-svg-ifvYHxOfYV0hF8kO g.classGroup rect{fill:#ECECFF;stroke:#9370db}#mermaid-svg-ifvYHxOfYV0hF8kO g.classGroup line{stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO .classLabel .box{stroke:none;stroke-width:0;fill:#ECECFF;opacity:0.5}#mermaid-svg-ifvYHxOfYV0hF8kO .classLabel .label{fill:#9370db;font-size:10px}#mermaid-svg-ifvYHxOfYV0hF8kO .relation{stroke:#9370db;stroke-width:1;fill:none}#mermaid-svg-ifvYHxOfYV0hF8kO .dashed-line{stroke-dasharray:3}#mermaid-svg-ifvYHxOfYV0hF8kO #compositionStart{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO #compositionEnd{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO #aggregationStart{fill:#ECECFF;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO #aggregationEnd{fill:#ECECFF;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO #dependencyStart{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO #dependencyEnd{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO #extensionStart{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO #extensionEnd{fill:#9370db;stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO .commit-id,#mermaid-svg-ifvYHxOfYV0hF8kO .commit-msg,#mermaid-svg-ifvYHxOfYV0hF8kO .branch-label{fill:lightgrey;color:lightgrey;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .pieTitleText{text-anchor:middle;font-size:25px;fill:#000;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .slice{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO g.stateGroup text{fill:#9370db;stroke:none;font-size:10px;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO g.stateGroup text{fill:#9370db;fill:#333;stroke:none;font-size:10px}#mermaid-svg-ifvYHxOfYV0hF8kO g.statediagram-cluster .cluster-label text{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO g.stateGroup .state-title{font-weight:bolder;fill:#000}#mermaid-svg-ifvYHxOfYV0hF8kO g.stateGroup rect{fill:#ECECFF;stroke:#9370db}#mermaid-svg-ifvYHxOfYV0hF8kO g.stateGroup line{stroke:#9370db;stroke-width:1}#mermaid-svg-ifvYHxOfYV0hF8kO .transition{stroke:#9370db;stroke-width:1;fill:none}#mermaid-svg-ifvYHxOfYV0hF8kO .stateGroup .composit{fill:white;border-bottom:1px}#mermaid-svg-ifvYHxOfYV0hF8kO .stateGroup .alt-composit{fill:#e0e0e0;border-bottom:1px}#mermaid-svg-ifvYHxOfYV0hF8kO .state-note{stroke:#aa3;fill:#fff5ad}#mermaid-svg-ifvYHxOfYV0hF8kO .state-note text{fill:black;stroke:none;font-size:10px}#mermaid-svg-ifvYHxOfYV0hF8kO .stateLabel .box{stroke:none;stroke-width:0;fill:#ECECFF;opacity:0.7}#mermaid-svg-ifvYHxOfYV0hF8kO .edgeLabel text{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .stateLabel text{fill:#000;font-size:10px;font-weight:bold;font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family)}#mermaid-svg-ifvYHxOfYV0hF8kO .node circle.state-start{fill:black;stroke:black}#mermaid-svg-ifvYHxOfYV0hF8kO .node circle.state-end{fill:black;stroke:white;stroke-width:1.5}#mermaid-svg-ifvYHxOfYV0hF8kO #statediagram-barbEnd{fill:#9370db}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-cluster rect{fill:#ECECFF;stroke:#9370db;stroke-width:1px}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-cluster rect.outer{rx:5px;ry:5px}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-state .divider{stroke:#9370db}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-state .title-state{rx:5px;ry:5px}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-cluster.statediagram-cluster .inner{fill:white}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-cluster.statediagram-cluster-alt .inner{fill:#e0e0e0}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-cluster .inner{rx:0;ry:0}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-state rect.basic{rx:5px;ry:5px}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-state rect.divider{stroke-dasharray:10,10;fill:#efefef}#mermaid-svg-ifvYHxOfYV0hF8kO .note-edge{stroke-dasharray:5}#mermaid-svg-ifvYHxOfYV0hF8kO .statediagram-note rect{fill:#fff5ad;stroke:#aa3;stroke-width:1px;rx:0;ry:0}:root{--mermaid-font-family: '"trebuchet ms", verdana, arial';--mermaid-font-family: "Comic Sans MS", "Comic Sans", cursive}#mermaid-svg-ifvYHxOfYV0hF8kO .error-icon{fill:#522}#mermaid-svg-ifvYHxOfYV0hF8kO .error-text{fill:#522;stroke:#522}#mermaid-svg-ifvYHxOfYV0hF8kO .edge-thickness-normal{stroke-width:2px}#mermaid-svg-ifvYHxOfYV0hF8kO .edge-thickness-thick{stroke-width:3.5px}#mermaid-svg-ifvYHxOfYV0hF8kO .edge-pattern-solid{stroke-dasharray:0}#mermaid-svg-ifvYHxOfYV0hF8kO .edge-pattern-dashed{stroke-dasharray:3}#mermaid-svg-ifvYHxOfYV0hF8kO .edge-pattern-dotted{stroke-dasharray:2}#mermaid-svg-ifvYHxOfYV0hF8kO .marker{fill:#333}#mermaid-svg-ifvYHxOfYV0hF8kO .marker.cross{stroke:#333}:root { --mermaid-font-family: "trebuchet ms", verdana, arial;} #mermaid-svg-ifvYHxOfYV0hF8kO {color: rgba(0, 0, 0, 0.75);font: ;}

语音识别
意图识别
实体查询
实体推荐1223

主要分为以下几步:

3.1 语音识别模块

输入内容:语音信息
输出内容:转换出的文本
主要作用:获得说话者的文字并进行初步清洗
关键技术:语音识别技术

3.2 意图识别模块

输入内容:文本
输出内容:基于知识图谱表示的用户的意图
主要作用:从文本中得到用户的意思
关键技术:分词、词法分析、意图表示和知识图谱匹配
实现过程:
这步主要分为以下三个过程
第1步:利用分词技术将输入的文本打散以取得核心词汇,同时结合词法分析获得词汇的属性;
第2步:对词汇进行语法分析,通过这些内容得到关键词汇;
第3步:利用知识图谱对关键词进行意图识别

3.3 实体查询模块

输入内容:基于知识图谱表示的用户的意图
输出内容:数据库检查到的一些查询信息
主要作用:在理解了用户的意图以后,通过合适的查询内容,在数据库中检索找到相应的信息
关键技术:数据库查询技术

3.4 实体推荐模块

输入内容:数据库检查到的一些查询信息
输出内容:更加丰富的数据信息
主要作用:结合知识图谱和推荐算法,对查询到的信息进行扩展,并最终返回给用户
关键技术:知识图谱搜索、实体嵌入和相关性算法。

4 三大关键技术

主要包括:

  • 特征提取:在机器学习、模式识别和图像处理中,特征提取从初始的一组测量数据开始,并建立旨在提供信息和非冗余的派生值(特征),从而促进后续的学习和泛化步骤,并且在某些情况下带来更好的可解释性。特征提取与降维有关,同时其特征的好坏对泛化能力有至关重要的影响。
  • 实体模板:对实体进行结构化定义,可以通过利用条件随机场等技术进行搜索。

4.1 实体链接:根据特征与实体模板进行关联。

实体链接 ( Entity Linking ),也叫实体链指,该任务要求我们将非结构化数据中的表示实体的词语(即所谓mention,对某个实体的指称项)识别出来,并将从知识库 (领域词库,知识图谱等) 中找到mention所表示的那一个实体所以实体链接的任务定义:就是给定文本mention,判定指代知识图谱中的实体首先第一个是实体链接 (Entity Linking)。比如说刘德华的天下无贼主题曲那一天是谁唱的,实体链接需要把刘德华,天下无贼,那一天三个mention联接到知识图谱的实体上,以方便应用到如主题分析,语义的信息检索等更深度的应用场景中。PS.小米知识图谱通过实体链接技术参加了2020CCKS(全国知识图谱与语义计算大赛2020),很荣幸拿到了总决赛的第一名,F1的值达到了0.8954。

4.2 知识整合

概念图谱的概挖掘目前小米图谱基本三种方式构建:本体模式层构建了分类体系、于autophrase的方法和基于序列标注的方法。这三种方法都是概念挖掘,对于实体与概念的关联,可以用实体分类的方法把模式层的与实体挂接,用实体链接的方法把开放词中的短语与体挂接。

4.3 自动化构建技术

一套完成的自动化构建技术,可以支持用户定制,自动实体化,自动实体关系等。

5 其他技术

包括BERT、CRF、中文的切词、命名实体识别、候选实体选取、实体消歧、实体排序、判空等。

参考数据

  • Vul. Sample CVE-2020-8597 Detail(需番强)
  • Huaun漏洞情报平台
  • 实体嵌入技术

[论文研读] 2021A01 知识图谱在小米的应用与探索相关推荐

  1. 领域应用 | 知识图谱在小米的应用与探索

    本文转载自公众号:DataFunTalk. 分享嘉宾:彭力 小米 编辑整理:马瑶 出品平台:DataFunTalk 导读:小米知识图谱于2017年创立,已支持公司了每天亿级的访问,已赋能小爱同学,小米 ...

  2. 【每周NLP论文推荐】 知识图谱重要论文介绍

    欢迎来到<每周NLP论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 知识图谱是NLP中非常重要的底层基础建筑. ...

  3. 论文小综 | 知识图谱表示学习中的零样本实体研究

    转载公众号 | 浙大KG 本文作者| 耿玉霞,浙江大学在读博士,主要研究方向为知识图谱.零样本学习及可解释性 前言 随着知识图谱表示学习算法的蓬勃发展,在各个领域中都得到了广泛的应用,如推荐系统.知识 ...

  4. 论文浅尝 | 知识图谱的不确定性衡量

    论文笔记整理:谭亦鸣,东南大学博士. 来源:Knowledge and Information Systems volume 62, pages611–637(2020) 链接:https://lin ...

  5. 论文浅尝 | 知识图谱中的链接预测:一种基于层次约束的方法

    论文笔记整理:张良,东南大学博士生,研究方向为知识图谱,自然语言处理. 链接:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber= ...

  6. 论文浅尝 | 知识图谱的单样本关系学习

    链接:http://cn.arxiv.org/pdf/1808.09040 动机 如今的知识图谱规模很大但是完成度不高,long-tail关系在知识图谱中很常见,之前致力于完善知识图谱的方法对每个关系 ...

  7. 论文浅尝 | 知识图谱问答中的层次类型约束主题实体识别

    Citation:Qiu, Y., Li, M., Wang, Y., Jia, Y., & Jin, X.(2018). Hierarchical Type Constrained Topi ...

  8. 知识图谱最新权威综述论文解读:知识图谱补全部分

    上期我们介绍了2020年知识图谱最新权威综述论文<A Survey on Knowledge Graphs: Representation, Acquisition and Applicatio ...

  9. 【论文笔记】知识图谱推理PRA——Relational retrieval using a combination of path-constrained random walks

    知识图谱的概念于2012年由谷歌提出,这篇文章虽然发表于2010年,但文章中的对于数据的使用已经接近知识图谱了.文章提出的PRA算法是知识图谱推理的早期探索,在RWR(重启随机游走算法)的基础上进行了 ...

最新文章

  1. 为什么python会火?看到这个几个与众不同的地方你就懂了!
  2. 14春计算机基础作业2,北语14春《计算机基础》作业2 答案.docx
  3. Python开发工具PyCharm个性化设置备份
  4. 转:线性代数知识汇总
  5. MongoDB Replication
  6. 如何在10亿个数中找到前1000大的数?
  7. python版本差异_npm install报错,不知道是系统差异还是node版本差异,跟python有关系?...
  8. 使用VLC Media Player 在Mac上修剪视频
  9. [单片机框架][bsp层][cx32l003][bsp_system_clock] clock配置和使用
  10. 初中计算机 课题研究,初中信息技术课题怎么做
  11. 带你撸一台免费云服务器
  12. 技术圈大佬,带你用技术赚到副业的第一桶金!
  13. 【Eureka】eureka的搭建注册(新手搭建,大佬见谅)
  14. OneNET麒麟座应用开发之九:与SD卡通讯并保存数据
  15. 微信小程序正式上线,服务端请求必须HTTPS
  16. IONIC中slides的使用(图片显示及其删除)
  17. 通过PyQt5+PyQtWebEngine+pyecharts建立自己的收入支出记账软件
  18. iOS集成Cordova开发教程遇到的问题
  19. Win10系统切换输入法快捷键设置方法
  20. 利用Pandas拆分Excel的单元格为多行并保留其他行的数据

热门文章

  1. F5 WMware虚拟机环境搭建-BIG-IP Virtual Edition 11.3.0
  2. ctfshow-misc入门 1-30
  3. 阿里云服务器ECS实例规格是什么意思?
  4. 网站知识基础+网站搭建方法
  5. 解决pip更新太慢或更新失败的问题
  6. 【智能ABC】WIN10智能ABC的替换方案
  7. 合并9856和972的ITGCC
  8. 【对讲机的那点事】玩对讲机你了解TETRA系统吗?
  9. 微信公众号、微信小程序的同时开发
  10. 收藏了很久的:5款电影网站!高清大片任意看!就没有找不到资源!