本文转载自公众号:博文视点Broadview 。


互联网促成了大数据的集聚,大数据进而促进了人工智能算法的进步。近年来知识图谱作为AI领域底层技术被越来越多的人谈起。知识图谱的升温得益于新数据和新算法为规模化知识图谱构建提供了新的技术基础和发展条件,使得知识图谱构建的来源、方法和技术手段都发生了极大的变化。

知识图谱本身可以看作是一种新型的信息系统基础设施,旨在从数据中识别、发现和推断事物与概念之间的复杂关系,是事物关系的可计算模型。知识图谱最早的应用是提升搜索引擎的能力。随后,知识图谱在辅助智能问答、自然语言理解、大数据分析、推荐计算、物联网设备互联、可解释性人工智能等多个方面展现出丰富的应用价值。

知识图谱:事物关系的可计算模型

如果知识是人类进步的阶梯,知识图谱就是AI进步的阶梯。知识图谱作为知识的一种形式,已经在语义搜索、智能问答、数据分析、自然语言理解、视觉理解、物联网设备互联等多个方面发挥出越来越大的价值。AI浪潮愈演愈烈,而作为底层支撑的知识图谱赛道也从鲜有问津到缓慢升温,虽然还谈不上拥挤,但作为通往未来的必经之路,注定会走上风口。

为了帮助更多的人学习了解这项技术,由王昊奋、漆桂林、陈华钧等多位知识图谱专家合力编著的《知识图谱:方法、实践与应用》现已开放预售!

(点击封面了解详情)

通过本书,读者一方面可以系统性了解知识图谱的基本概念、发展历史和技术前沿,另一方面从工程实践的角度训练自己构建和应用知识图谱的实战能力。

本书适合有一定自然语言处理和机器学习基础,希望深入研究知识图谱的数据工程师、高校师生和研究者阅读。

  • 主 要 作 者 简 介

王昊奋

上海交通大学计算机博士。中文知识图谱zhishi.me创始人、OpenKG发起人之一、CCF理事、CCF术语审定工委主任、CCF TF执委、中文信息学会语言与知识计算专委会副秘书长、上海交通大学校友会AI分会秘书长。在知识图谱、问答系统和聊天机器人等诸多领域有丰富的研发经验。

漆桂林

东南大学计算机学院教授、东南大学认知智能研究所所长、南京柯基数据科技有限公司首席科学家、OpenKG发起人之一、中国中文信息学会语言与知识计算专业委员会副主任、中国科学技术情报学会知识组织专业委员会副主任、爱思唯尔(Elsevier)数据管理顾问委员会顾问、国际期刊 Journal of Data Intelligence 执行主编。科研成果在电力故障智能检测和知识推送、医药知识问答及网络安全态势感知系统等领域得到了实际应用。

陈华钧

浙江大学计算机科学与技术学院教授。浙江大学阿里巴巴知识引擎联合实验室负责人、浙江省大数据智能计算重点实验室副主任、中国人工智能学会知识工程与分布智能专业委员会副主任委员、中国中文信息学会语言与知识计算专业委员会副主任委员、OpenKG发起人。曾获国际语义网会议ISWC最佳论文奖。

  • 主 要 结 构
第1章  知识图谱概述 1

1.1  什么是知识图谱 1

1.2  知识图谱的发展历史 2

1.3  知识图谱的价值 5

1.4  国内外典型的知识图谱项目 9

1.5  知识图谱的技术流程 15

1.6  知识图谱的相关技术 19

1.7  本章小结 30

第2章  知识图谱表示与建模 40

2.1  什么是知识表示 40

2.2  人工智能早期的知识表示方法 43

2.3  互联网时代的语义网知识表示框架 48

2.4  常见开放域知识图谱的知识表示方法 64

2.5  知识图谱的向量表示方法 68

2.6  开源工具实践:基于Protégé的本体知识建模 77

2.7  本章小结 80

第3章  知识存储 82

3.1  知识图谱数据库基本知识 82

3.2  常见知识图谱存储方法 91

3.3  知识存储关键技术 121

3.4  开源工具实践 126

第4章  知识抽取与知识挖掘 133

4.2  面向非结构化数据的知识抽取 136

4.3  面向结构化数据的知识抽取 154

4.4  面向半结构化数据的知识抽取 161

4.5  知识挖掘 168

4.6  开源工具实践:基于DeepDive的关系抽取实践 178

第5章  知识图谱融合 184

5.1  什么是知识图谱融合 184

5.2  知识图谱中的异构问题 185

5.3  本体概念层的融合方法与技术 190

5.4  实例层的融合与匹配 236

5.5  开源工具实践:实体关系发现框架LIMES 266

5.6  本章小结 269

第6章  知识图谱推理 279

6.1  推理概述 279

6.2  基于演绎的知识图谱推理 283

6.3  基于归纳的知识图谱推理 306

6.4  知识图谱推理新进展 324

6.5  开源工具实践:基于Jena和Drools的知识推理实践 327

6.6  本章小结 329

第7章  语义搜索 334

7.1  语义搜索简介 334

7.2  结构化的查询语言 336

7.3  语义数据搜索 342

7.4  语义搜索的交互范式 348

7.5  开源工具实践 355

第8章  知识问答 366

8.1  知识问答概述 366

8.2  知识问答的分类体系 371

8.3  知识问答系统 376

8.4  知识问答的评价方法 386

8.5  KBQA前沿技术 392

8.6  开源工具实践 406

第9章  知识图谱应用案例 420

9.1  领域知识图谱构建的技术流程 420

9.2  领域知识图谱构建的基本方法 425

9.3  领域知识图谱的应用案例 428

9.4  本章小结 460


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

新书速递 | 《知识图谱:方法、实践与应用》相关推荐

  1. Python网络爬虫:利用正则表达式方法爬取‘’豆瓣读书‘’中‘’新书速递‘’条目

    1.简述:正则表达式是爬虫的方法之一,这里利用Requests库进行爬取,尽管Urllib也能进行爬取,但过程过于繁琐,在了解Urllib的爬取过程后,没有进行实战演练,但在学习了Requests的爬 ...

  2. 【知识图谱】 | 《知识图谱——方法、实践与应用》阅读笔记

    <知识图谱--方法.实践与应用>的阅读笔记 知识图谱--方法.实践与应用 第1章 知识图谱概述 1.1 什么是知识图谱 1.2 知识图谱的发展历史 1.3 知识图谱的价值 1.4 国内外典 ...

  3. 【新书速递】评分卡建模红宝书,夯实智能风控底座

    近些年来,智能风控技术在金融风险管理中的应用越来越广泛.智能风控利用金融大数据.机器学习.深度学习.强化学习.时序数据分析.异常检测.社交网络分析.图深度学习.知识图谱.自然语言处理.文本挖掘等智能分 ...

  4. 【新书速递】流量运营教科书

    在互联网时代,流量运营是企业的核心运营内容之一,包括流量获取和流量转化两个环节.前者负责把外部流量引入企业内部,后者负责转化流量并达成企业目标.<电商流量数据化运营>内容侧重于前者,通过数 ...

  5. 【新书速递】实用安全多方计算导论

    安全多方计算(MPC)是解决数据安全与隐私保护问题的关键安全数据交换技术,近年来发展迅速,但由于MPC涉及复杂的密码学和工程实现技术,行业长期缺乏同时具备MPC研究.应用和实现能力的综合性人才,这阻碍 ...

  6. 【新书速递】分布式事务开山之作,带你深入理解分布式事务

    随着互联网的不断发展,互联网企业的业务在飞速变化,推动着系统架构也在不断地发生变化.总体来说,系统架构大致经历了 单体应用架构→垂直应用架构→分布式架构→SOA架构→微服务架构的演变.如今微服务技术越 ...

  7. 【新书速递】解决方案架构师修炼之道

    技术领域的发展日新月异,IT专业人员为了自身的职业发展,必须与时俱进地掌握新技能.然而,在过去的十年中,这种快速变化的趋势已经在云计算领域中占据主导地位,成为"新常态".现在,几乎 ...

  8. 【新书速递】程序员必会的40种算法

    算法是计算科学的核心,在求解实际问题的过程中发挥着重要作用.程序员.算法设计师.架构师.数据分析师等信息技术相关从业人员都应学习算法设计基础知识,积累基础算法,掌握典型的机器学习算法.自然语言处理算法 ...

  9. 【新书速递】字节跳动、360的智能硬件产品经验总结

    近年来,互联网产品从0到1变得越来越简单,入行的门槛也越来越低.当下,硬件的制造成本变得越来越低,人工智能.5G.大数据.云计算等高新技术逐步成熟,结合了硬件和高新技术的IoT.AIoT等领域逐渐得到 ...

  10. 【新书速递】高效使用Greenplum

    Greenplum数据库是基于MPP架构的开源大数据平台,具有良好的弹性和线性扩展能力,内置并行存储.并行通信.并行计算和并行优化功能,兼容SQL标准,具有强大.高效的PB级数据存储.处理和实时分析能 ...

最新文章

  1. swift 多线程GCD和延时调用
  2. 用JS脚本进行页面元素控制
  3. POI如何自定义单元格背景颜色
  4. 从前序与中序遍历序列构造二叉树Python解法
  5. c ajax定时获取,ajax的定时调用每5秒调用一次
  6. dedecms 添加,编辑文章时 文章标题有字数限制的解决办法。
  7. Java中的enum详细解析------全面掌握Java的enum类
  8. linux 启动rsyslog服务_我的服务器怎么老这么慢,难道说是被挖矿了?linux开机启动项自查...
  9. 精简迅雷绿色单文件版
  10. Chrome将网页背景变成黑色(真正的夜间模式、深色模式)
  11. Window10 X64 安装TWinCat3
  12. oracle 批量修改同义词,Oracle批量创建同义词
  13. 高科技玩具这么无趣,为何还要鼓励孩子玩?
  14. 红糖水白糖水的转换--郝汉森
  15. sap增加税码注意事项,进项税调整SAP相应调整
  16. java怎么创建jsp文件怎么打开_Eclipse中怎么创建jsp文件?
  17. Scala-scalaMap转JSON字符串和javaMap
  18. 计算H时M分S秒以后是_最全的风机计算公式,学习了!
  19. MS-DOS 命令例子
  20. 网站服务器如何选择?

热门文章

  1. 周末,说下我喜欢的篮球
  2. 终极教程,带具体实验现象,1个GPIO控制2个LED显示4种状态,欢迎讨论!
  3. linux dump_stack
  4. Qt删除 空格/空白符
  5. jquery ajax 异步分页,jquery 分页 Ajax异步
  6. mysql 查询 集合_MySQL使用集合函数进行查询操作实例详解
  7. CPtrArray、CObArray类
  8. ERROR 2384 — [ main] o.s.boot.SpringApplication : Application run failed
  9. 数据结构之优先队列:优先队列的介绍与基础操作实现,Python代码实现——14
  10. qscrollarea 设置滚动位置_爱剪辑:影视剧滚动字幕片尾,效果竟然如此高端精美...