课程详情

课程名称:

《知识图谱》第一期

报名方式:

点击文末“阅读原文”,即可享受参团优惠报名哦!

主讲老师:

王昊奋  著名知识图谱专家

博士毕业于上海交通大学,CCF术语专委会执委,中文信息学会语言与知识计算委员会副秘书长,共发表75余篇高水平论文。中文知识图谱zhishi.me创始人,OpenKG联盟发起人之一,其带队构建的语义搜索系统在Billion Triple Challenge中荣获全球第2名;在著名的本体匹配竞赛OAEI的实体匹配任务中斩获得全球第1名。曾主持并参与多项国家自然科学基金、863重大专项和国家科技支撑项目,以学术负责人身份参与Paypal、Google、Intel、IBM、百度等企业的合作项目。

课程简介:

本次的知识图谱课程主要包括三大部分:

1.  知识图谱的工程方法论。指导学员了解并掌握知识图谱的基本概念和发展历史,梳理清知识图谱的技术体系,掌握知识图谱的核心技术原理,建立知识图谱工程的方法论思维。

2.   知识图谱的实战技术。从实战出发,围绕知识表示、知识抽取、语义搜索、知识问答、知识推理、知识融合等系统性介绍知识图谱相关的实战技术,使得学员具备研发知识图谱相关应用的基础能力。

3.  知识图谱的典型应用。结合医疗、金融、电商等实际应用场景,介绍知识图谱各个技术点的实际应用落地方式,使得学员具备结合自身背景开展知识图谱技术实践的应用能力。

面向人群:

1.  希望学习知识图谱的学生;2.  希望了解知识图谱实战技术的IT从业人员;3.  未来希望成为知识图谱工程师的求职者;4.  想在知识图谱方向进行深入研究者。

学习收益:

通过本课程的学习,学员将会收获:

1. 帮助学员系统性的掌握知识图谱的核心技术原理,结合近期研究成果,学习从基本概念到各个先进算法和技术的转化思路2. 了解国内外典型的开源知识库数据及技术资源3. 实践与理论结合,培养学员面对工程及学术问题的思考解决能力4. 基于百科知识进行各项核心技术的实例训练,并结合医疗、金融、电商等行业应用帮助学员快速积累知识图谱工程项目经验5. 对有志于从事知识问答工作或学术研究的学员,提供IBM Watson系统实现原理的讲解与指导

开课时间:

2017年10月24日

学习方式:

在线直播,共11次课,每次2小时

每周2次(周二、四,20:00 - 22:00)

直播后提供录制回放视频,可在线反复观看,有效期1年

课程大纲:

第一课:  知识图谱概论

1.  知识图谱的起源和历史
    2.  典型知识库项目简介
    3.  知识图谱应用简介
    4.  本次课程覆盖的主要范围:知识表示与建模、知识抽取与挖掘、知识存储、知识融合、知识推理、语义搜索、知识问答和行业知识图谱应用剖析等内容。
 
第二课:  知识表示与知识建模         
 
    1.  早期知识表示简介
    2.  基于语义网的知识表示框架
         a.  RDF和RDFS
         b.  OWL和OWL2 Fragments
         c.  SPARQL查询语言
         d.  Json-LD、RDFa、HTML5 MicroData等新型知识表示
    3.   典型知识库项目的知识表示
    4.   基于本体工具(Protege)的知识建模最佳实践
 
第三课:  知识抽取与挖掘I
 
    1.  知识抽取任务定义和相关比赛:实体识别、关系抽取和事件抽取
    2.  面向结构化数据(关系数据库)的知识抽取,包括D2RQ和R2RML等转换与映射规范与技术介绍
    3.  面向半结构化数据(Web tables, 百科站点等)的知识抽取
         a.  基于正则表达式的方法
         b.  Bootstrapping和Wrapper Induction介绍
    4.  实践展示:基于百科数据的知识抽取
     
第四课:  知识抽取与挖掘II
 
    1.  面向非结构化数据(文本)的知识抽取
         a.  基于本体的知识抽取,包括NELL和DeepDive系统介绍
         b.  开放知识抽取,包括TextRunner、Reverb和OLLIE等系统介绍
    2.  知识挖掘
         a.  知识内容挖掘:实体消歧与链接
         b.  知识结构挖掘:关联规则挖掘与社区发现
         c.  知识表示学习与链接预测,包括TransE和PRA等算法介绍    
 
第五课:  知识存储
 
    1.  基于关系数据库的存储设计,包括各种表设计和索引建立策略
    2.  基于RDF的图数据库介绍
         a.  开源数据库介绍:Apache Jena、Sesame、gStore、RDF-3X等
         b.  商业数据库介绍:Virtuoso、AllegroGraph、BlazeGraph等
    3.   原生图数据库介绍,包括Neo4j、OrientDB、Titan和Cayley等
    4.  实践展示:使用Apache Jena存储百科知识,并使用Fuseki构建图谱查询服务
 
第六课:  知识融合
 
    1.  知识融合任务定义和相关竞赛:本体对齐和实体匹配
    2.  本体对齐基本流程和常用方法
         a.  基于Linguistic的匹配
         b.  基于图结构的匹配
         c.  基于外部知识库的匹配
    3.  实体匹配基本流程和常用方法
         a.  基于分块的多阶段匹配
         b.  基于规则(配置或通过学习)的实体匹配
    4.  知识融合工具介绍:包括Falcon-AO、Silk、PARIS、DEDUPE、LIMES和KnowledgeVault
    5.  实践展示:使用Falcon-AO融合百度百科与维基百科中的知识
 
第七课:  知识推理
 
    1.  本体知识推理简介与任务分类,包括概念可满足性、概念包含、实例分类和一致性检测等
    2.  本体推理方法与工具介绍
         a.  基于Tableaux运算的方法:Fact++、Racer、Pellet和Hermit等
         b.  基于一阶查询重写的方法:Ontology-based Data Access的Ontop等
         c.  基于产生式规则的方法(如Rete):Jena、Sesame和OWLIM等
         d.  基于逻辑编程(如Datalog)改写的方法:KAON2和RDFox等
     3.  实践展示:使用Jena完成百科知识上的上下位推理、缺失类别补全和一致性检测等
 
第八课:  语义搜索
 
   1.  语义搜索概述,包括Knowledge Card、Rich Snippet、Facebook Graph Search等
   2.  基于语义标注的网页搜索
         a.  Web Data Commons项目介绍
         b.  排序算法介绍,扩展BM25
   3.  基于图谱的知识搜索
         a.  本体搜索(ontology lookup)
         b.  探索式知识检索,包括查询构造、结果排序和分面(facets)推荐
   4.  知识可视化,包括本体、查询、结果等的展现方式和可视化分析
   5.  实践展示:使用ElasticSearch实现百科数据的语义搜索
 
第九课: 知识问答I
 
    1.  知识问答概述和相关数据集(QALD和WebQuestions)
    2.  知识问答基本流程
    3.  知识问答主流方法介绍
         a.  基于模板的方法,包括模板定义、模板生成和模板匹配等步骤
         b.  基于语义解析的方法,包括资源映射,逻辑表达式候选生成与排序等
         c.  基于深度学习的方法
 
第十课:  知识问答II
 
    1.  IBM Watson问答系统及核心组件详细解读
         a.  问句理解
         b.  候选答案生成
         c.  基于证据的答案排序
    2.  实践展示:面向百科知识的问答baseline实现
 
第十一课:  行业知识图谱应用
 
    1.  行业知识图谱特点
    2.  行业知识图谱应用,包括金融、医疗、数字图书馆等领域应用
    3.  行业知识图谱构建与应用的挑战
    4.  行业知识图谱生命周期定义和关键组件

常见问题:

Q: 会有实际上机演示和动手操作吗?
A: 有,几乎每节课,老师均会准备上机演示部分,学员可以学习老师的实践经验。
Q: 参加本门课程有什么要求?
A: 有一定Python编程能力,有基本大学数学基础。

Q: 有课外学习资料吗?

A: 有,老师会根据情况提供讲义,并给出进阶学习资源与项目的建议。

Q: 本课程怎么答疑?
A: 推荐大家到小象问答社区(wenda.chinahadoop.cn)提问,方便知识的沉淀,老师会集中回答,不会因为QQ群信息刷屏而被老师错过。也会有专门的QQ班级群,同学们可以针对课上知识的问题,或者自己学习与动手实践中的问题,向老师提问,老师会进行相应解答。

Q:在哪里上课?

A:课程直播和回放都在小象学院官网(http://www.chinahadoop.cn)上进行,不需要其他直播软件;如果希望上下班路上观看,可以下载小象学院app进行缓存。

联系方式:

手机:17746593070

邮件:admin@chinahadoop.cn

网站:http://www.chinahadoop.cn

客服微信:17746593070



OpenKG.CN

中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击“阅读原文”,即可享受参团优惠报名哦!

课程 |《知识图谱》第一期相关推荐

  1. 腾讯云大学大咖分享 | 腾讯云知识图谱实践

    本文作者:腾讯云高级研究员 孟辉.毕业于中国科学院大学控制科学与工程系,具有丰富的机器学习与数据挖掘经验.加入腾讯云AI语义产品组后,主要负责知识图谱相关产品的研发与应用. 点击观看完整课程 知识图谱 ...

  2. 年前最后一期!知识图谱理论与实战(线下集训)

    随着人工智能走到台前,人们越来越意识到场景才是盘活存量数据.吸附和创造增量数据,最终产生更加强大智能的核心.数据驱动的人工智能正在朝着场景驱动的人工智能发展.如果要用数字化给一个行业赋能,那么机器首先 ...

  3. 线下课程推荐 | 知识图谱理论与实战:构建行业知识图谱 (第四期)

    知识,是智能的前提. 2012年,Google推出"Google Knowledge Graph",并利用其在搜索引擎中增强搜索结果,这便是"知识图谱"名称的由 ...

  4. 知识图谱前沿技术课程暨学术研讨会(武汉大学站)

    知识图谱作为大数据时代重要的知识表示方式之一,已经成为人工智能领域的一个重要支撑.4月28日,"武汉大学信息集成与应用实验室"与"复旦大学知识工场实验室"联合举 ...

  5. 暑期学校 | 东南大学2021年国际暑期学校项目:从感知理解到智能认知 (知识图谱及应用课程)...

    国际暑期学校开课啦   项目介绍       从感知理解到智能认知 --走近新一代人工智能 From perceptual understanding to intelligent cognition ...

  6. 研讨会 | 知识图谱前沿技术课程暨学术研讨会(武汉大学站)

     知识图谱作为大数据时代重要的知识表示方式之一,已经成为人工智能领域的一个重要支撑.4月28日,"武汉大学信息集成与应用实验室"与"复旦大学知识工场实验室"联合 ...

  7. 斯坦福大学CS520知识图谱系列课程学习笔记:第三讲高级的知识图谱是什么样的

    这一讲的主题是:一些高级的知识图谱是什么样的.三位讲者分别从他们各自带领的团队构建出来的高质量的知识图谱实例出发,从中我们可以认识到一些大佬们构建的优秀的知识图谱产品有哪些特点和优势,从中对我们自己构 ...

  8. 斯坦福大学CS520知识图谱系列课程学习笔记:第二讲如何构建知识图谱

    上一讲我们学习了知识图谱的一些基本概念: 斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱 本节课程关于如何构建知识图谱,因为知识图谱的构建是整个知识图谱领域的一个非常核心且基础的工 ...

  9. 对知识图谱的告白:斯坦福大学CS520课程介绍

    斯坦福大学CS520知识图谱系列课程,从这个课程的编号就足以看出对计算机科学的告白. 相信大家对斯坦福大学的计算机学科公开课一点也不陌生,对很多人来说,面向计算机视觉的CS231n和面向自然语言处理的 ...

最新文章

  1. 将文本随意插入网页表单的 textarea
  2. Spring如何加载XSD文件(org.xml.sax.SAXParseException: Failed to read schema document错误的解决方法)...
  3. 【文件格式问题】文件格式 Windows、Unix/Linux、Mac 导致的问题及处理(idea 或 notepad++ 档案格式转换方法)
  4. 心得复述知识体系:《强化学习》中的蒙特卡洛方法 Monte Carlo Methods in Reinforcement Learning
  5. Kubernetes中的nodePort,targetPort,port的区别和意义(转)
  6. 获取指定年份至今年分列表
  7. Go 开发关键技术指南 | 带着服务器编程金刚经走进 2020 年
  8. 有关设计网站的收藏集合
  9. Word如何快速打出公式
  10. python画球面投影_球面投影图片 python opencv实现[附代码]
  11. Student数据库创建
  12. Android系统音乐界面UI设计,40款音乐APP界面UI设计欣赏
  13. Workfine5.0扩展功能——如何识别身份证信息?
  14. Pytest 如何组织冒烟测试及执行冒烟用例
  15. 杭州职业技术学院计算机教研室主任,课题名称杭州地区农村小学教师运用现代教育技术现状调查和对策的研究.doc...
  16. iphone复制不能全选_iphone长按键盘进行复制、粘贴、全选操作技巧
  17. 蒲公英 · JELLY技术周刊 Vol.12 尤雨溪新作 Vite, 你会支持么?
  18. Command——SQL
  19. OpenLayers入门,使用OpenLayers叠加多边形、圆形、线段和点要素到地图上
  20. 计算机网卡与路由器之间线路连接存在故障,win10的系统,有线连接以太网,一直显示的是无法识别的网络,怎么办!!...

热门文章

  1. 一文读懂 | CPU负载均衡实现
  2. 记一次和摄像头的摩擦经历
  3. Linux 内核系统架构
  4. hp-socket 文本跟图片同时发送_文本、截图和应用,这样「包装」一秒变美观
  5. ik分词和jieba分词哪个好_Python 中文 文本分析 实战:jieba分词+自定义词典补充+停用词词库补充+词频统计...
  6. python loads_python dumps和loads区别详解
  7. python turtle 怎么设计背景颜色_Python, turtle海龟作图,如何添加背景图片?
  8. python 3d渲染_python老司机带你玩玩炫酷的3D渲染,酷毙了!
  9. 爬虫实战学习笔记_7 【实战】模拟下载页面视频(模板)
  10. k1658停运到什么时候_春节网购别被商家忽悠!春节快递不停运,但价格会和平时不一样...