Atitit 语义网的实现技术 目录 1. 语义网概念及技术综述 1 2. 图2-1 语义网的体系结构 2 2.1. 第1层:基础层,主要包含Unicode和URI(Uniform resource
Atitit 语义网的实现技术
目录
1. 语义网概念及技术综述 1
2. 图2-1 语义网的体系结构 2
2.1. 第1层:基础层,主要包含Unicode和URI(Uniform resource identifier) 4
2.2. 第2层:句法层,核心是XML及相关规范 4
2.3. 第3层:资源描述框架,主要包括RDF及相关规范。 4
2.4. 第4层:本体层,即定义本体(Ontology)。该层在RDF的基础上定义了RDFS(RDF Schema)和OWL(Web Ontology Language) 4
2.5. 第5至7层分别是逻辑层(Logic)、验证层(Proof)、信任层(Trust)。 4
3. 发展历程 5
4. 关键技术 三大技术的支持,即XML、RDF和Ontology 5
5. 其他技术 5
5.1. 在RDFS/OWL之上,W3C还定义了规则互换格式(rule interchange format,RIF)和SWRL(Semantic Web Rule Language)来辅助推理。 6
5.2. RIF,规则语言 (rule interchange format,RIF 6
5.3. SWRL(Semantic Web Rule Language) 6
5.4. SPARQL是一种RDF查询语言。 6
5.5. 语义API是随着语义网的发展而发展的,这类网络服务以非结构化的文本作为输入,输出一些实体与关系。 6
6. Atitit 微格式microformats艾提拉总结 6
6.1. Microdata (HTML5) 7
7. 与知识管理 知识图谱关系 7
8. 基于语义网的应用,如通用及垂直搜索引擎、文本助理工具、个人信息管理系统、 7
9. ref 8
- 语义网概念及技术综述
摘要:语义网是现有万维网的变革与延伸,是Web of documents向Web of data的转变。它的目标是让计算机可以像人脑一样理解信息的含义,从而完成智能代理的功能。本文对语义网结构、相关技术、规范做了简要的综述,分析
语义网是一种使用可以被计算机理解的方式描述事物的网络,它的基本思想就是让机器或者设备能够自动识别和理解万维网上的内容,自动化地处理、集成来自不同数据源的数据[3],使得Web信息获取更为智能便捷。
尽管Web上存在海量的信息,但是当前的Web实际上只是一种面向人的存储和共享信息的媒介[4]。Web上的内容是提供给人而不是机器本身来理解和浏览的。由于Web内容没有采用形式化的表示方式,并且缺乏明确的语义信息,故而计算机“看到的”Web内容只是普通的二进制数据,对其内容无法进行识别。如果机器不能充分理解网页内容的含义,就无法实现Web内容的自动处理。
考虑到当前Web存在的上述问题,Berners-Lee提出了语义网。顾名思义,语义网是对现有Web增加了语义支持,它是现有万维网的延伸与变革,其目标是帮助机器在一定程度上理解Web信息的含义,使得高效的信息共享和机器智能协同成为可能。语义网将会为用户提供动态、主动的服务,从而更便于机器和机器、人和机器之间的对话及协同工作。简言之,语义网就是以Web数据的内容,即数据的语义为核心,用机器能够理解和处理的方式链接起来的海量分布式数据库
语义网(Semantic Web)的核心是:通过给万维网上的文档(如: HTML)增加能够被计算机所理解的语义(Meta data),从而使整个互联网成为一个通用的信息交换媒介。换言之,就是构建一个能够实现人与电脑无障碍沟通的智能网络。打破现阶段万维网面向文档、信息孤岛等问题
---------------------
体系结构
Berners-Lee提出了最初的语义网体系结构[5],随着人们对语义网的深入研究,语义网的体系结构也在不断地发展演变。图2-1给出了语义Web的体系结构,各层的功能自下而上逐渐增强。
- 图2-1 语义网的体系结构
- 第1层:基础层,主要包含Unicode和URI(Uniform resource identifier)
---------------------
- 第2层:句法层,核心是XML及相关规范
。XML是SGML(标准通用标记语言)的一个子集,它以一种自我描述的方式定义数据结构。在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的联系[4]。用户可以在XML中自由地定义标记名称及元素的层次结构。为了便于程序或其他用户能够正确处理用户定义的内容,XML还定义了命名空间(Name Space)和XML模式规范(XML Schema)以提供更好地XML文档服务。
- 第3层:资源描述框架,主要包括RDF及相关规范。
RDF是一种用于描述WWW上资源信息的通用框架,比如网页的内容、作者以及被创建和修改的日期等。RDF[7]本质上是一种数据模型,用主体(subject)、谓词或属性(predicate或property)、客体或属性值(object或property value)所构成的三元组来描述资源的元数据[8]。RDF也可以用于表达其它元数据,例如分子的结构、图书的书目信息等。正因为RDF的灵活性,它成为了诸如生物、化学等许多领域表达元数据的基本方法[11]。可以说,RDF已经成为知识表达的通用形式。如果把XML看成一种标准的元数据语法规范的话,那么RDF就可以看做一种标准的元数据语义描述规范。
- 第4层:本体层,即定义本体(Ontology)。该层在RDF的基础上定义了RDFS(RDF Schema)和OWL(Web Ontology Language)
帮助用户构建应用领域相关的轻量级的本体。RDFS和OWL定义了语义,可以支持机器在用RDFS和OWL描述的知识库和本体中进行推理[4],以达到语义网的目标。
- 第5至7层分别是逻辑层(Logic)、验证层(Proof)、信任层(Trust)。
逻辑层在前面各层的基础上进行逻辑推理操作。验证层根据逻辑陈述进行验证,以得出结论。信任层是语义网安全的组成部分,与加密不同的是,该层主要负责发布语义网所能支持的信任评估[4]。目前第6层和第7层正处于设想阶段
---------------------
- 发展历程
Rss
- 关键技术 三大技术的支持,即XML、RDF和Ontology
从图2-1不难看出,实现语义网需要三大技术的支持,即XML、RDF和Ontology。其中XML层作为句法层,RDF层作为数据层,Ontology层作为语义层。
- 其他技术
OWL弥补了RDFS的不足,运用人工智能(Artificial intelligence,AI)中的逻辑来赋予语义,支持多种形式的推理。在表达概念的语义灵活性、Web内容的机器可理解性等方面OWL比早前的XML、RDF、RDF-S等语言都要强。
- 在RDFS/OWL之上,W3C还定义了规则互换格式(rule interchange format,RIF)和SWRL(Semantic Web Rule Language)来辅助推理。
其中RIF支持在不同的规则格式里互操作
- RIF,规则语言 (rule interchange format,RIF
---------------------
- SWRL(Semantic Web Rule Language)
- SPARQL是一种RDF查询语言。
SPARQL可用于查询任何基于RDF的数据(也就是说,包括那些涉及到RDFS和OWL的声明)。要从语义网应用程序那里检索信息,查询语言是不可或缺的要素。
- 语义API是随着语义网的发展而发展的,这类网络服务以非结构化的文本作为输入,输出一些实体与关系。
例如路透社的Open Calais API,这项服务接受原始文本的输入,返回
- Atitit 微格式microformats艾提拉总结
目录
1.1. 微格式microformats(vCard(电子名片)和iCalendar hcard hCalendar 1
1.2. RSS 2
1.3. 微格式包括hAtom、hCard、Geo、hCalendar等。 2
1.4. hCard 微格式 3
1.5. Microdata (HTML5) 3
1.6. Poshformat POSH,POSH是Plain Old Semantic HTML的缩写, 4
1.7. 另外一个概念就是FreeFormat,在语义标注方面poshformat的理念和FreeFormat是相通的 4
– 一个在HTML5被提出的功能,增强微格式可用性
Microdata 可以作为语义网的实现技术,当然还有其他的实现技术,比如 Microformats、RDF 等,有兴趣的读者可以阅读参考资料中的资源。
- 与知识管理 知识图谱关系
知识管理这个领域,有个分支叫语义网,这两年就改了名字叫知识图谱
- 现在语义网领域已经改名叫知识图谱,下面说的内容对知识图谱也都是适用的
- 基于语义网的应用,如通用及垂直搜索引擎、文本助理工具、个人信息管理系统、
语义浏览工具等等,但在它们为大众所接受之前,还有很长的路要走。即便这些技术成功了,用户也不会有兴趣知道那背后使用了些什么技术。所以说在用户层面推广语义网技术是没什么前景的。
用户也不会有兴趣知道那背后使用了些什么技术。所以说在用户层面推广语义网技术是没什么前景的。
企业就不一样了,第一,企业比较习惯于技术方面的论调,对于它们来说,利用语义技术可以增加产品的智能程度,从而形成市场价值。“我们的产品更好更聪明,因为我们使用语义网”,听起来这对企业来说是一个很不错的宣传。
从企业层面来说,RDF解决了数据的互通性标准的问题。这个问题其实在软件行业的早期便已出现,你可以忘掉语义网,只把它看作是一个标准协议,一个使得两个程序可以互通信息的标准。这对企业来说无疑是极具价值的
- ref
(5条消息)语义网简介(非应用) - 咸鱼的小站 - CSDN博客.html
从语义网到知识图谱——语义技术工程化的回顾与反思 – 文因互联.html
Atitit 语义网的实现技术 目录 1. 语义网概念及技术综述 1 2. 图2-1 语义网的体系结构 2 2.1. 第1层:基础层,主要包含Unicode和URI(Uniform resource相关推荐
- 存储技术(一)-基本概念和技术发展
存储技术(一)-基本概念和技术发展 原创 大胖随笔5566 大胖随笔5566 7月12日(本人微信号文章) 一.发展的几个重要阶段 IT资源的三大基石:计算.存储和网络.存储主要负责的是数据存取. 存 ...
- 转载:语义网概念及技术综述
本文写的非常好,读之获益颇丰,故转载以便反复阅之. 原创链接为: https://blog.csdn.net/zpcandzhj/article/details/21827045 语义网概念及技术综述 ...
- 数据挖掘:概念与技术
<数据挖掘:概念与技术> 基本信息 原书名:Data Mining:Concepts and Techniques,Third Edition 作者: (美)Jiawei Han伊利诺伊大 ...
- 【网络】统一资源定位符 URL (Uniform Resource Locator)
统一资源定位符 (Uniform Resource Locator, URL) 是用于完整地描述Internet上网页和其他资源的地址的一种标识方法. Internet上的每一个网页都具有一个唯一的 ...
- 公网与私网的区别 ?如何进行通信?(NAT技术,端口映射技术,)
目录 一, 公网与私网介绍两者间的联系 二,公网ip与私有ip的区别 三,私有网络如何访问公有网络? 1,端口映射技术 2,nat技术 (网络地址转换 ) 五,VPN技术 六,总结概述 一, 公网与私 ...
- 红蓝对抗之隧道技术第一篇(内网穿透、端口映射端口转发、Netsh端口转发、CS正反向连接多层内网、Burp设置上游代理访问内网、MSF protfwd端口转发/重定向)
文章目录 隧道应用 端口映射&端口转发 Netsh端口转发 Netsh端口转发meterpreter CS正向连接多层内网 CS反向连接多层内网 Burp设置上游代理访问内网 MSF prot ...
- 理解URL(Uniform Resource Locator)
URL 是Uniform Resource Locator的首字母缩写词,是 Internet 上资源的引用(地址). 当我们在点击一个链接或在浏览器中输入网址时,就已经接触到URL了,只不过脑海没有 ...
- 黑马旅游网编写练习(5)--目录的分类展示功能
黑马旅游网编写练习(5)–目录的分类展示功能 我们已经把项目的结构进行了优化,接下来编写目录展示相关的功能,所以我们单独创建其文件,包含dao层,service层,以及web层,全部重新创建文件,封装 ...
- 酷壳网陈皓:由12306.cn谈谈网站性能技术
导读:关于铁道部的火车票网络订票系统,这些天招致的骂声不断,当然,除了发泄不满,更多的技术人员选择了献技献策,纷纷从自己专长的角度提出解决之法.本文作者更是从订票业务.前端性能优化技术.后端性能优化技 ...
- 百度网盘如何生成目录树结构?
下面这种就是类似的目录树结构: 使用教程 1.打开你的百度网盘的db缓存文件"BaiduYunCacheFileV0.db"!拷贝复制到"src文件夹下"! 2 ...
最新文章
- BI商业智能项目中的若干风险要素
- 设置VS2010中使用IntelliTrace来进行调试
- CTFshow 命令执行 web29
- Serverless 架构模式及演进
- 【Python】字符转换为 ASCII 码
- 管理全局包、缓存和临时文件夹
- 【C语言】第三章 基本运算与顺序结构 题解
- dsp广告和信息流广告区别_360展示广告与其他信息流平台的区别
- php+求日期,PHP 日期转换
- linux编程之指针
- Android仿人人客户端(v5.7.1)——点击左侧菜单栏中的Item切换视图
- 【转】让你的手机成为你的电脑摄像头
- 算法工程师面试:必备的机器学习、深度学习知识点
- 贪心算法之猴子吃香蕉(Monkeys and Bananas)
- 模拟网络丢包的linux,简述Linux模拟丢包
- sfc/Windows 资源保护找到了损坏文件但无法修复
- 前端屏幕尺寸和分辨率_移动端尺寸基础知识
- CoffeeScript
- 牛排生熟程度 英语说法
- Win10笔记本开热点供移动端连接后电脑无法连网