OpenKG地址:http://openkg.cn/dataset/ftho

开放许可协议:GPL 3.0

贡献者:武汉科技大学(高峰、郑丽丽、顾进广)


摘要

在此开放资源中,面对金融领域多元关系表示的困境和时序事件表示需求,我们以OWL语义为基础,结合金融领域专业知识,融合超图概念和事件5W(When,where,Why,What,WHo)定义构建了可通用化的金融时序超图本体模型(Finanical Temporal Hypergraph Ontology,FTHO)。

1. 前言:超图与事件表示

知识图谱以<s,p,o>三元组的形势存储数据,使用Ontology对知识框架进行描述,因为知识图谱灵活的图结构,近年来,基于其在金融领域智能问答、语义搜索、辅助决策、智能分析等应用得到了关注。

但在传统的图结构中,两点之间的连接只能表示一对节点之间的二元实体关联,这种结构对现实金融领域中复杂多元关系表示能力较弱,例如,金融领域的(债券)共同担保关系,若以普通图表示这种关系,则多个担保者之间的“共同”性被削弱。

同时,现有知识图谱以静态的实体为核心,世间万物瞬息变化,现实世界中不断在发生着各类事件,动态的事件为社会实践提供参考并承载更深层次的信息。例如,投资者要参考公司以往发生的事件来评估公司的投资风险;股价的多次涨跌可能有相同规律性。因此,对时序事件的通用化表示也是金融领域的重要需求。

基于现有问题,本文提出了金融时序超图表示模型,主要分为两点:一是将现实世界复杂多元关系抽象为拓扑结构,根据超图理论,结合OWL语义建立金融超图表示模型;二是结合事件五元组5W(When,where,Why,What,Who)定义,提出一种通用化时序事件表示模型。接下来,将依次对这两方面的相关工作进行介绍。

2. 资源构建及概况

金融时序超图FTHO表示模型分为超边模型、普通图拓扑表示模型和事件时序表示三个部分,将现实世界中的复杂多元关系抽象为拓扑结构,不仅兼容金融领域多元关系,同时以超图模式建立索引,提高检索效率。

(1)超边定义

超图中的超边是属于该边的普通任意数目节点的聚合,借鉴与RDF中容器的表示方法,根据超边内节点特性,将超边分为无序超边、有序超边和选择超边三类,分别基于rdf中的相应容器进行定义,如图1。

图1 金融时序超图中的超边定义

(2)构成超边的普通图拓扑结构

构成超图的普通边是具有传递性的边和具有共指性的边所形成的边的集合(子图),我们称这些普通边为“超边成份边”。超边成份边的传递性基于OWL提供的边的传递性(owl:TranstiveProperty)提供,共指性通过多边指向同一节点或来自同一节点得出。传递性边可形成链状子图或环状子图(图2a、2b),共指性边可形成星型内向子图或星型外向子图(图2c、2d)。同时,由于传递性边具有方向,其形成的链状或环状子图可能形成有序或无序超边(图3a、3b)。最后,根据传递性或共指性边是否可以存在于多个子图中,我们将构成超边的成份边分为融合成份边和共享成份边两类,其中融合成份边指其形成的链、环、星状子图中的任意一条成份边与其形成的超边之间不存在多对一关系(图4a);而共享成份边指其子图中的成份边与其形成的超边之间存在多对一关系,即成份边可为多个子图共享,如图4b中V2指向V7的成份边可为E1、E2、E3超边共享。

图2 普通图特殊拓扑结构

图3 普通图特殊拓扑结构构建超边

图4 融合超边和共享超边

根据构成超边拓扑结构的普通边特性,金融时序超图的超边成份边定义如图5所示

图5 金融时序超图的普通边定义

(3)事件时序表示

本文依据事件5W(When,Where,Why,Who,What)概念,将事件知识概括为事件元数据(包含时间信息在内)和事件内容两部分,其中事件元数据(包含事件概念本身)利用现有本体模型进行描述,包括使用GeoSparql来表示空间信息,使用OWL-Time来表示时间信息;而通过hasEventPayload用于描述事件内容,事件内容同样表示为一个无序集合(rdf:Bag),其中包含一系列的rdf:Statement用于表述事件知识,每个rdf:Statement使用三元组形式存储不可再分的事件原子内容。这样,事件的内容可以是任何三元组知识。金融时序超图事件时序表示模型如图6所示。

图6 金融时序超图事件时序表示模型

(4)实验验证

为验证FTHO模型的通用性和灵活性,我们记录了三个现实场景通过普通边方式和超边方式SPARQL检索所需要的时间,时间对比如图7所示。

图7 普通边与超边检索时间对比

3. 资源用途

对于构建后的资源,我们可以从以下几个方面进行利用:

(1)用于结合领域知识,标识金融领域中可以形成多元关系的各种二元关系;

(2)利用推理机,对标注为超边成分边的二元、时序关系进行推理,构建多元时序关系;

(3)结合金融领域风控等应用,实现基于多元时序金融知识的应用落地。

4. 总结

在本开放资源中,从金融领域实际应用场景出发,扩展现有知识图谱表示机制,构建了金融时序超图(FTHO)。将现实场景中复杂的多实体关联关系抽象为拓扑结构,并根据其结构特性,建立拓扑子图的二元构成边节点映射超边的规则集,其次,本文结合事件5W概念建立了通用化的金融时序事件表示模型。为金融领域多元、时序事件表示困境提供了解决方案,促进金融领域人工智能系统的进步。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

开源开放 | 一个融合多元关系和事件表示的金融领域本体模型FTHO(CCKS2021)相关推荐

  1. 开源开放 | 一个用于文言文实体识别与关系抽取等任务的开源数据集C-CLUE(CCKS2021)...

    OpenKG地址:http://openkg.cn/dataset/c-clue GitHub地址:https://github.com/jizijing/C-CLUE 网站地址:http://152 ...

  2. 开源开放 | 一个用于知识驱动的零样本学习研究的开源数据集KZSL(CCKS2021)

    OpenKG地址:http://openkg.cn/dataset/k-zsl GitHub地址:https://github.com/China-UK-ZSL/Resources_for_KZSL ...

  3. 开源开放 | 熵简科技 AI Lab 开源金融领域中文预训练语言模型 FinBERT

    1 背景及下载地址 为了促进自然语言处理技术在金融科技领域的应用和发展,熵简科技 AI Lab 近期开源了基于 BERT 架构的金融领域预训练语言模型 FinBERT 1.0.相对于Google发布的 ...

  4. 金融领域首个开源中文BERT预训练模型,熵简科技推出FinBERT 1.0

    出品 | AI科技大本营 头图 | CSDN付费下载于东方IC 为了促进自然语言处理技术在金融科技领域的应用和发展,熵简科技 AI Lab 近期开源了基于 BERT 架构的金融领域预训练语言模型 Fi ...

  5. 首个金融领域的开源中文预训练语言模型FinBERT了解下

    背景及下载地址 为了促进自然语言处理技术在金融科技领域的应用和发展,熵简科技 AI Lab 近期开源了基于 BERT 架构的金融领域预训练语言模型 FinBERT 1.0.据我们所知,这是国内首个在金 ...

  6. 开源开放 | 细粒度可循证医学文档知识融合表示和推理(CCKS2021)

    OpenKG地址:http://openkg.cn/dataset/mdo-dataset 开放许可协议:GPL 3.0 贡献者:武汉科技大学(高峰.龚珊珊.顾进广.徐芳芳) 摘要 本开放资源在医学文 ...

  7. 融合创新、开源开放、云智一体,百度智能云在数字时代全面开花

    数字化.网络化.智能化发展浪潮下,如何激发数据作为新生产要素的潜能.切实推动实体产业升级,成为社会各界关注焦点. 2021年4月25日,国家网信办.国家发改委.工信部.国务院国资委和福建省政府共同主办 ...

  8. 知识图谱开源开放及生态 | 7月12日TF65

    本期会议邀请到来自阿里巴巴等头部企业的代表,以及来自北京大学.南京大学和浙江大学的研究人员,一起深入探讨开放知识图谱.知识图谱开源工具等所面临的机遇和挑战,并进一步了解知识图谱开放和开源工具构建的应用 ...

  9. 会议交流 | 知识图谱开源开放及生态——7月12日TF65

    转载公众号 | 中国计算机学会 本期会议邀请到来自阿里巴巴等头部企业的代表,以及来自北京大学.南京大学和浙江大学的研究人员,一起深入探讨开放知识图谱.知识图谱开源工具等所面临的机遇和挑战,并进一步了解 ...

最新文章

  1. 解决react-router4在browserhistory路由下的nginx的白屏或者404问题
  2. Android消息处理系统——Looper、Handler、Thread(转载)
  3. BZOJ3709: [PA2014]Bohater
  4. Android:理想的框架开发母板——高焕堂
  5. Android通用开发笔记和高性能安卓开发框架源码
  6. Vue项目实战07:引入Normalize.css样式初始化
  7. 智能集群理论优化控制_探索群体智能的奥妙——ROB-MAS多智能体协作
  8. OGNL与Struts2标签展示页面(一)
  9. Deep Learning中的Attention Mechanism介绍
  10. Unhandled exception in MSDEV.EXE(DEVSHL.DLL) 0xC0000005 access violation
  11. iOS 之 OBJECTC 调用C、OBJECTC调用C++
  12. RSAC2020的PPT下载
  13. 证书错误:导航已阻止。此网站的安全证书有问题的解决办法
  14. 技巧:如何提高git下载速度
  15. 关于什么是AndroidX(一)
  16. openvswitch 实践一 创建patch port连接ovs两个桥
  17. Codeforces Round #490 (Div. 3) C. Alphabetic Removals
  18. 磅 英寸 厘米 dpi 像素
  19. 42表盘直径是从哪测量_手表尺寸怎么选择 手表尺寸怎么测量
  20. Visual studio 2015(VS2015)的下载和安装,以及安装VS2015中的C++

热门文章

  1. Parquet格式描述
  2. Qt值得学习吗?详解Qt的几种开发方式
  3. STM32项目(一) —— 展示车座椅
  4. 二十八、PHP框架Laravel学习笔记——模型的关联查询
  5. fastapi 请求体 - 多个参数 / 字段Field / 嵌套模型
  6. LeetCode 1679. K 和数对的最大数目(哈希)
  7. LeetCode MySQL 512. 游戏玩法分析 II
  8. LeetCode 609. 在系统中查找重复文件(哈希)
  9. LeetCode 1360. 日期之间隔几天(闰年判断)
  10. python重命名窗口_为《Python实现批量重命名》程序加一个GUI