转载公众号 | DataFunSummit


分享嘉宾:鲍捷博士 文因互联

编辑整理:松烨 博瑜科技

出品平台:DataFunTalk

导读:知识图谱标准件已经全面赋能主流金融场景,经历了7年时间的发展,在金融监管、银行、资管、证券等领域得到广泛应用。今天我们从时间的角度,详细介绍应用场景是如何一步一步演化出来的。

  • 2016年知识图谱在金融领域Big Bang

  • 2017年举办第一届金融知识图谱论坛

  • 2018年成立金融知识图谱工作组

  • 2019年金融知识图谱工作系列沙龙(如何破局)

  • 2020年理解四种自动化(手、眼、脑、心)

  • 2021年“知识”是企业数字化转型的核心基础设置

01

2016年知识图谱在金融领域Big Bang

2010年我们已经有很多如何把语义和金融融合在一起的想法,学术界已有很多方面的研究,2012年语义演化为知识图谱。

2016年3月9号AlphaGo打败了围棋冠军李世石,整个金融界完全被震撼,金融市场是程序化交易的天下,这一天成为知识图谱在金融领域的Big Bang,金融界有很多人提出了很多问题,问题大致分类如下:

2016年3月12日,我们组织国内第一次语义和金融两个领域的对话,“语义对话金融沙龙”。邀请了很多业内专家,一起探讨很多问题。

2016年3月国内几乎没有知识图谱的应用案例,我们的认知只在“创投类数据库”,能找到的案例只有少量的欧美应用案例:

2016年是Fintech上下半场的转折点,互联网金融向智能金融的演进,互联网金融主要是以P2P为主,上半场以金融为主,下半场以技术为主,不仅延伸以前那些场景,并且创造新场景。

金融IT化的过程分为四个阶段,分别是信息化、大数据化、自动化、智能化。前面20年时间已完成信息化和大数据化的建设,2010到2016的5年时间已完成一些简单的自动化。因此到了2016年,我们就考虑是否需要智能化。

智能化的本质是自动化处理“脑力体力劳动”,比如每天做财务报表来算账,属于重复的脑力体力劳动,可以自动化,但是如何去找到一个非常优质的投资机会不属于此类。我们怎么能够把人的洞察的能力用巨大的规模来实现,或者把社会的力量用机器的速度来实现,这就是智能化在金融里落地的核心,如何去自动化脑力体力劳动。

2016年是否要需要智能化,事实最终证明,2016年仍属于大数据化阶段,自动化是超前的,智能化更是超前的。

02 

2017年举办第一届金融知识图谱论坛

2017年3月我们在杭州大学组织第一届金融知识图谱论坛,由中文信息协会主办。

在本次会议上,中国中文信息学会常任理事,上交所前CEO白硕介绍NPL与知识图谱的对接;浙江大学教授陈华钧分享开放知识图谱的愿景和挑战。还邀请腾放、文飞翔、郭颖哲三位创投数据库领域的CEO分享了他们的成功案例。

1. 认知

2017年知识图谱的场景较2016年有大幅扩展,除了创投数据库之外,有了公众公司的基本面的数据库,行情数据库,特别值得指出,2017年我们文因互联负责完成上交所的公告摘要项目,是国家第一个采用自然语言处理进行上市公告。2017年证明可以用机器去做公告数据提取、研报数据提取,还有舆情数据提取。同时还有其他的数据提取,例如工商数据,也就是泛企业数据。

2. 应用

2017年知识图谱的应用系统丰富起来,看到传统数据终端可能会被替代,出现了金融搜索引擎、金融问答引擎、研报的公告摘要、脱水研报、脱水公告、自动化信贷流程,自动化评级流程,自动化写报告,自动化写新闻,自动化做审计等。

在2017年知识图谱在金融领域的建设过程总结为三句话:

• 天下难事,必做于易;天下大事,必做于细。金融知识图谱是一个很复杂的系统工程,中间可能需要先达到若干中间节点,而非一下子就能变魔术。

• 它可能催生新的应用,但一时难以在旧的金融体系内承载。

• 它需要金融人才和人工智能人才的密切交流,培养一种新的复合型人才。这些工作,都不是一两年就能完成的。

03

2018年成立金融知识图谱工作组

2018年在全国知识图谱与语义计算大会上成立金融知识图谱工作组,我们发现金融领域应用从利用技术角度可以分为四类:大数据技术、机器学习技术、文本处理技术,以及知识和规则技术。2016年以前我们基本以大数据技术和机器学习技术为主,在智能营销、智能支付、智能风控、智能投顾应用已经相比较成功。在智能监管、智能资管、智能审计、智能投研、智能客服应用遇到困难,难点在于结构化数据之前的文本信息,巧妇难为无米之炊。解决难点的关键是在提供优质的数据,必须解决文档自动化理解问题,成为整个行业的主旋律。

2018年客户提出非常多的需求,整个行业趋势总结为以下方面:

1. 认知

2018年的金融知识图谱比之前又丰富了很多。灰色部分是2017年的,黑色部分是2018年的。

2. 应用 

随着图谱的增强,应用也大大扩展,灰色部分是2017年的应用,黑色部分是2018年新增的应用。尤其是2018年前后,各种聊天机器人开始大量使用,降低了客服和营销成本。

2018年随着整个国家金融转型,在监管、基础数据、资管、咨询、研究、销售、投顾、会计、审计、投资等10大应用领域新增非常多的细分场景,具体场景如下:

04

2019年金融知识图谱工作系列沙龙——如何破局

2019年大家都在探索,还不知道商业化场景和真正的破局点在哪里?我们金融知识图谱工作组就组织一系列的会议和沙龙,金融界和技术界更加密切地进行交流。

2019年3月24日在国家金融发展实验室组织了金融制度论坛,主要讨论监管业务。

2019年4月13日普华永道中国会议讨论的更广的业务内容。

2019年配合CCKS2019的评测竞赛,我们和中南大学一起发布三项评测任务,评测任务代表自动化文本处理在金融领域已经开始进入主流视野。

我们认识到整个知识图谱其实是一个技术栈,不是一项技术,而是一堆技术的集合体,知识图谱不仅是图谱,是知识加上辅助,如下图的知识图谱金字塔:

规则、本体和模式这些工程就是知识,它们是非常重要的,在不同层级上对应金融领域里都有应用,例如证券领域要进行规则建设,实现大规模的合规和审批的流程自动化;银行中的信贷合规,信贷反欺诈的数据集成、风险图谱、自动化生成报表,都是有相应知识支撑的应用,本质上来说“知识的核心价值是驱动流程自动化”。

2019年出现了知识图谱的破局点,就是证监会发布监管3.0,一个纲领性的文件,提出了全覆盖,无死角建设监管体系。

证监会、银保监会都开始用机器自动进行监管,监管科技倒逼所有的金融机构进行流程的自动化,2019年7月知识图谱非常有效地支撑科创板审核的一些关键流程,中国第一次实现IPO审核中利用自然语言处理技术构造上市公司的知识图谱。我们在参与科创板知识图谱和2018年北交所构造股转中心第一套制度,我们在实现银行、交易所等机构的细分场景时,出现非常多的新型用户交互。

我们面临一些新的问题:数据结构化,数据如何呈现问题,还有各种细粒度的自动化监管问题。另外我们也开始发现了更多银行精细化运营的问题,包括集中作业问题、获客问题、客户防流失问题,所以很多细分场景如下:

05

2020年理解四种自动化(手、眼、脑、心)

知识图谱的核心不是图,更重要的是业务知识,能够帮助我们进行任务的自动化,从数据结构化的流程自动化到业务的服务化,再到服务的开发,分别对应手、眼、脑、心四种自动化。

四种自动化对应不同的应用场景,流程的自动化帮助我们提高产品质量,比如各种券商的IPO自动化写招股说明书,自动化审核。

06

2021年“知识”是企业数字化转型的核心基础设置

知识图谱的标准件已经全面赋能主流的金融城,包括监管、资管、保险、银行、证券和各种通用的这种领域里,现在都有相对成熟的金融制度的应用。未来到底是什么样,这其实是一个左右互搏的过程。

企业一直在做数字化转型,数字化转型的本质是企业都要一个CPU,上面都是各种核心的业务系统,包括BPM系统和ERP系统、CRM系统。传统企业的IT系统底层都是数据库,未来企业一定会发生巨大范式变迁,企业的核心资产是流程知识和业务知识。过去五年时间,我们看到金融企业在财务的知识、审核的知识、信贷的知识、风控的知识,都在不断的去沉淀。

不同的机构都在落地统一流程平台、数字化员工系统等,他们的本质上一个赋能的系统,底层要有知识库来管理大量的知识,然后上面不断赋能各种各样的应用。知识图谱在金融领域的价值已突显,应用场景也越来越清晰,未来将会有更多的场景出现,去探索。

今天的分享就到这里,谢谢大家。


分享嘉宾:


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

图谱实战 | ​鲍捷:知识图谱技术在金融领域的分析和应用相关推荐

  1. 鲍捷 | 知识图谱从 0 级到 10 级简化版

    本文转载自公众号:文因学堂. 文因学以前写过几个进阶指南,可能都太难,不接地气.这里重新写一个更实事求是.更便于工程落地的版本 0级:掌握正则表达式.SQL.JSON和一门支持if-then-else ...

  2. 知识图谱认知智能理论与实战----------第一章 知识图谱概述

    文章目录 一. 什么是知识图谱 二. DIKW模型 三. 知识图谱技术体系 四. 知识图谱辨析 I. 知识图谱与自然语言处理 II. 知识图谱与图数据库 III. 知识图谱与语义网络 IV. 知识图谱 ...

  3. 【知识图谱】通俗易懂的知识图谱技术

    [知识图谱]通俗易懂的知识图谱技术 一.知识图谱简介 二.知识图谱表示 三.知识图谱抽取 1. 实体命名识别(Name Entity Recognition) 2. 关系抽取(Relation Ext ...

  4. 【知识图谱】深入浅出讲解知识图谱(技术、构建、应用)

    本文收录于<深入浅出讲解自然语言处理>专栏,此专栏聚焦于自然语言处理领域的各大经典算法,将持续更新,欢迎大家订阅! 个人主页:有梦想的程序星空 个人介绍:小编是人工智能领域硕士,全栈工程师 ...

  5. 知识图谱实战应用15-知识图谱在生物基因学上的应用,实现基因与疾病关联查询

    大家好,我是微学AI,今天给大家介绍一下知识图谱实战应用15-知识图谱在生物基因学上的应用,实现基因与疾病关联查询.知识图谱在生物基因学中的应用非常广泛,可以帮助研究人员更好地理解和发现基因与疾病之间 ...

  6. 知识图谱实战应用16-知识图谱在化学物质结构上的应用,快速查找化学分子式与结构

    大家好,我是微学AI,今天给大家介绍一下知识图谱实战应用16-知识图谱在化学物质结构上的应用,快速查找化学分子式与结构.在化学领域,知识图谱可以应用于化学物质结构上.化学物质结构主要指分子结构和化学键 ...

  7. 知识图谱实战应用1-知识图谱的构建与可视化应用

    大家好,今天给大家带来知识图谱实战应用1-知识图谱的构建与可视化应用.知识图谱是一种概念模型,用于表示和组织实体之间的关系,从而实现大规模的语义查询和推理. 一.知识图谱的应用领域 1. 搜索引擎:知 ...

  8. 知识图谱实战应用2-知识图谱的知识融合与知识消歧

    大家好,我是微学AI,今天给大家带来知识图谱实战应用2-知识图谱的知识融合与知识消歧. 知识图谱是用于表示语义化信息的一种图形化知识表示形式,其中包含了大量的实体.属性和关系.由于知识图谱是由不同来源 ...

  9. 【知识图谱】知识推理,知识图谱里最“人工智能”的一段

    互联网时代,人类在与自然和社会的交互中生产了异常庞大的数据,这些数据中包含了大量描述自然界和人类社会客观规律有用信息.如何将这些信息有效组织起来,进行结构化的存储,就是知识图谱的内容. 知识图谱的难点 ...

最新文章

  1. R语言使用caret包构建随机森林模型(random forest)构建回归模型、通过method参数指定算法名称、通过ntree参数指定随机森林中树的个数
  2. py2exe打包python_和python爱好者谈谈如何在新版python中使用py2exe打包可执行程序
  3. 监控系统简介:使用 Prometheus 与 Grafana
  4. JS高级——深入剖析函数中的this指向问题
  5. php swoole 心跳,聊聊swoole的心跳
  6. CodeIgniter中URL含有中文字符串的解决方案
  7. 渗透测试入门25之一次完整的渗透测试实验
  8. 切记!节前给数据库做个巡检
  9. C# 让你解决方案乱七八糟的DLL放入指定文件夹
  10. 天猫二面:内存耗尽后 Redis 会发生什么?
  11. OrCAD/Pspice元件库说明
  12. 中国象棋棋谱棋书链接
  13. 传统蓝牙HCI连接的流程介绍
  14. 天耀18期 -09.数组【作业】.
  15. 编译hostapd时,出现错误:/usr/bin/ld: cannot find -lnl
  16. 《少年维特之烦恼》经典语录:残冬行将消失,春天恍若来临。
  17. 计算机二级c语言模拟上机,计算机二级C语言上机模拟题
  18. 【收藏】Mimics Lnnovation Suite之导出功能
  19. 自贸港有志青年,捂碳星球旧衣回收项目,成功引起团中央的重视
  20. cocos2dx-html5 实现网页版flappy bird游戏

热门文章

  1. 京东智能客服言犀意图体系搭建和意图识别技术介绍
  2. 掘金秋招征文大赛评选结果
  3. c语言打开一个html文件路径,C语言文件处理 -C语言文件的打开和关闭
  4. 寻找技术KOL | IOST技术征文计划
  5. 浅析HDMI、DP、雷电接口优缺点
  6. log夹逼法定位core, 可能存在问题
  7. 【温故知新】——HTML5重要知识点复习
  8. 【华为OD机试模拟题】用 C++ 实现 - 求解连续数列+和最大子矩阵(2023.Q1 双倍快乐)
  9. ieee 754四字节转浮点数c语言实现,IEEE-754标准浮点数,十六进制与十进制转换方法(附C代码)...
  10. go语言实现发送QQ邮箱