转载公众号 | DataFunSummit


分享嘉宾:鲍捷博士 文因互联

编辑整理:松烨 博瑜科技

出品平台:DataFunTalk

导读:知识图谱标准件已经全面赋能主流金融场景,经历了7年时间的发展,在金融监管、银行、资管、证券等领域得到广泛应用。今天我们从时间的角度,详细介绍应用场景是如何一步一步演化出来的。

  • 2016年知识图谱在金融领域Big Bang

  • 2017年举办第一届金融知识图谱论坛

  • 2018年成立金融知识图谱工作组

  • 2019年金融知识图谱工作系列沙龙(如何破局)

  • 2020年理解四种自动化(手、眼、脑、心)

  • 2021年“知识”是企业数字化转型的核心基础设置

01

2016年知识图谱在金融领域Big Bang

2010年我们已经有很多如何把语义和金融融合在一起的想法,学术界已有很多方面的研究,2012年语义演化为知识图谱。

2016年3月9号AlphaGo打败了围棋冠军李世石,整个金融界完全被震撼,金融市场是程序化交易的天下,这一天成为知识图谱在金融领域的Big Bang,金融界有很多人提出了很多问题,问题大致分类如下:

2016年3月12日,我们组织国内第一次语义和金融两个领域的对话,“语义对话金融沙龙”。邀请了很多业内专家,一起探讨很多问题。

2016年3月国内几乎没有知识图谱的应用案例,我们的认知只在“创投类数据库”,能找到的案例只有少量的欧美应用案例:

2016年是Fintech上下半场的转折点,互联网金融向智能金融的演进,互联网金融主要是以P2P为主,上半场以金融为主,下半场以技术为主,不仅延伸以前那些场景,并且创造新场景。

金融IT化的过程分为四个阶段,分别是信息化、大数据化、自动化、智能化。前面20年时间已完成信息化和大数据化的建设,2010到2016的5年时间已完成一些简单的自动化。因此到了2016年,我们就考虑是否需要智能化。

智能化的本质是自动化处理“脑力体力劳动”,比如每天做财务报表来算账,属于重复的脑力体力劳动,可以自动化,但是如何去找到一个非常优质的投资机会不属于此类。我们怎么能够把人的洞察的能力用巨大的规模来实现,或者把社会的力量用机器的速度来实现,这就是智能化在金融里落地的核心,如何去自动化脑力体力劳动。

2016年是否要需要智能化,事实最终证明,2016年仍属于大数据化阶段,自动化是超前的,智能化更是超前的。

02 

2017年举办第一届金融知识图谱论坛

2017年3月我们在杭州大学组织第一届金融知识图谱论坛,由中文信息协会主办。

在本次会议上,中国中文信息学会常任理事,上交所前CEO白硕介绍NPL与知识图谱的对接;浙江大学教授陈华钧分享开放知识图谱的愿景和挑战。还邀请腾放、文飞翔、郭颖哲三位创投数据库领域的CEO分享了他们的成功案例。

1. 认知

2017年知识图谱的场景较2016年有大幅扩展,除了创投数据库之外,有了公众公司的基本面的数据库,行情数据库,特别值得指出,2017年我们文因互联负责完成上交所的公告摘要项目,是国家第一个采用自然语言处理进行上市公告。2017年证明可以用机器去做公告数据提取、研报数据提取,还有舆情数据提取。同时还有其他的数据提取,例如工商数据,也就是泛企业数据。

2. 应用

2017年知识图谱的应用系统丰富起来,看到传统数据终端可能会被替代,出现了金融搜索引擎、金融问答引擎、研报的公告摘要、脱水研报、脱水公告、自动化信贷流程,自动化评级流程,自动化写报告,自动化写新闻,自动化做审计等。

在2017年知识图谱在金融领域的建设过程总结为三句话:

• 天下难事,必做于易;天下大事,必做于细。金融知识图谱是一个很复杂的系统工程,中间可能需要先达到若干中间节点,而非一下子就能变魔术。

• 它可能催生新的应用,但一时难以在旧的金融体系内承载。

• 它需要金融人才和人工智能人才的密切交流,培养一种新的复合型人才。这些工作,都不是一两年就能完成的。

03

2018年成立金融知识图谱工作组

2018年在全国知识图谱与语义计算大会上成立金融知识图谱工作组,我们发现金融领域应用从利用技术角度可以分为四类:大数据技术、机器学习技术、文本处理技术,以及知识和规则技术。2016年以前我们基本以大数据技术和机器学习技术为主,在智能营销、智能支付、智能风控、智能投顾应用已经相比较成功。在智能监管、智能资管、智能审计、智能投研、智能客服应用遇到困难,难点在于结构化数据之前的文本信息,巧妇难为无米之炊。解决难点的关键是在提供优质的数据,必须解决文档自动化理解问题,成为整个行业的主旋律。

2018年客户提出非常多的需求,整个行业趋势总结为以下方面:

1. 认知

2018年的金融知识图谱比之前又丰富了很多。灰色部分是2017年的,黑色部分是2018年的。

2. 应用 

随着图谱的增强,应用也大大扩展,灰色部分是2017年的应用,黑色部分是2018年新增的应用。尤其是2018年前后,各种聊天机器人开始大量使用,降低了客服和营销成本。

2018年随着整个国家金融转型,在监管、基础数据、资管、咨询、研究、销售、投顾、会计、审计、投资等10大应用领域新增非常多的细分场景,具体场景如下:

04

2019年金融知识图谱工作系列沙龙——如何破局

2019年大家都在探索,还不知道商业化场景和真正的破局点在哪里?我们金融知识图谱工作组就组织一系列的会议和沙龙,金融界和技术界更加密切地进行交流。

2019年3月24日在国家金融发展实验室组织了金融制度论坛,主要讨论监管业务。

2019年4月13日普华永道中国会议讨论的更广的业务内容。

2019年配合CCKS2019的评测竞赛,我们和中南大学一起发布三项评测任务,评测任务代表自动化文本处理在金融领域已经开始进入主流视野。

我们认识到整个知识图谱其实是一个技术栈,不是一项技术,而是一堆技术的集合体,知识图谱不仅是图谱,是知识加上辅助,如下图的知识图谱金字塔:

规则、本体和模式这些工程就是知识,它们是非常重要的,在不同层级上对应金融领域里都有应用,例如证券领域要进行规则建设,实现大规模的合规和审批的流程自动化;银行中的信贷合规,信贷反欺诈的数据集成、风险图谱、自动化生成报表,都是有相应知识支撑的应用,本质上来说“知识的核心价值是驱动流程自动化”。

2019年出现了知识图谱的破局点,就是证监会发布监管3.0,一个纲领性的文件,提出了全覆盖,无死角建设监管体系。

证监会、银保监会都开始用机器自动进行监管,监管科技倒逼所有的金融机构进行流程的自动化,2019年7月知识图谱非常有效地支撑科创板审核的一些关键流程,中国第一次实现IPO审核中利用自然语言处理技术构造上市公司的知识图谱。我们在参与科创板知识图谱和2018年北交所构造股转中心第一套制度,我们在实现银行、交易所等机构的细分场景时,出现非常多的新型用户交互。

我们面临一些新的问题:数据结构化,数据如何呈现问题,还有各种细粒度的自动化监管问题。另外我们也开始发现了更多银行精细化运营的问题,包括集中作业问题、获客问题、客户防流失问题,所以很多细分场景如下:

05

2020年理解四种自动化(手、眼、脑、心)

知识图谱的核心不是图,更重要的是业务知识,能够帮助我们进行任务的自动化,从数据结构化的流程自动化到业务的服务化,再到服务的开发,分别对应手、眼、脑、心四种自动化。

四种自动化对应不同的应用场景,流程的自动化帮助我们提高产品质量,比如各种券商的IPO自动化写招股说明书,自动化审核。

06

2021年“知识”是企业数字化转型的核心基础设置

知识图谱的标准件已经全面赋能主流的金融城,包括监管、资管、保险、银行、证券和各种通用的这种领域里,现在都有相对成熟的金融制度的应用。未来到底是什么样,这其实是一个左右互搏的过程。

企业一直在做数字化转型,数字化转型的本质是企业都要一个CPU,上面都是各种核心的业务系统,包括BPM系统和ERP系统、CRM系统。传统企业的IT系统底层都是数据库,未来企业一定会发生巨大范式变迁,企业的核心资产是流程知识和业务知识。过去五年时间,我们看到金融企业在财务的知识、审核的知识、信贷的知识、风控的知识,都在不断的去沉淀。

不同的机构都在落地统一流程平台、数字化员工系统等,他们的本质上一个赋能的系统,底层要有知识库来管理大量的知识,然后上面不断赋能各种各样的应用。知识图谱在金融领域的价值已突显,应用场景也越来越清晰,未来将会有更多的场景出现,去探索。

今天的分享就到这里,谢谢大家。


分享嘉宾:


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

图谱实战 | ​鲍捷:知识图谱技术在金融领域的分析和应用相关推荐

  1. 鲍捷 | 知识图谱从 0 级到 10 级简化版

    本文转载自公众号:文因学堂. 文因学以前写过几个进阶指南,可能都太难,不接地气.这里重新写一个更实事求是.更便于工程落地的版本 0级:掌握正则表达式.SQL.JSON和一门支持if-then-else ...

  2. 知识图谱认知智能理论与实战----------第一章 知识图谱概述

    文章目录 一. 什么是知识图谱 二. DIKW模型 三. 知识图谱技术体系 四. 知识图谱辨析 I. 知识图谱与自然语言处理 II. 知识图谱与图数据库 III. 知识图谱与语义网络 IV. 知识图谱 ...

  3. 【知识图谱】通俗易懂的知识图谱技术

    [知识图谱]通俗易懂的知识图谱技术 一.知识图谱简介 二.知识图谱表示 三.知识图谱抽取 1. 实体命名识别(Name Entity Recognition) 2. 关系抽取(Relation Ext ...

  4. 【知识图谱】深入浅出讲解知识图谱(技术、构建、应用)

    本文收录于<深入浅出讲解自然语言处理>专栏,此专栏聚焦于自然语言处理领域的各大经典算法,将持续更新,欢迎大家订阅! 个人主页:有梦想的程序星空 个人介绍:小编是人工智能领域硕士,全栈工程师 ...

  5. 知识图谱实战应用15-知识图谱在生物基因学上的应用,实现基因与疾病关联查询

    大家好,我是微学AI,今天给大家介绍一下知识图谱实战应用15-知识图谱在生物基因学上的应用,实现基因与疾病关联查询.知识图谱在生物基因学中的应用非常广泛,可以帮助研究人员更好地理解和发现基因与疾病之间 ...

  6. 知识图谱实战应用16-知识图谱在化学物质结构上的应用,快速查找化学分子式与结构

    大家好,我是微学AI,今天给大家介绍一下知识图谱实战应用16-知识图谱在化学物质结构上的应用,快速查找化学分子式与结构.在化学领域,知识图谱可以应用于化学物质结构上.化学物质结构主要指分子结构和化学键 ...

  7. 知识图谱实战应用1-知识图谱的构建与可视化应用

    大家好,今天给大家带来知识图谱实战应用1-知识图谱的构建与可视化应用.知识图谱是一种概念模型,用于表示和组织实体之间的关系,从而实现大规模的语义查询和推理. 一.知识图谱的应用领域 1. 搜索引擎:知 ...

  8. 知识图谱实战应用2-知识图谱的知识融合与知识消歧

    大家好,我是微学AI,今天给大家带来知识图谱实战应用2-知识图谱的知识融合与知识消歧. 知识图谱是用于表示语义化信息的一种图形化知识表示形式,其中包含了大量的实体.属性和关系.由于知识图谱是由不同来源 ...

  9. 【知识图谱】知识推理,知识图谱里最“人工智能”的一段

    互联网时代,人类在与自然和社会的交互中生产了异常庞大的数据,这些数据中包含了大量描述自然界和人类社会客观规律有用信息.如何将这些信息有效组织起来,进行结构化的存储,就是知识图谱的内容. 知识图谱的难点 ...

最新文章

  1. ejb 3中bean的种类
  2. 【python】向上取整 向下取整
  3. R语言在可视化图像中添加文本(Adding Text to plot)
  4. 计算机端口封闭,如何查询局域网内被封的电脑端口?
  5. java gzip 多个文件_Java Zip多文件压缩和 GZIP压缩
  6. poj 3414 Pots-bfs
  7. python time库_python中time库的实例使用方法
  8. 不同应用系统之间数据交互的几种方式
  9. 水平面天文辐射网络模拟(基于ArcGIS)
  10. String类的编码和解码问题
  11. (转)多因子模型水平测试题
  12. 这7款文本编辑器,程序员都应该知道
  13. 随机生成器,从给定列表中随机抽取一个元素
  14. discuz制作自己的门户列表模板
  15. 你知道几种编程思想?
  16. 常见的qq在线客服代码
  17. 海思HI35xx平台软件开发快速入门之H264解码实例
  18. 用于商用微处理器的快速位收集、位分散和位置换指令(一)
  19. Using platform encoding GBK actually to copy filtered reso
  20. 中国互联网25年:成也资本,败也资本!

热门文章

  1. 密码错误频繁登录引发的“library cache lock”或“row cache lock”等待
  2. 如何运营个人技术博客
  3. 抖音小程序调起支付宝支付php微擎代码和HTML代码
  4. linux上好玩的东西
  5. 2021年中国3D+CAM软件市场趋势报告、技术动态创新及2027年市场预测
  6. Java 网络编程之swing图形化QQ聊天室
  7. [转] Real-World Concurrency
  8. Java 实现QQ聊天室
  9. 2022年安全员-A证考题及答案
  10. C语言:添加和显示,数据保存在文件中,下次打开可以获取之前录入的内容