©PaperWeekly 原创 · 作者|桑运鑫

学校|上海交通大学硕士生

研究方向|图神经网络在金融领域的应用

本文主要回顾三篇将图和知识图谱应用到量化交易上的文章。

NeurIPS 2019

论文标题:Exploring Graph Neural Networks for Stock Market Predictions with RollingWindow Analysis

论文来源:NeurIPS 2019

论文链接:https://arxiv.org/abs/1909.10660

这篇文章指出除了从股票的历史交易数据中产生的各种指标,专业的投资者在选择股票时还会考虑与该股票相关的企业,比如供应商、消费者、股份持有者等,我们应该想办法将这些信息利用起来用于股价预测。那么到了需要建模这种图关系数据的时候,自然就轮到图神经网络出场了。

对于一个图而言,最重要的就是点的表示和边的构建。

在点的方式方面,作者使用 LSTM 从原始的技术因子中生成结点的 embedding。

论文将企业间的关系分为下面七类。其中第一序列关系(first order)是两个企业间的直接关系,但这种关系是比较稀疏的,并且已经被股票投资者广泛使用了。第二序列关系则是将具有共同特点的两个企业连接起来。

最后将构建好的图通过一种称为 Temporal graph convolution 的方式进行训练,得到结点的 embedding。

这个公式最重要的改进就是加入了


















作为系数来表示两个企业之间关系的动态变化。因为两只股票最近在价格上的走势也接近,那么


















就越大,他们之间的关系也就越强。

论文中使用 Nikkei 225 market 上的 176 只股票,利用 Nikkei Value Search dataset 来抽取企业之间的关系。利用回报率



































和夏普率





















作为衡量指标。实验结果如下图所示。

实验证明了 customer-of 是企业间几种关系中最为重要的一种,对企业股价具有比较好的预测作用。具有这种关系的两家企业的股价在时序上具有比较好的相关性。此外,在不同的时间跨度上,不同的关系对于不同时期股价的预测作用不同。

从上图可以看出,customer-of  关系对于股价的预测作用在 1-day 时是最好的。此外,同一种关系在不同的跳数(hop)上预测作用的时间长短也是不同的,这是一个可以扩展的方向。

CIKM 2018

论文标题:Incorporating Corporation Relationship via Graph Convolutional Neural Networks for Stock Price Prediction

论文来源:CIKM 2018

论文链接:https://dl.acm.org/doi/10.1145/3269206.3269269

与上篇论文的出发点相似的,这篇论文也将企业间的关系纳入考虑。但与之不同的是,这篇论文更多地将其作为一种数据增强的手段,而不是直接在图上进行股价预测。文章使用如下方式建图:

图中的每个点代表一个企业,他们之间的边代表两家企业间的持股关系,变得权重表示持股比例。之后提出两个模型利用图进行股价预测:Pipeline Prediction Model、Joint Prediction Model Based on GCN。

Pipline Prediction Model 使用 DeepWalk, node2vec 和 LINE 三种方法生成节点的 embedding。之后计算两个结点之间的 cos 相似度选出与目标公司最相似的




家企业,把它们的特征取平均拼接到目标企业的特征向量上:

最后将













输入到 LSTM 中进行预测。

Joint Prediction Model Based on GCN 则是用 LSTM 获得结点的向量表示,从前面构建的图中获取邻接矩阵,之后输入到一个三层的 GCN 中完成预测。

对 2017 年的 CSI 300 的验证结果表明 LSTM+GCN 的预测准确率更高(这里的评价指标选的相当不专业,一般来说我们要选择回报率以及能够排除掉整个市场趋势的一些指标来衡量模型的实际盈利能力)。在所有图表示学习的方法中,LINE 方法的表现更好。

COLING 2016

论文标题:Knowledge-Driven Event Embedding for Stock Prediction

论文来源:COLING 2016

论文链接:https://www.aclweb.org/anthology/C16-1201/

在股票市场上,各种 event 对于股价是有较大影响的。这篇文章使用知识图谱来抽取 event embedding,之后用于股价预测。

对于event可以将其看作一个三元组












,其中




是行动者(actor)或主体(subject),




是行动或谓语(predicate),




是被施加行为的客体。首先可以使用预训练的词向量做平均来分别表示








,之后使用 neural tensor network (NTN) 来计算隐向量。

为了合理的训练,采用随机替换




中单词的方式来获得负样本(corrupted event tuple)
























,损失函数如下:

但上述方式训练出的 event embedding 存在两个的问题:

1. 不能获取两个在语义或语法上相似事件的关系,如果两者没有相似的词向量;

2. 同样地,有两个相似词向量的事件不一定是相关的。

这两个问题出现的原因是在训练 event embedding 的时候没有加入背景知识。而想要获取背景知识就要利用知识图谱,知识图谱中存在两种知识:关系知识(relational knowledge)和和类别知识(categorical knowledge)。

这两种关系同样可以使用简单的 NTN 网络来计算,其中












是两个实体,




是某种关系:

通过随机替换














获得负样本














,极小化如下的目标函数:

最后将两个模型组合起来进行训练,就可以获得包含知识的event embedding。

目标函数为:

实验从 Reuters News 和 Bloomberg News 抽取结构化事件,使用 YAGO 作为知识图谱,对标准普尔 500 指数和单个股票进行预测。使用 Acc 和 MCC (Matthews Correlation Cofficient) 作为指标。结果如下:

总结

这三篇论文是近五年图神经网络和知识图谱在量化投资上的应用尝试,主要集中与挖掘企业之间的相关关系,但也存在一些问题,如三篇文章都没有很好的解决市场的动态性,企业间的关系是随时间不断变动的,并且使用一个静态的知识图谱或数据集来抽取关系是否会造成数据泄露的问题也没有指明。

因为相关的资料确实相当匮乏,我在 GitHub 上新建了一个 repo 用于收集、整理相关的研究论文、书籍、数据、网站等,欢迎 star。

https://github.com/sangyx/deep-stock

如果您对深度学习在量化交易中的应用感兴趣,欢迎加我微信一起学习探讨。

点击以下标题查看更多往期内容:

  • 当深度学习遇上量化交易——因子挖掘篇

  • 针对复杂问题的知识图谱问答最新进展

  • 图神经网络三剑客:GCN、GAT与GraphSAGE

  • GELU的两个初等函数近似是怎么来的?

  • 协作多智能体强化学习中的回报函数设计

  • 将“softmax+交叉熵”推广到多标签分类问题

#投 稿 通 道#

 让你的论文被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学习心得技术干货。我们的目的只有一个,让知识真正流动起来。

???? 来稿标准:

• 稿件确系个人原创作品,来稿需注明作者个人信息(姓名+学校/工作单位+学历/职位+研究方向)

• 如果文章并非首发,请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发,均会添加“原创”标志

???? 投稿邮箱:

• 投稿邮箱:hr@paperweekly.site

• 所有文章配图,请单独在附件中发送

• 请留下即时联系方式(微信或手机),以便我们在编辑发布时和作者沟通

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

当深度学习遇上量化交易——图与知识图谱篇相关推荐

  1. 当深度学习遇上量化交易——因子挖掘篇

    ©PaperWeekly 原创 · 作者|桑运鑫 学校|上海交通大学博士生 研究方向|图神经网络在金融领域的应用 在深度学习的所有应用场景中,股价预测也无疑是其中一个异常诱人的场景.随着传统线性模型的 ...

  2. 当深度学习遇上量化交易——公开信息篇

    ©PaperWeekly 原创 · 作者|桑运鑫 单位|上海交通大学硕士生 研究方向|图神经网络在金融领域的应用 本文主要回顾三篇利用文本信息和音频信息进行量化交易的文章. StockNet 论文标题 ...

  3. 计算未来轻沙龙 | 当深度学习遇上归纳推理,图神经网络有多强大?

    作为一名新世纪的深度学习炼丹师 是否整天面对各种结构的原(shu)料(ju)? 对于无规则的空间数据 传统炼丹大法好像并不能发挥奇效 图作为一种非常神奇的表示方式 可以表示生活中绝大多数现象或情境 那 ...

  4. 当深度学习遇上异构并行计算

    当深度学习遇上异构并行计算 近几年来,以深度神经网络(DNN)为代表的深度学习如火如荼,深度学习的研究领域从开始的图像识别(如imagenet比赛)到现在的自然语言处理,几乎有席卷一切机器学习研究领域 ...

  5. 深度学习遇上稀缺数据就无计可施?这里有几个好办法

    2019-12-07 05:30:39 作者 | Tyler Folkman 编译 | 杨晓凡 对于深度学习而言,在有很多数据的情况下,再复杂的问题也不在话下,然而没有这么多数据呢?本文作者 Tyle ...

  6. 当深度学习遇上Web开发:Spring和OpenAI如何实现图片生成?

    文章目录 一.简介 1. 什么是Spring和OpenAI 2. 生成图像的意义和应用场景 二.相关技术介绍 1. 深度学习模型 2. GAN模型 3. TensorFlow框架 四.简单的Sprin ...

  7. 【高效炼丹-筑基期】当深度学习遇上概率分布,你不能不知道的神奇度量方法:KL散度!

    什么是KL散度 KL散度(Kullback-Leibler divergence),也称为相对熵,是一种用于衡量两个概率分布之间差异的度量方法.它可以描述两个分布之间的距离,用于衡量模型预测结果与真实 ...

  8. 当深度学习遇上图: 图神经网络的兴起!(文末送书)

    当深度学习遇上图,会碰撞出怎样的火花呢? 本文就带你来了解一下--近年来逆势而上的一门技术:图神经网络! 内容选自<图神经网络:基础与前沿(全彩)>一书! 01 什么是图 也许我们从来没有 ...

  9. 当深度学习遇上图: 图神经网络的兴起!

    当深度学习遇上图,会碰撞出怎样的火花呢? 本文就带你来了解一下--近年来逆势而上的一门技术:图神经网络! 内容选自<图神经网络:基础与前沿(全彩)>一书! 01 什么是图 也许我们从来没有 ...

最新文章

  1. vue - 响应式原理梳理(一)
  2. SpringMVC 全局异常处理,返回json
  3. android 如何判断h5页面是否加载完成_H5 键盘兼容性小结
  4. vue created 生命周期
  5. windows 检查cuda安装_Windows云主机GPU驱动-CUDA安装使用
  6. linux 多域名访问数据库,Linux下虚拟域名的实现
  7. vue.js指令v-model实现方法
  8. SSAS的MDX的基础函数(三),及聚合函数
  9. windows下批处理删除文件及注册表项
  10. 下载EPM包详细运行日志
  11. 吴恩达新书《Machine Learning Yearning》完整中文版PDF
  12. 网页设计html轮播代码,20行js代码实现网页轮播图效果
  13. MySQL学习第三弹——约束与多表查询详解
  14. LCP 19. 秋叶收藏集(C++)---动态规划解题
  15. 红耳朵象全国战略,让大众享受上门洗车的福利
  16. Tensorflow-GPU使用时笔记本电脑声音过大的问题
  17. CSS入门学习笔记+案例(1)
  18. ArcGIS基础:合并表格(追加、合并工具)
  19. 室内主动导航系统在高铁站场景应用分析
  20. 《惠普工作站设置BIOS从U盘装系统》

热门文章

  1. mysal向一个无法连接的网络尝试了一个套接字操作 0.0.3.235_第十二章 Java网络编程(3)——套接字(上)...
  2. jzoj100029. 【NOIP2017提高A组模拟7.8】陪审团(贪心,排序)
  3. error=Error Domain=NSURLErrorDomain Code=-1003
  4. 验证java 递增不是原子操作
  5. 设置select默认值
  6. 在用visio作图形界面设计,控件对齐的工具按钮
  7. mysql开启perform sch_MySQL Performance schema设置的一些建议选项
  8. android恶意扣费类程序,10款APP违法有害 主要危害涉及恶意扣费等5类
  9. python无向加权图_图:无向图(Graph)基本方法及Dijkstra算法的实现 [Python]
  10. 库 python_20个必不可少的Python库也是基本的第三方库