背景概述

今天看了一篇论文我觉得挺有意思,一方面是讲的股票预测相关,另一方面是把深度学习和知识图谱相结合解决一个问题。通常知识图谱和深度学习很少有交集,一般是独立发展的两个人工智能领域解决问题的手段,两者如何一起解决问题呢?这个也引发了我的好奇心,因为一直对知识图谱这个领域念念不忘,在《机器学习实践应用》最后一章还要特意加入知识图谱的内容。

论文的名字叫:<Knowledge-Driven Stock Trend Prediction and Explanation via Temporal Convolutional Network>有兴趣的同学可以下载来自己也看一看。

股票预测的历史难题

KDTCN其实是KD和TCN的缩写,KD指的是Knowledge-Driven,也就是知识图谱。TCN是Temporal Convolutional Network,字面意思是临时卷积网络。其实在量化领域,已经有很多成熟的模型了,比如最早的Arima,到后来的RNN,再到LSTM,这些模型都是把股票预测看作是一组结构化的时间序列的时序预测问题。

KDTCN的出现,肯定是为了解决股票预测领域的一些痛点,我觉得有两点。其一是重大突发事件对股价的影响,如果单一把股票预测看成时间序列问题,一些突发问题的影响其实很难通过时序分析得到。比如喜闻乐见看到的,川普Twitter信息导致股价大跌:

发掘这种突发事件的最好的办法就是通过知识图谱去解析实时新闻,挖掘出新闻内部的核心属性,并且判断其对股票局势的影响。

另一个痛点是时间序列模型很难从数学公式层面发掘股价增或者跌的拐点,如下图所示

这个可能需要将时序问题转为分类问题解决,通过TCN模型做分类。这也就引出了KDTCN模型的设计架构。

KDTCN网络结构介绍

网络结构分为两部分,左边是一个知识图谱的结构,右边是TCN网络。

首先介绍下知识图谱部分。输入新闻,然后将新闻转换成Tuples,Tuples是个subject-predicate-object结构。举个例子,“Britain exiting from the EU”,英国脱欧这件事对股市影响很大,那这件事的Tuple=(s=Britain,p=exiting from,o=EU)。接着把这些个Tuple输入到构建好的Knowledge base里,就可以得到Event embedding,有了embedding就进入到熟悉的二分类场景的应用了。整体过程参照下图:

再说TCN,TCN是一个卷积神经网络,它的特点是每一层的输入和输出神经元的个数都相同,论文中表达的意思是这样不会出现信息丢失。另外其它跟CNN不同的地方我也没太看懂,应该主要是residual connection部分吧,这块还得再研究研究。

最终整个网络的作用是把股票走势预测问题变成了一个二分类问题去解决:

如果后续股价会涨,则y=1,否则y=0。通过把新闻事件输入到知识图谱中得到Event embedding,以及将历史价格数据向量化得到Price embedding,最终的训练集变成了Event embedding+Price embedding,通过TCN去做分类训练,得到最终的知识图谱网络和分类模型。

用知识图谱去解析实时要点新闻,并生成Event embedding加入到训练,这一点还是比较有创意的。

解析KDTCN:知识图谱和深度学习模型联合实现股票预测相关推荐

  1. 知识图谱、深度学习、AutoML,推荐系统与新技术结合将碰撞出怎样的火花?

    近日,来自意大利米兰理工大学 Maurizio 团队发表的一篇极具批判性的文章火了.这篇文章剑指推荐系统领域的其他数十篇论文,并通过多项试验证明这些论文中基于深度学习的推荐算法大部分都存在不同程度的数 ...

  2. 知识图谱与深度学习(新时代·技术新未来)

    作者:刘知远,韩旭,孙茂松 出版社:清华大学出版社 品牌:清华大学出版社 出版时间:2020-05-01 知识图谱与深度学习(新时代·技术新未来)

  3. 生物信息学|新颖的深度学习模型,更准确地预测药物-药物相互作用

    本篇推文引自:Novel deep learning model for more accurate prediction of drug-drug interaction effects 1. 摘要 ...

  4. 利用多时间无人机数据和时空深度学习模型的作物产量预测

    文章目录 Abstract 1 Introduction 1.1 Related Work 1.2 Contribution 2 Materials and Methods 2.1 Data Acqu ...

  5. 知识图谱在深度学习目标检测中的应用

    知识图谱是什么?深度学习的目标检测怎么和它相结合?我将带大家一起来解读其中奥秘--阿波,2020.4.16 检索摘要 写在前面 知识图谱 Abstract Introduction Base Dete ...

  6. [深度学习] 使用LSTM实现股票预测

    一.概述: 传统的线性模型难以解决多变量或多输入问题,而神经网络如LSTM则擅长于处理多个变量的问题,该特性使其有助于解决时间序列预测问题. 本文将初步探究 LSTM 在股票市场的应用.通过使用LST ...

  7. 知识图谱从入门到应用——知识图谱推理:基于表示学习的知识图谱推理-[嵌入学习]

    分类目录:<知识图谱从入门到应用>总目录 前面多次提到过,基于符号逻辑的演绎推理的主要缺点是对知识表示的逻辑结构要求比较高,不论是本体推理还是规则推理,都要求人工定义公理和规则才能完成推理 ...

  8. 深度学习模型分析人类复杂疾病的准确性

    原创 梅斯医学 MedSci梅斯既往研究显示,通过全基因组关联研究(GWAS)分析鉴定出的疾病风险变异主要位于基因组的非编码区域中.因此,全基因组图谱的深度学习模型在预测DNA序列的调控作用方面存在着 ...

  9. 深度学习模型可解释性的研究进展_化盈盈

    写在前面: 这篇文献提出的方法对我的工作帮助不是太大,但可以扩展可解释性的理解. 1 摘要 深度学习在很多人工智能应用领域中取得成功的关键原因在于, 通过复杂的深层网络模型从海量数据中学习丰富的知识. ...

最新文章

  1. 马云:员工的离职原因--转载
  2. 数据库被挂马的ASP处理方法
  3. boost::::adaptors::indexed::indexed相关的测试程序
  4. mysql 存储过程 无限分类,查看新闻/公告--[转帖]mysql存储过程实现的无限级分类,前序遍历树...
  5. javaweb报错There is no Action mapped for namespace [/] and action name [Login] context path [/struts]
  6. ARC106——E - Medals
  7. 时代银通笔试20181023
  8. 什么是节点光端机?总线型光端机有哪些优势?
  9. PyTorch JIT与TorchScript
  10. JDBC进行事务管理
  11. Python面向对象,站在更高的角度来思考
  12. Netty工作笔记0002---Netty的应用场景
  13. Hadoop 2.2.0 在centos6.2 64位下的安装--分布式模式
  14. ubuntu端口映射
  15. 泰山OFFICE技术讲座:英寸,厘米,磅,派卡,提,行,字行,像素的换算关系
  16. 武林高手?敏捷开发,唯velocity取胜
  17. jsPlumb流程图完整实例
  18. pytorch1.13启用caffe2
  19. 支付宝 App架构的原理与实战
  20. Python中编码问题:u‘\xe6\x97\xa0\xe5\x90\x8d‘ 类型和 ‘\u559c\u6b22\u4e00\u4e2a\u4eba ’ 转为utf-8的解决办法

热门文章

  1. php k线图 echarts,股票K线图,折线图总结(echarts)
  2. FPGA入门实验之串口发送
  3. dpi和ppi换算_ppi和dpi换算(1ppi等于多少dpi)
  4. 冒烟测试(smoke test)、可用性测试(sanity test)和回归测试(regression test)
  5. java中学习easyUI的总结——01
  6. MySQL启动服务提示:某些服务在未由其他服务或程序使用时将自动停止
  7. 【CodeForces】【BFS】【状压】718E Matvey's Birthday
  8. 程序设计与算法(三)期末考试(2020春季)
  9. 【Lesson 5】 和弦转位
  10. Qt中pro、pri文件的语法介绍