作者:Aishwarya Srinivasan, Deep Learning Researcher

翻译:赵雪尧

较对:丁楠雅

本文约4000字建议阅读10分钟。

本文介绍了强化学习在交易中的应用。

在上一篇文章中,我着重于从计算和数学视角理解强化学习,以及我们在业务中使用算法时面临的挑战。

在本文中,我将探讨强化学习在交易中的应用。金融行业一直在探索人工智能和机器学习的应用,但金融风险让人们不愿这么做。近年来,传统的算法交易得到了发展,如今高计算能力的系统已经实现了任务的自动化,但交易员们仍然要负责制定交易决策。一个股票购买算法模型可能会基于一份估值和增长指标条件清单,来定义一个“买入”或“卖出”信号,然后由交易员定义的某些特定规则触发。

例如,这个算法可能很简单,只要在收盘时观察标准普尔指数比过去30天的高点还要高,就买入,或者该指数比过去30天的低点还低,就平仓。这些规则可以是趋势跟踪、反趋势或基于自然界的模式。不同的技术分析师不可避免地会对模式和确认条件有不同的定义。

为了使这种方法系统化,交易员必须指定精确的数学条件,以清楚地确定是否形成了头肩顶模式(译者注:头肩顶(Head & Shoulders Top)是股票价格和市场指数最为常见的倒转形态图表之一。头肩顶形态为典型的趋势反转形态,是在上涨行情接近尾声时的看跌形态,图形以左肩、头部、右肩及颈线构成[1]。),以及确定确认该模式的精确条件。

在当前金融市场的先进机器学习领域,我们可以看看在2017年10月亮相的EquBot公司的AI型交易所交易基金(AI-based Exchange Traded Funds  ETFs )。EquBot将这些ETFs 自动化,收集来自数千家美国公司的市场信息、超过100万个市场信号、季度新闻文章和社交媒体帖子。

一个给定的ETF可能会选择30到70家有很高市场升值机会的公司,它将从每笔交易中继续学习。另一个知名的市场参与者Horizons也推出了类似的主动AI全球ETF (Active AI Global ETF),这款ETF利用包括交易员制定策略在内的监督机器学习技术开发而成。使用监督学习方法,人工交易员帮助选择阈值、解释延迟、估计费用等等。

Fig1:使用监督学习技术的交易流程图(译者注:纸交易(paper trading),即在模拟账户中进行交易[2]。)

当然,如果要完全自动化,人工智能驱动的交易模型必须比预测价格做得更多。它需要一个基于规则的策略,将股票价格作为输入,然后决定是买入、卖出还是持有。

2018年6月,摩根士丹利(Morgan Stanley)任命宾夕法尼亚大学(University of Pennsylvania)的计算机科学家迈克尔•卡恩斯(Micheal Kearns)担任首席执行官,以扩大人工智能的应用。在接受彭博社采访时,卡恩斯博士指出,“虽然标准的机器学习模型对价格进行预测,但它们没有具体说明行动的最佳时间、交易的最佳规模或交易对市场的影响。” 他补充说:“通过强化学习,你正在学习如何预测你的行为对市场状况的影响。”

强化学习允许端到端优化和最大化回报。至关重要的是,强化学习模型本身会调整参数,以使其接近最优结果。例如,我们可以想象,当下跌超过30%时,会产生巨大的负面回报,这迫使模型考虑使用另一个策略。我们也可以建立模拟来改善在关键情况下的反应。例如,我们可以在强化学习环境中模拟延迟,以便为模型生成负面激励。这种负面回报反过来又迫使模型学习应对延迟的变通方法。类似的策略允许模型随着时间的推移自动调整,不断地使其更强大和适应性更强。

Fig2:使用强化学习模型进行交易的流程图

在IBM,我们在DSX平台(IBM Data Science Experience (DSX))上建立了一个复杂的系统,利用强化学习的力量进行金融交易。该模型利用历史股票价格数据,通过在每一步中采用随机策略进行训练,并根据每笔交易的盈亏来计算回报函数。


“IBM数据科学体验平台(DSX)是一个企业数据科学平台,它为团队提供了最广泛的开源和数据科学工具,以满足任何技能需求,在多云环境中构建和部署任何地方的灵活性,以及更快地操作数据科学成果的能力。”

以下图表示了将强化学习方法与金融交易应用在一起的使用案例。

Fig3:强化学习交易模型

我们使用alpha指标(积极的投资回报,ROI)来衡量强化交易模型的表现,并根据代表市场整体走势的市场指数来评估投资的表现。最后,我们以一个简单的买入&持有策略模型和ARIMA-GARCH策略模型来进行模型评估对比。我们发现,该模型根据市场走势进行了非常精细的调节,甚至可以捕捉到头肩顶的模式,这些都是可以预示市场逆转的重要趋势。

强化学习可能并不适用于所有业务场景,但它捕捉金融交易微妙之处的能力肯定会显示出它的复杂性、威力和更大的潜力。

请继续关注我们在更多业务场景中测试强化学习的能力!

[1] 百度百科:

https://baike.baidu.com/item/%E5%A4%B4%E8%82%A9%E9%A1%B6

[2] https://www.avatrade.cn/education/trading-for-beginners/paper-trading.html

原文标题:

Reinforcement Learning: The Business Use Case, Part 2

原文链接:

https://www.kdnuggets.com/2018/08/reinforcement-learning-business-use-case-part-2.html

译者简介

赵雪尧,北邮研三在读,京东见习算法工程师,目前研究强化学习广告竞价模型。相信数据和算法将为企业发展赋能,希望跟志同道合的小伙伴一起追寻前沿消息,深入探索算法的极限。在玄学调参的道路上,一路狂奔。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:datapi),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

点击“阅读原文”拥抱组织

独家 | 一文了解强化学习的商业应用2相关推荐

  1. 独家 | 一文了解强化学习的商业应用

    作者:Aishwarya Srinivasan 翻译:Cream 校对:王雨桐 本文约4000字,建议阅读10分钟. 本文介绍了强化学习的应用场景.基本概念和数学模型. DeepMind开发的Alph ...

  2. 强化学习入门 : 一文入门强化学习 (Sarsa、Q learning、Monte-carlo learning、Deep-Q-Network等)

    最近博主在看强化学习的资料,找到这两个觉得特别适合入门,一个是"一文入门深度学习",一个是"莫烦PYTHON". 建议:看资料的时候可以多种资料一起参考,一边调 ...

  3. Science 好文:强化学习之后,机器人学习瓶颈如何突破?

    来源 | AI科技评论 编译 | 陈彩娴 编辑 | 陈大鑫 在过去的十年里,机器学习确实取得了巨大的突破,计算机视觉与语言处理方面也因此出现了许多改变世界的重要应用.但是,这股"春风&quo ...

  4. AIGC结合强化学习?先一文掌握强化学习入门路径

    人工智能发展至今,各种热门话题层出不穷,新技术.新SOTA.新方向,每天的变化日新月异.这之中,强化学习应该算是其中相当热门的领域了. 作为近些年创新的热点领域,不仅控制领域的大拿在关注强化学习,计算 ...

  5. 再谈注意力机制 | 运用强化学习实现目标特征提取

    论文题目:Recurrent Models of Visual Attention 论文链接:http://www.oalib.com/paper/4082117 作者及单位 研究目标 研究如何减少图 ...

  6. 强化学习:不用给AI一个支点,他也能想办法撬起地球

    文章目录 导读 定义 要点 强调 应用 电商 游戏 军事 交通管制 其他 强化学习强在哪 强化学习现在怎么样了 基于值函数的强化学习 基于策略搜索的强化学习 基于环境建模的强化学习 强化学习将来会怎么 ...

  7. 美团招博士后啦!深度学习、强化学习、计算机视觉与NLP、法学方向

    美团博士后工作站简介 美团博士后科研工作站是美团引进和培养高层次创新型优秀博士人才,推进产学研结合,增强企业创新能力的重要平台.工作站聚焦人工智能.无人驾驶.大数据等方向,从基础理论.关键技术.创新应 ...

  8. 深度强化学习1——强化学习到深度强化学习

    从事深度强化学习有一段时间了,整理了网上的一些资料,写几篇博客作为知识的梳理和总结. 开讲前,先给大家看个深度强化学习的例子,下面是深度学习cnn和强化学习结合玩吃豆人的游戏 看图像我们会发现吃豆人会 ...

  9. 独家 | 一文读懂语音识别(附学习资源)

    原标题:独家 | 一文读懂语音识别(附学习资源) 一.前言 6月27日,美国权威科技杂志<MIT科技评论>公布2017全球最聪明50家公司榜单.科大讯飞名列中国第一.全球第六.全世界排在科 ...

最新文章

  1. 《统计学习方法》资源
  2. MmGetSystemRoutineAddress和MiFindExportedRoutineByName函数的实现代码
  3. UITableViewCell 添加长按手势
  4. 【PC工具】更新常用USB转串口芯片MAC驱动,CH340G驱动安装有可能遇到的问题及解决办法...
  5. ML之Clustering:关于Clustering进阶的那些不可告密的事
  6. 专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一)
  7. 客户端页面不更新CSS样式或JS脚本的方法 (2018-08-17 17:33)
  8. linux gone kde 图形程序 兼容,Oracle8i HowTo
  9. Infinite Fraction Path UVALive - 8207
  10. 架​设​W​e​b​服​务​器
  11. 计算机应用基础教程2015答案,《计算机应用基础教程(2015版)》_课后题答案.doc
  12. SpringBoot开发Restful接口
  13. linux中oracle切sys,Linux环境oracle数据库重置sys用户密码
  14. OpenCV4每日一练day1:VS2015+opencv4.1.0+读图测试
  15. linux的打包压缩文件,linux打包文件,压缩文件
  16. 李育辉组织行为学理论框架
  17. Grafana Tempo简介
  18. 二层交换配置完ping失败_在三层交换机和二层交换机做怎么配置使这两台主机ping通...
  19. bootstrap常用样式整理
  20. 谈谈单元测试:为什么要进行单元测试?

热门文章

  1. Mysql主从同步异常处理
  2. SharePoint 2007 安装与配置
  3. SSH框架搭建问题总结
  4. Android 侧划菜单
  5. springmvc的异常处理对静态的资源的处理
  6. [转]在C#中使用API回调函数的方法
  7. msysGit 中文环境配置及跨平台开发注意事项
  8. va_list和va_start和((A*)0)-a
  9. 如何针对CMS系统进行SEO优化_
  10. icns图标制作_PPT制作必备:这6个网站,帮你打造超强的图标素材库