不到现场,照样看最干货的学术报告!

嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。


人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术、paperweekly作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。2020年8月29日,第18期“AI未来说·青年学术论坛”(“AI+X”领域专场)以“线上平台直播+微信社群图文直播”形式举行。纽约州立大学石溪分校肖可瓅带来报告《数据驱动的金融研究》。

纽约州立大学石溪分校肖可瓅的报告视频

肖可瓅博士,美国纽约州立大学石溪分校(Stony Brook University)商学院副教授、终身教授、区块链商业实验室主任。国际计算机学会(ACM)及电气电子工程师学会(IEEE)高级会员。美国罗格斯大学管理(金融)学博士、纽约城市大学计算机科学硕士。研究方向包括商业分析、数据挖掘、城市计算、经济泡沫分析等。研究成果发表于TKDE、TKDD、TOIS、KDD、ICDM等机器学习、数据科学领域国际顶级期刊和学术会议。担任IEEE Access副编委。常年受邀担任数据科学、管理信息系统、金融经济等领域国际知名期刊审稿人。常年担任AAAI、KDD、NeurIPS、ICDM等数据科学领域国际会议程序委员会委员。

报告内容:报告通过对几个数据驱动的金融研究课题的介绍,分享本人对数据科学与金融研究的结合如何获得最大效用,传统金融研究向数据驱动的金融研究方向转变等问题的理解。

数据驱动的金融研究

不管是说数据科学和金融,还是人们说的AI+金融,描述的都是两个跨度较大的学科研究。二者之间产生交流时,学术专业领域不同、研究路径冲突,关注的问题点也存在很大的差异。肖教授首先介绍了传统研究模式的金融和数据驱动研究金融这两种截然不同的研究路径。传统的金融研究是从经济理论一路传承下来的,属于经济研究的范畴,经济研究注重的是能够解释世界经济活动的规律,就是通过经济的理论产生不同的模型,最终能否得到证实需要数据进行实证;比如模型的推论可以有多种不同的假设,这个假设是否成立,统计上是否有意义,是需要从数据证实的。如果证实的结果和模型相吻合就反过来支撑之前的理论,如果数据没有支撑模型推导出来的假说,原因可能是数据不够完善,或者模型推导得不对,也有可能理论有缺陷。在不断循环的过程当中金融理论和相关研究慢慢地发展下来。

数据工作者的研究思路有所不同:就是从数据出发找到模型。金融本身就是一个非常复杂的课题,在理论不完善的情况下数据工作者仍然需要致力于解决实际问题。基于数据的研究路径,或者利用AI技术和数据挖掘技术来做研究主要是以解决问题的角度出发,就是从数据找到模型,模型可以对我们的金融决策、经济决策进行支持和指导。虽然这个路径和传统金融的研究路径有所冲突,但这也使得AI+金融的研究更具挑战和意义。

肖教授接下来说明了金融大数据的复杂性。复杂的金融数据来自于几个方面:金融市场和金融产品本身就是有多样性,而且是在不断变化。比如2007年的次贷危机,之前很少人研究次贷危机,也不关注次贷的风险。而次贷危机爆发之后学术和金融业的研究者就纷纷开始研究次贷,之后一系列课题就发展出来了。近几年因为虚拟货币的热度,大家也在研究虚拟货币相关的投资策略,投资行为,及新机遇和风险。因此,在原本就足够复杂的传统金融市场和金融产品之上,不断会有新发展出来的金融产品和全新的金融概念。

研究者怎么将AI与金融整合一起进行AI+金融的研究呢?肖教授介绍,首先要看到数据科学在金融研究当中的重要性。金融本身是一个充满着数据的学科,金融活动是人类社会活动当中非常重要的一环,人们的任何行为都有可能成为关系到影响金融活动的一环。金融市场和金融数据本身的复杂性导致金融大数据的复杂性,金融大数据的复杂性又使得我们必须用数据科学和AI技术才能对它进行深度的分析,处理如此庞大的数据必须要有非常好的计算资源。比较有代表性的就是高频交易数据,很多交易都是由机器所产生的,这些交易互相竞争使得交易的频率越来越快。现在不仅是低于一天,分钟级的、秒钟级的,甚至是每一次交易的数据都要记录下来。

前面介绍的金融活动是人类行为当中非常重要的一环,我们对事件的关注度,对某些事件的看法都有可能最终影响金融投资行为。如果行为的一致性非常高,则可能导致市场整体的波动。常规的事件包括金融指数的发布、企业财报的发布,这些都是非常有规律的,大家可以预测到的事件。也有很多突发事件比如新的研究成果发布,新的政策或者突发新闻、灾难、自然灾害或者其它突发事件,这些事件最终都有可能成为金融研究的数据。传统的金融研究虽然也可以整合不同的数据库,但是因为研究工具的单一性使得最终得出的结论和检验的方式很难直接用于实践,这和数据驱动的研究目的有很大的不同。

研究路径决定研究工具的使用,传统金融主要注重的是一种可解释性的结果。比如需要验证一个模型是否可靠、是否正确,就从这个模型得出几种假说,无非就是两种变量之间的正向或者负向的关系,使用统计学的原理证明两个变量之间是一个显著的正向或者负向的关系,或者是没有发现正向和负向的关系,反过来就能够支撑这个模型是否是有效的。这一套评判标准是传统的金融研究当中被广泛接受的。传统的统计工具往往基于线性模型,虽然也有一些非线性的模型,但这些模型都相对简单,能够体现出来的变量之间的关系非常有限。然而,传统金融研究只需要验证两个变量之间的直接关系——如果是有关系的话就找到了z支撑模型的证据,也提供了理论有效的证据。至于应用当中能够对实际产生多大的效果,很多金融研究没有进一步讨论。

AI+金融的方向应该是补充传统金融的不足,所以研究者所用的工具是非常多的。肖教授说明,不仅要用到传统统计学的工具,同时需要大量应用者机器学习、数据库技术、可视化工具等技术。数据驱动的金融研究的侧重点不再是发现变量之间的关系为止,而是需要模拟变量在实际中的变化并生成预测模型。我们需要明确研究一批变量的组合会得到什么样的结果和预测效果。比如说,数据模型生成的投资信号能够带来多大的收益。AI+金融的目的是希望利用数据科学的优势助力金融领域关心的问题。肖教授接下来介绍了传统金融研究的两大主要领域,包括资产定价和公司金融研究。

肖教授从诺奖角度梳理了经济金融理论发展的脉络。可以看到整个经济金融发展是各个领域不同交汇的过程。因为数据和数据相关的技术的不断丰富,传统理论研究往往滞后,这就使得数据驱动的金融研究成为新的金融研究方向。

肖教授举的第一个例子是金融振荡的预测。价格震荡就是市场价格偏离预期价格,也是金融研究中的异常收益,或alpha。不管怎样用已有模型去编码金融规律,在用于实际数据时总是会出现误差项,如果误差体现出非正态分布的话就是所谓的价格震荡,这也就是金融模型当中没有编码的部分。经济学家费勒将alpha的存在归咎于两个原因。一是市场参与者中有部分人掌握更多的信息。二是部分人处理信息的能力非常强于其他人。以上原因导致的信息不对称就使得我们原来的模型不准确。基于此理论,我们可以利用社会网络模型中的影响力模型,模拟每个人在社会网络当中的影响力和影响力扩散规律,最终模拟动态市场中都各个股票相关时间的关注度及扩散过程。用此过程来代表市场信息的流动过程,用于解释价格震荡。而价格震荡的计量,应该遵照金融文献中的定义。如传统的Jensen's alpha,基于三因子模型得出价格振动等。另外一个例子是关于高频数据下的市场震动预测。基于传统的时间序列模型ARMA-GARCH对市场数据进行预测,然后可以模拟出市场震动。市场震动代表了传统模型没法解释的市场活动。我们可以利用神经网络或者其它的数据挖掘的技术对其进行“解码”,最后把解码的结果再返回到原有的模型当中,从而实现AI+金融的提升。

另外一个例子是关于金融文本挖掘。我们常用的神经网络模型来解析语言文字中的情绪和观点特征。在设计网络结构时,我们应该注意哪些是我们明确希望保留的信息。如用户的语言特征、对金融产品的偏好特征、对金融策略的喜好特征等。每个人对金融事件的判断都有自己的一套语言和分析习惯,如果我们不希望这些特征在深层网络学习过程当中被模糊掉,则应该把这类比较重要的信息放在比较靠后的网络层,形成按等级划分的网络结构。

肖教授最后补充到:我们需要利用AI带来的知识发现补充已有的金融领域的知识,最终实现解码金融回流,因为我们没有真正“解码”最终的理论原理,我们解码的是数据中的某种规律,且这种规律足以用于指导金融决策。研究者必须对金融领域的前沿发现和重要研究有深刻理解,才能明确数据科学和AI的助力点所在。在学习过程中需要多熟悉和处理不同形式的金融数据。解决复杂问题时牢记把技术得出的知识和领域知识相结合。

整理| 计算所 史铂深

AI未来说*青年学术论坛

第一期 数据挖掘专场

1. 李国杰院士:理性认识人工智能的“头雁”作用

2. 百度熊辉教授:大数据智能化人才管理

3. 清华唐杰教授:网络表示学习理论及应用

4. 瑞莱智慧刘强博士:深度学习时代的个性化推荐

5. 清华柴成亮博士:基于人机协作的数据管理

第二期 自然语言处理专场

1. 中科院张家俊:面向自然语言生成的同步双向推断模型

2. 北邮李蕾:关于自动文本摘要的分析与讨论

3. 百度孙珂:对话技术的产业化应用与问题探讨

4. 阿里谭继伟:基于序列到序列模型的文本摘要及淘宝的实践

5. 哈工大刘一佳:通过句法分析看上下文相关词向量

第三期 计算机视觉专场

1. 北大彭宇新:跨媒体智能分析与应用

2. 清华鲁继文:深度强化学习与视觉内容理解

3. 百度李颖超:百度增强现实技术及应⽤

4. 中科院张士峰:基于深度学习的通用物体检测算法对比探索

5. 港中文李弘扬 :物体检测最新进展

第四期 语音技术专场

1. 中科院陶建华:语音技术现状与未来

2. 清华大学吴及:音频信号的深度学习处理方法

3. 小米王育军:小爱背后的小米语音技术

4. 百度康永国:AI 时代的百度语音技术

5. 中科院刘斌:基于联合对抗增强训练的鲁棒性端到端语音识别

第五期 量子计算专场

1. 清华大学翟荟:Discovering Quantum Mechanics with Machine Learning

2. 南方科技大学鲁大为:量子计算与人工智能的碰撞

3. 荷兰国家数学和计算机科学中心(CWI)李绎楠:大数据时代下的量子计算

4. 苏黎世联邦理工学院(ETH)杨宇翔:量子精密测量

5. 百度段润尧:量子架构——机遇与挑战

第六期 机器学习专场

1. 中科院张文生:健康医疗大数据时代的认知计算

2. 中科院庄福振:基于知识共享的机器学习算法研究及应用

3. 百度胡晓光:飞桨(PaddlePaddle)核心技术与应用实践

4. 清华大学王奕森:Adversarial Machine Learning: Attack and Defence

5. 南京大学赵申宜:SCOPE - Scalable Composite Optimization for Learning

第七期 自动驾驶专场

1. 北京大学查红彬:基于数据流处理的SLAM技术

2. 清华大学邓志东:自动驾驶的“感”与“知” - 挑战与机遇

3. 百度朱帆:开放时代的自动驾驶 - 百度Apollo计划

4. 北理宋文杰:时空域下智能车辆未知区域自主导航技术

第八期 深度学习专场

1. 中科院文新:深度学习入门基础与学习资源

2. 中科院陈智能:计算机视觉经典——深度学习与目标检测

3. 中科院付鹏:深度学习与机器阅读

第九期 个性化内容推荐专场

1. 人民大学赵鑫:基于知识与推理的序列化推荐技术研究

2. 中科院赵军:知识图谱关键技术及其在推荐系统中的应用

第十期 视频理解与推荐专场

1. 北京大学袁晓如:智能数据可视分析

第十一期 信息检索与知识图谱专场

1. 北京邮电大学邵蓥侠:知识图谱高效嵌入方法

2. 人民大学徐君:智能搜索中的排序-突破概率排序准则

3. 百度周景博:POI知识图谱的构建及应用

4. 百度宋勋超:百度大规模知识图谱构建及智能应用

5. 百度冯知凡:基于知识图谱的多模认知技术及智能应用

第十二期 年度特别专场

1. 复旦大学桂韬:当NLP邂逅Social Media--构建计算机与网络语言的桥梁

2. 清华大学董胤蓬:Adversarial Robustness of Deep Learning

3. UIUC罗宇男:AI-assisted Scientific Discovery

4. 斯坦福应智韬:Graph Neural Network Applications

第十三期 AI助力疫情攻关线上专场

1. 清华大学吴及:信息技术助力新冠防控

2. 北京大学王亚沙:新冠肺炎传播预测模型

3. 百度黄际洲:时空大数据与AI助力抗击疫情——百度地图的实践与思考

4. 百度张传明:疫情下的“活”导航是如何炼成的

第十四期 深度学习线上专场

1. 中国科学院徐俊刚:自动深度学习解读

2. 北航孙钰:昆虫目标检测技术

3. 百度尤晓赫:EasyDL,加速企业AI转型

4. 百度邓凯鹏:飞桨视觉技术解析与应用

第十五期 大数据线上专场

1. 复旦赵卫东:大数据的系统观

2. 中科大徐童:AI×Talent数据驱动的智能人才计算

3. 百度李伟彬:基于PGL的图神经网络基线系统

4. 中科大张乐:基于人才流动表征的企业竞争力分析

第十六期 NLP前沿技术及产业化线上专场

1. 复旦大学黄萱菁:自然语言处理中的表示学习

2. 中科院刘康:低资源环境下的事件知识抽取

3. 百度何中军:机器翻译 —— 从设想到大规模应用

4. 百度孙宇:百度语义理解技术ERNIE及其应用

5. 哈佛邓云天:Cascaded Text Generation with Markov Transformers

6. 复旦大学桂韬:Uncertainty—Aware Sequence Labeling

第十七期 百度奖学金特别专场

1.  麻省理工学院赵明民:能穿墙透视的计算机视觉

2. 卡内基梅隆大学梁俊卫:视频中行人的多种未来轨迹预测

3. 清华大学丁霄汉:深度网络重参数化——让你的模型更快更强

4. 南京大学赵鹏:动态环境在线学习的算法与理论研究

5. 上海交通大学方浩树:人类行为理解与机器人物体操作

推荐阅读专题

留言 点赞 发个朋友圈

我们一起分享AI学习与发展的干货

推荐文章阅读

ACL2018论文集50篇解读

EMNLP2017论文集28篇论文解读

2018年AI三大顶会中国学术成果全链接

ACL2017 论文集:34篇解读干货全在这里

10篇AAAI2017经典论文回顾

长按识别二维码可添加关注

读芯君爱你

纽约州立大学石溪分校肖可瓅:数据驱动的金融研究相关推荐

  1. 纽约大学石溪分校计算机科学,纽约州立大学石溪分校的主要基本信息介绍

    原标题:纽约州立大学石溪分校的主要基本信息介绍 随着社会的发展,信息传播渠道的扩展和普及,想去美国本科留学和研究生留学的人对于美国公立大学的了解越来越多,对于公立大学的认可度也在逐步提高.美国纽约大学 ...

  2. 石溪分校 计算机研究生专业,纽约州立大学石溪分校计算机科学硕士入学条件.pdf...

    纽约州立大学石溪分校计算机科学硕士入学条件.pdf 留学监理服务网 纽约州立大学石溪分校 计算机科学 - Computer Science 基本信息 纽约州立大学石溪分校 - State 工程与应用科 ...

  3. 纽约州立大学石溪分校计算机专业排名,纽约州立大学石溪分校排名怎么样?

    原标题:纽约州立大学石溪分校排名怎么样? 美国纽约州立大学石溪分校在2020年<美国新闻与世界报道>美国全国性大学排名中排名第91名.在2020年QS世界大学排名中排名第359名. 纽约州 ...

  4. 纽约州立石溪分校计算机科学排名,纽约州立大学石溪分校美国排名

    美国纽约州立大学石溪分校在2020年<美国新闻与世界报道>美国全国性大学排名中排名第91名.在2021年QS世界大学排名中排名第373名. 纽约州立大学石溪分校专业排名 QS世界大学化学专 ...

  5. 纽约州立石溪分校计算机科学排名,美国纽约州立大学石溪分校排名~值得一看~...

    原标题:美国纽约州立大学石溪分校排名~值得一看~ 中国学生回国后对美国学校评价中最多的一个词汇是"大农村",嘴里一边叨叨着大农村的不是,一边又睥睨着大城市周遭的一切.那么今天留学美 ...

  6. 纽约州立大学石溪分校计算机专业排名,纽约州立大学石溪分校美国大学排名及专业排名汇总(USNEWS美国大学排名版)...

    [纽约州立大学石溪分校]2021年USNEWS美国大学综合排名第88名 [纽约州立大学石溪分校]2020年USNEWS美国大学综合排名第91名 [纽约州立大学石溪分校]2019年USNEWS美国大学综 ...

  7. 纽约州立石溪分校计算机科学排名,美国纽约州立大学石溪分校排名_2019纽约州立大学石溪分校排名(USNews排名)...

    [www.gywlwh.com--大学排名] 纽约州立大学石溪分校是一所成立于1957年的公立学校.它的本科招生总数为17,026人,位于郊区,校园面积为1,454英亩.2018年版全国性大学排名第9 ...

  8. 石溪分校 计算机研究生专业,纽约州立石溪分校 - 985本科申请纽约州立大学石溪分校计算机研究生容易吗?要准备什么?还有如果成功了好毕业吗??...

    纽约州立石溪分校 - 985本科申请纽约州立大学石溪分校计算机研究生容易吗?要准备什么?还有如果成功了好毕业吗??,1. 985本科申请纽约州立大学石溪分校计算机研究生容易吗?要准备什么?还有如果成功 ...

  9. 石溪分校 计算机研究生专业,美国纽约州立大学石溪分校专业设置与学制(本科生/研究生)...

    [纽约州立大学石溪分校专业设置] 1.纽约州立大学石溪分校共有15个学院:College of Arts & Sciences.College of Business.College of E ...

最新文章

  1. 新生代Eden与两个Survivor区的解释
  2. Easyui主要组件用法
  3. Jessica Kerr:高绩效团队简史
  4. 阿里云数据库RDS MySQL 物理全备文件数据恢复至自建数据库Mysql 5.7中
  5. Nginx的keeplive
  6. Linux下Weblogic部署安装
  7. python新浪微博爬虫_利用新浪API实现数据的抓取\微博数据爬取\微博爬虫
  8. 常见的软件生命周期模型
  9. matlab泰勒公式近似值,泰勒公式及其在在计算方法中的应用.doc
  10. 虚拟机调整C盘分区大小的取巧方法
  11. 一、PS是PhotoShop的缩写
  12. 百度地图修改底图样式
  13. 一天一篇latex刘海洋代码解析:1.2.2 从提纲开始
  14. 外网远程控制LED小灯的实现
  15. 解决Non-resolvable parent POM: Could not find artifact 出现的问题
  16. Easy_language
  17. idea格式化代码快捷键 快捷键: Ctrl+Shift+Alt+L
  18. 第五届河南省程序设计大赛——B 最强DE战斗力(找规律、大数定理)
  19. Android 二维码 生成和识别(附Demo源码)
  20. TPlinker解读

热门文章

  1. 如何找回bilibili(b站)收藏夹里失效的视频?
  2. 用 HLS m3u8 及FFMPEG搭建视频点播平台
  3. AutoSF- Searching Scoring Functions for Knowledge Graph Embedding
  4. 腾讯优图:AI内容理解新实践
  5. 学习Python的做笔记神器——Jupyter Notebook
  6. can't find compiler executable in your configured search path's for GUN GCC Complier的应对办法
  7. 基于阿里云的安全组介绍
  8. AtCoder Beginner Contest 177 A~D 题解
  9. 学校的计算机是作文,我在学校作文
  10. 如何使用python制作一款屏幕颜色提取器,附带exe文件