梦晨 发自 凹非寺
量子位 报道 | 公众号 QbitAI

上市公司的CEO一言一行都得谨慎,不然股价分分钟跌给你看。

回想这轮缺芯潮刚刚开始的时候,IT行业高管们还在发言中回避或淡化供应链问题。

几个月后,大众、福特这些老牌车企也遭波及,纷纷出声警告“我撑不住啦,我要减产”。

一轮股市动荡随之而来。

不过却有那么几家投资机构一点也不慌,因为他们早就捕捉到了CEO们信誓旦旦言论背后的迟疑。

他们用AI算法对比CEO发言稿中选择的字词和说话时的语气,分析出了高度不一致性。

使用算法的基金经理表示AI技术能帮他们在竞争中取得优势。

毕竟顶级投资机构都把财务报表分析的透透的了,很难从中榨取出更多价值。

此外,算法还产生了一个有趣的副作用。

因为即兴发言太容易暴露心理状态,逼得越来越多的CEO提前写好照稿念了。

谁在用?

走在前面的有英国曼氏集团旗下的基金MAN AHL

从1983年开始,这只基金就靠一个叫AHL Diversified的算法策略自动跟踪市场变化,到现在已经成了“量化投资界的航母”。

随着机器学习方法的发展,MAN AHL也不断把新技术应用到投资策略中。

对于CEO的发言,他们的算法关注语调节奏重音,再结合NLP技术与文字转录版本作对比,找出口头和字面表述不一致的部分。

具体算法细节虽然不公开,不过也可以从MAN AHL的机器学习主管Slavi Marinov偶尔发表的论文中略作了解。

在证券市场使用NLP技术的还有日本野村证券

他们统计了2014年以来公司高管在电话会议上语言的复杂程度和股价的关系,结果是使用简单措辞的公司股价要比复杂措辞的高出6%

美国银行 (Bank of America)也利用电话会议中出现的词汇来预测公司债券违约率。

他们的模型验证了削减成本 (Cost Cutting)、烧钱 (Cash Burn)这样的词与公司未来违约行为高度相关。

这样的AI系统,开发和运行成本高达数百万美元,一般小公司还真用不起。

大的投资机构到底能不能用这个赚到钱?他们以商业敏感性为由都没有透露。

对于小的投资机构,市场上也有一批技术提供商可以出售分析服务,也就是此前火过一阵的概念FinTech(金融科技)。

用的什么模型?

金融NLP最大的问题就是数据量不够,把能找到的新闻和电话会议记录全用上也不够训练出效果好的语言模型。

不过得益于预训练技术的发展,先用大量通用领域文本训练,再用少量金融新闻和经过标注的电话会议文稿微调取得了效果。

很多金融语言模型都是基于BERT,像伦敦证券交易所推出了使用路透社新闻训练的BERT-RNA和使用39万份电话会议记录训练的BERT-TRAN。

ICRL 2020也收录了一篇金融语言模型论文FineBERT

一家投资机构Sparkline Capital透露了很多他们的BERT模型训练细节。

预训练分为用通用文本、未标注的电话会议记录、带情绪标注的IMDb电影评论三步,最后再用少量带情绪标注的电话会议记录微调。

最后,Sparkline Capital还解释了为什么现阶段不能直接用深度学习来预测股价。

因为相比CV和NLP任务的数据来说,金融市场上参与者众多、交易行为产生的数据信噪比太低

噪音稀释了数据中的有效信息,AI模型会更容易被随机性骗到。

按他们的说法,一张猫照片包含的信息量比1000个企业价值倍数(EV/EBITDA)数据还多。

参考链接:
[1]https://www.reuters.com/technology/ai-can-see-through-you-ceos-language-under-machine-microscope-2021-10-20/
[2]https://www.nature.com/articles/s41598-021-82338-6
[3]https://www.linkedin.com/pulse/deep-learning-investing-opportunity-unstructured-data-kai-wu/
[4]https://www.lseg.com/about-lseg/labs/financial-language-modelling
[5]https://arxiv.org/abs/2006.08097

砸下数百万美元分析CEO语气,这帮投资者用AI发现了比财报更多的细节相关推荐

  1. 光启数百万美元领投语音识别公司Beyond Verbal

    近日,国内科技公司光启集团在以色列特拉维夫宣布,光启全球创新共同体孵化器(以下简称光启GCI孵化器)以数百万美元的投入,领投一笔针对语音识别情绪分析公司Beyond Verbal的投资.除了光启,以色 ...

  2. 首提 Database Plus 新理念,SphereEx 获数百万美元天使融资,接棒 ShardingSphere 打造新型分布式生态

    5月14日,数据前沿技术领域初创公司 SphereEx 获得来自红杉中国种子基金.初心资本的数百万美元天使轮融资. SphereEx是一家致力于构建新型分布式数据基础设施的公司,秉承开源.共享.生态. ...

  3. 爱思国际获戈壁创投数百万美元Pre-A 轮融资,意做菲律宾的分众传媒...

    3月25日消息,菲律宾媒体广告解决方案提供商"爱思国际"宣布获戈壁创投数百万美元Pre-A轮融资. 爱思国际于2017年11月成立,瞄准菲律宾地区高档写字楼和住宅区中产人群,采取站 ...

  4. 爱思国际获戈壁创投数百万美元Pre-A 轮融资,意做菲律宾的分众传媒

    3月25日消息,菲律宾媒体广告解决方案提供商"爱思国际"宣布获戈壁创投数百万美元Pre-A轮融资. 爱思国际于2017年11月成立,瞄准菲律宾地区高档写字楼和住宅区中产人群,采取站 ...

  5. SphereEx 获数百万美元天使融资,接力 ShardingSphere 开启 Database Plus 新篇章

    5月14日,数据前沿技术领域初创公司 SphereEx 获得来自红杉中国种子基金.初心资本的数百万美元天使轮融资. SphereEx是一家致力于构建新型分布式数据基础设施的公司,秉承开源.共享.生态. ...

  6. Solana 区块链平台疑遭供应链攻击,价值数百万美元的密币遭洗劫

     聚焦源代码安全,网罗国内外最新资讯! 编译:代码卫士 专栏·供应链安全 数字化时代,软件无处不在.软件如同社会中的"虚拟人",已经成为支撑社会正常运转的最基本元素之一,软件的安全 ...

  7. 给力!斩获 GitHub 14000 Star,两周创办开源公司获数百万美元融资

    作者 | 伍杏玲 出品 | AI 科技大本营(ID:rgznai100) 上世纪 90 年代初,21 岁大学生 Linus Torvalds 开源 Linux 操作系统,自此掀起全球开源浪潮.随后&q ...

  8. 9 岁自学编程、24 岁身价涨至数百万美元,与微软一较高低的大佬多厉害?

    作者 | 年素清 责编 | 王晓曼 出品 | 程序人生 (ID:coder _life) 马克•安德森(Marc Andreessen)是美国著名的企业家.投资者.软件工程师.他9岁接触电脑,通过自己 ...

  9. 阿里正在研发无人卡车;《王者荣耀》皮肤个性动作涉嫌抄袭致歉;​苹果泄露女生私密照赔偿数百万美元|极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

最新文章

  1. 根据Forms名找出其所归属的权限组
  2. python 多进程_说说Python多线程与多进程的区别?
  3. windbg调试masm生成程序的方法
  4. 打开CEPH内核DOUT日志输出
  5. aspx repeater 用法_ASP.NET - Repeater 控件
  6. ax的范数最大_矩阵方程ax=b的范数约束最小二乘解.pdf
  7. VM虚拟机 安装OS X 错误vcpu-0:VERIFY vmcore/vmm/main/physMem_monitor.c:1123
  8. android studio 新建工程慢,关于AndroidStudio新建与编译项目速度慢解决办法
  9. html5代码书写规范
  10. 这可能是有史以来最详细的JNI入门教程
  11. python倒三角代码_vb代码输出倒三角形 python倒三角代码
  12. 每周分享第 34 期
  13. 基于PostgreSQL进行Java应用开发
  14. Linux学习笔记之 Btrfs文件系统简介及使用
  15. Micropython——基于PYB的霍尔编码器电机测速与使用
  16. 怎么让放大的图片变清晰?
  17. 设置hyper-v虚拟机的enhanced session mode
  18. ISDA 国际掉期交易协会
  19. 《让荧光舞一直挥舞下去》
  20. 介绍近期的一篇综述:AI系统安全的实用方法

热门文章

  1. 如何显示已上演的更改?
  2. PhoneGap 安装体验
  3. 手把手 | Python代码和贝叶斯理论告诉你,谁是最好的棒球选手
  4. (血和泪的成果)使用PageHelper分页插件进行后台分页
  5. Google Inc.:Google APIs:23' 解决方案
  6. 在windows下安装python包管理器pip及使用
  7. oracle中生成大批量数据的方法-下
  8. Ecshop显示商品销售数量
  9. DateTime时间格式转换为Unix时间戳格式
  10. sql like N'%%',N 是代表什么意思 及Like语句详解