对冲基金投身“另类数据”淘金热

“另类数据销售商”挖掘个人、企业和国家在正常运转过程中产生的数字“废气”,并将其转化为有价值的情报。

更新于2017年8月31日 06:05 英国《金融时报》
林赛•福尔塔多 罗宾•威格尔斯沃思 卡拉•斯坎内尔

运动装备制造商安德玛(Under Armour)当年在奥立弗•斯通(Oliver Stone)导演的讲述美式足球的史诗巨制《挑战星期天》(Any Given Sunday)中声名鹊起。该公司8月初公布的最新财报,对许多投资者来说堪称一个令人不爽的意外。
安德玛连续第二个季度报亏,下调了今年剩余几个月的销售展望,并宣布了一项大规模重组计划。该公司警告称,这项重组计划将使2017年营业利润减半。安德玛的股价当日暴跌近9%,此后一直下滑。

但对于部分购买了关于这家公司的定制数据的对冲基金来说,这样的惨淡业绩或许并不那么令人震惊。近年来出现了大量新的“另类数据销售商”(alternative data vendors),它们搜集海量数字信息,并将其出售给渴望在市场中获得优势的投资集团。

这些销售商经常挖掘个人、企业和国家在正常运转过程中产生的数字“废气”,并将其转化为有价值的情报。

例如,从官网上发布的招聘职位减少、员工在招聘网站Glassdoor上对公司首席执行官给出的评级,或从其网站上所售服装平均价格的下跌中,都可以看出安德玛陷入不景气的迹象。但这只是另类数据冰山的一角,而投资者正意识到这一现实。

“另类数据”卖家泄露隐私

多家对冲基金表示,向投资集团出售APP下载、信用卡购买交易等信息的“另类数据”产业未能充分抹去个人资料。

  1. 网站抓取
    许多数据销售商抓取公开网站,以获取可能有价值的信息——诸如应用下载情况、用户点评、哪些航空公司和酒店通过Expedia和Priceline收到了预订。社交媒体网站也会被抓取,以搜集暗示消费者看法和趋势的线索。
    “为了产生持续(回报),投资者必须积极获取、分析和理解日益扩大的数据,”贝莱德(BlackRock)在最近的一份文件中表示,“做不到这一点的投资者可能在瞬息万变的投资格局中落后。”
    我们的许多在线活动都留下了数字“指纹”。我们的手机可以被追踪,我们的电子邮件可以被扫描,我们的在线购物行为也受到监视。企业在自家网站上发布大量数据,甚至地方和中央政府也在将自身业务的许多方面数字化。
    这些销售商抓取这类无所不包的“大数据”——从详尽的地理定位,到消费趋势和情绪分析——并将其转化为可用于交易的信号。
    投资集团过去也常常关注传统信息来源——如经济数据发布或财报——以外的信息。一些人如今认为,这个数字宝藏可以支撑资金管理行业的未来。
    然而,这一行业的不受监管也令人们感到不安。Tabb集团(Tabb Group)估计,另类数据行业的年销售额将在未来5年翻一番,至4亿美元。有人担心,一些看似公开的信息实际上可能是受法律保护的,而另一些人则担心,签署协议独享某些有价值的数据集的对冲基金,将在法律灰色地带面临严格审视。

  2. 信用卡追踪
    对于对冲基金而言,最重要的那部分数据是直接显示消费者花钱买什么的信息,信用卡公司是主要“金矿”。尽管这些数据只能提供关于销售趋势的片面观点,但结合其他数据集,就能提供至关重要的洞见。
    “这是一个美丽新世界。”前联邦检察官乔纳森•斯特里特(Jonathan Streeter)说。斯特里特曾领导诉对冲基金帆船集团(Galleon Group)联合创始人拉杰•拉贾拉特纳姆(Raj Rajaratnam)的内幕交易案,如今,他是德杰律师事务所(Dechert Law Firm)驻纽约合伙人,就购买和使用什么数据集是合法的提供咨询意见。该律所拥有大量对冲基金客户。
    “就我所知,还没有一起案件被提起诉讼,但大家都预计,不久后就会有一个,(检方)会愿意提起一个案子。”斯特里特说,“这是个热门话题。很多客户给我打电话咨询。”

今年,亿万富翁史蒂夫•科恩(Steve Cohen)的家族理财室Point72 Asset Management的一名资深高管夸耀“大数据”是其新的市场优势。2013年,科恩管理的对冲基金SAC Capital Advisors因内幕交易被联邦当局责令关闭。

在伦敦政治经济学院(LSE)的一次另类投资会议上发言时,Point72 Asset Management的首席市场情报官马修•格拉内德(Matthew Granade)骄傲地宣称,他们每日分析8000万笔信用卡交易。结合可以扫描停车场的卫星图片和显示多少人在逛不同商店的手机地理定位数据,这家投资集团可以在各公司发布报表前很久,给出有关它们经营状况的判断。

LSE的一名学生询问,如果大家都获得了相同信息,那么这些信息如何能帮到该公司呢?格拉内德说,答案就是独享协议——“这个领域的美妙之处在于,你可以在拥有独享信息的领域安排交易”。

  1. 地理定位

智能手机上安装了定位服务,让我们能够使用地图或天气功能,但这也让移动运营商能够了解我们在任何时刻所处的位置。这些数据可能具有很大价值,掌握了这些数据的人可以了解我们逛哪些商店、入住哪些酒店或在哪些餐馆用餐。对于努力寻找消费趋势的线索的对冲基金而言,这些数据就是一座金矿。

对冲基金始终寻求采用各种方法获得一种优势,无论是请高管吃大餐、以了解他们的公司经营状况如何,还是聘用民调机构在选举或公投之前开展独立调查。加强监管和打击内幕交易,在一定程度上减少了这类信息渠道,但另类数据可以提供不同的途径。

投资者面临的最大挑战在于,每天生成的数字信息的规模十分庞大。德银(Deutsche Bank)资料显示,世界上目前存在逾10亿个网站和逾10万亿张单独网页,数据量达500艾字节(即5000亿个千兆字节)。互联网每年新增逾1亿个网站。

越来越多的公司提供抓取、清理并把这些数据出售给投资界的服务,以帮助人们在这片数据的沼泽中通行。这些公司是信息生成者——比如应用商店、电话和信用卡公司或社交媒体网站——与数据买主之间的桥梁。

得到另类数据销售商YipIt Data投资的信息提供商Alternative Data Insight表示,这个领域存在逾100家公司,资金还在大举进入。卫星成像公司SpaceKnow今年融资400万美元。该公司收集有关中国和非洲经济活动的线索。情绪分析公司Prattle融资330万美元。该公司使用人工智能把央行官员的讲话等材料加工成可以交易的情报。

4.卫星图像

过去几十年,投资者或许会派年轻的实习生去一家当地购物中心统计有多少人光顾,或者去当地农场检查最新这一茬大麦的长势。如今通过访问卫星——“天空中的眼睛”——数据,可以更全面、自动化地完成此类信息收集工作。

“另类数据只会另类一段时间,最终会成为投资组合经理工具箱的核心部分。”市场咨询公司Greenwich Associates在最近一份行业报告中写道。

目前没有任何迹象表明,对冲基金和另类数据销售商对新型数字化数据集的使用存在任何违法之处。但律师呼吁谨慎行事,他们认为该行业的某些方面——比如数据提供方收集出售给对冲基金的信息的方式、以及基金与数据提供方签订“独享”协议是否合法——正引起监管机构和检方的兴趣,他们担心对冲基金从中获得不公平的市场优势。他们的部分同事放任不管的态度以及一些数据销售商也正在受到审视。

对冲基金还担心,一些数据销售商没有把个人可识别数据从它们的信息“宝箱”中清除干净。因此很多对冲基金会在这些数据与投资过程扯上任何关系前,让内部团队“洗净”这些数据。事实上,一些对冲基金经理表示他们欢迎美国证券交易委员会(SEC)等联邦监管机构更密切地关注另类数据。

“这就像是‘蛮荒西部’(Wild West),最终会进入监管部门的管辖范围。”一名基金经理表示,“我们尚未看到这方面明确的法律意见。我们一直在寻求明确法律意见。”这位基金经理表示,关于该问题的法律意见存在分歧。

对冲基金有充分理由担忧。在2010年来一系列被捕事件后,数十名交易员、投资组合经理和分析师因利用他们从所谓的“专家网络”公司那里获取的信息而遭到起诉,该行业摔了个大跟头。跟数据销售商类似,“专家网络”公司也试图充当投资者与信息之间的桥梁。

华尔街的交易员利用公司内部人士、医生和其他人来增进他们对行业趋势或公司状况的了解。当交易员触及未发表的药物试验结果等机密信息时,当局出手打击。

一个人基于收到的原本应该保密的“重大非公开信息”采取了行动,才算违反了有关内幕交易的规定。律师表示,既然这些数据集已经出售,那么它们不言而喻是“重大”的,因为有投资者愿意花钱购买;话虽如此,一旦用户勾选了同意使用条款与条件的小方框,数据销售商往往就拥有了出售总体数据的许可。但在几乎没有法律先例、各国之间甚至美国各州之间标准各异的情况下,这部分的法律操作并不明确。

德杰律师事务所的斯特里特认为,以内幕交易为由起诉那些利用被认为是非公开数据的基金,对检方而言很可能难度很高。比如,手机地理定位数据能够显示在特定时间段内有多少人光顾沃尔玛(Walmart)、西尔斯(Sears)或者拉尔夫劳伦(Ralph Lauren),这些数据很可能被视为重大信息,而如果有50只对冲基金支付10万美元买下这些数据的独享权,就很难主张这些数据是公开数据。斯特里特表示,关键在于,AT&T或者Verizon等信息的所有者,是否就将这些信息出售给第三方征得了顾客的同意。

“看看条款里的小字细则,很可能有一处会说Verizon可以出售这种数据。这样Verizon就可以与数据提供商签署协议。那么,根据美国的法律规定,就不存在违背义务,不是内幕交易。”这位前检察官说。
还有许多数据销售商从各个网站抓取信息,然而律师表示,即使这些信息存在于公共空间,这些数据提供商也未必总是有合法权利将数据出售给第三方。

Neudata是一家代表投资集团审查数据集的公司,公司主管拉多•利普斯(Rado Lipus)表示“独享数据集是一把双刃剑”。尽管这种数据集可能带来非常丰厚的利润,它们显然并非公开数据,一些投资机构——尤其是较大型的投资机构——为了避免任何的争议,宁可不使用这类数据。英仕曼集团(Man Group)和AQR Capital Management等几家大型对冲基金则更进一步,表示无论是从价钱还是法律风险角度考虑,使用独享数据集都划不来。

律师表示,考虑到跟不当行为扯上哪怕一丁点关系都将导致的法律和声誉损失,他们建议客户不要使用某些数据集。但专家们认为,因使用这类数据遭到起诉的最大风险来自纽约州总检察长埃里克•施奈德曼(Eric Schneiderman)。他正依据《马丁法案》(Martin Act)来处理金融欺诈行为,他有可能阻止对冲基金使用独享数据。施奈德曼此前就曾出手干预过。2013年,汤森路透(Thomson Reuters)在施奈德曼的压力下停止向高级订阅客户提供一些独享内容。

英仕曼集团首席投资官桑迪•拉特雷(Sandy Rattray)表示,每周至少有两个人向他兜售独享数据,但这些数据太过昂贵,而且他们反正也会以与其他基金不同的方式来分析数据。“数据挖掘领域现在有一股淘金热。”他说,“大多数出发去淘金的人都两手空空地回来,但这不意味着没有金子可淘。”

译者/何黎

(转)对冲基金投身“另类数据”淘金热相关推荐

  1. 另类数据:投资中的怪咖

    指数基金一般是小白投资理财的首选,可是,你是否知道指数基金背后的构造逻辑呢? 都说投资时不懂不要投,相信当我们了解了其背后的构造逻辑后,能够更好地选择基金产品,也能更安心地赚钱! 本文就带大家来了解一 ...

  2. 一纸读懂另类数据 | 未央研究

    一纸读懂另类数据 | 未央研究 未央研究 清华大学五道口金融学院 今天 什么是另类数据? 1.定义 另类数据(Alternative Data)是不同于传统的交易所披露.公司公告披露的新数据,是有利于 ...

  3. 另类数据的全面解析与24种场景应用!

    什么是另类数据? 另类数据是投资过程中使用的非传统数据,它使得越来越多以前无法收集的信息变成了可以分析的数据 ,而从这些杂乱无章的信息中找到规律的能力也变得无比强大. 另类数据是用于金融交易的非传统性 ...

  4. 另类数据:跟踪期货高手持仓策略(完整录播)

    数量技术宅团队在CSDN学院推出了量化投资系列课程 欢迎有兴趣系统学习量化投资的同学,点击下方链接报名: 量化投资速成营(入门课程) Python股票量化投资 Python期货量化投资 Python数 ...

  5. 投身大数据领域,你对flink培训课程付出足够多的努力了吗?

    投身大数据领域,你对flink培训课程付出足够多的努力了吗? 我们都知道阿里对于大数据的布局非常的早,其对于flink的应用也非常的重视.阿里不仅斥资9000万欧元收购Flink母公司Data Art ...

  6. 策略死守“传统数据”招招落于人后?-也许您需要另类数据

    在大数据技术突飞猛进的时代,传统的数据公布和使用方式(比如坐等公司财报或静候研究员实地调研)已经愈发显得跟不上节奏,投资者们开始发掘新的"数据金矿"--另类数据. 那么,什么是&q ...

  7. 人工智能系列:数字经济下,另类数据产生的量化投资机会

    随着Thasos数据公司在2018年通过监测特斯拉员工手机的信号输送,成功在特斯拉公司发布财报前准确预测出特斯拉第三季度的产量,另类数据挖掘逐步介入大众的视野.在随后数年,诸多企业通过对另类数据的挖掘 ...

  8. 【金融科技前沿】可感知经济学(群体行为,另类数据,揽月系统,ESG)

    本周的金融科技由微众银行AI部门的吴海山老师为我们带来了"可感知经济学"(Senseable Economics)的分享.除了关于可感知经济学的前沿知识外,笔者感受最深的是吴老师很 ...

  9. 另类数据Alternative Data行业调查

    Alternative Data行业调查 1. 另类数据的定义: "Alternative data in finance refers to any data that is not tr ...

  10. 另类数据的崛起——CnOpenData在行动(下)

    上篇:另类数据的崛起--CnOpenData在行动(上) 前不久,来自哥伦比亚大学的姜纬老师做了一场名为**<from working paper to publication>**的线上 ...

最新文章

  1. 深入理解js的变量提升和函数提升
  2. python selenium 弹窗获取元素_python中能否使用selenium获取弹窗的文本内容?
  3. python段错误原因_python – 捕获崩溃的子进程的“分段错误”...
  4. [BUUCTF-pwn]——mrctf2020_easyoverflow
  5. tmux 如何自定义背景颜色 | How does the tmux color palette work?
  6. 什么是千兆光纤收发器?其产品标准具体有哪些?
  7. 2.2线性表的顺序表
  8. docker rabbitmq_RabbitMQ的介绍及使用进阶(Docker+.Net Core)
  9. 力压微信成 App Store 榜第一,子弹短信能否避免火一把就“死”?| 畅言
  10. 重新想象 Windows 8.1 Store Apps (91) - 后台任务的新特性: 下载和上传的新特性, 程序启动前预下载网络资源, 后台任务的其它新特性...
  11. 如何自学python-如何自学python语言
  12. CListCtrl,SetItemState 高亮(显示蓝色)
  13. log日志java web_Java Web log4j (日志)
  14. 计算机常见故障英语,常见电脑黑屏(有英文字母)的解决办法
  15. 【学习笔记】在KEIL中stm32移植51代码时位定义变量的替换
  16. Win11如何增强麦克风?Win11增强麦克风的设置
  17. JavaScript 全栈工程师培训教程
  18. 【Docker 那些事儿】如何安全地停止、删除容器
  19. 修复win7本地服务器,win7开启本地服务器配置
  20. js导出科学计数法_怎么让js不自动转换成科学计数法

热门文章

  1. centos7显示时间的时区修改
  2. 【svn】SSL error: A TLS warning alert has been received的解决方法
  3. [WPF] 动画Completed事件里获取执行该动画的UI对象
  4. APUE学习笔记——信号
  5. 令人蛋疼的错误提示 0xcdcdcdcd ,0xdddddddd ,0xfeeefeee ,0xcccccccc ,0xabababab
  6. Plan——没有计划不可能越狱
  7. OpenCV实现摄像机标定和像素转换,surf寻找特征点,FLANN匹配算子进行匹配
  8. Visual Studio中从应用程序中调试SQL脚本
  9. notify和notifyall的区别
  10. 通过谷歌浏览器,找到页面某个事件属于哪个js文件