上篇:另类数据的崛起——CnOpenData在行动(上)

前不久,来自哥伦比亚大学的姜纬老师做了一场名为**《from working paper to publication》**的线上报告,在报告中她提出,一个好的story始于观察世界形成想法,再从广泛阅读中获取知识储备,最后,要使自己成为“某个问题的专家”,站在前人肩膀上看问题,无人涉足的研究领域更有其价值。以上获取研究论文灵感的三个方法无一不指向数据对于一篇论文的重要性,尤其是后两点——在广泛阅读中获取使用数据的新思路,以及数据的新颖性。

新思路、新数据,这很难不让人联想到2019年克拉克奖获得者中村惠美的经济学研究。作为一名专注新凯恩斯主义的实证宏观经济学者,中村惠美的主要研究集中于为价格粘性、货币政策等构建坚实的微观基础——利用微观数据探索相关理论的合理性,她的主要贡献也正在于此。

事实上,为价格粘性寻找微观基础的研究从20世纪70年代就已经开始,但中村惠美构建的微观数据库显然分散度更大、频率更高、时间跨度更长,美国劳工统计局(BLS)提供的基础数据使大量商品价格的即时波动数据成为可能,这也为中村惠美对消费者、生产者价格指数的构建提供了坚实的数据基础。同样,在财政与货币政策研究方面,中村惠美也使用了新的数据与新的识别方法以做定义。

得益于新数据库的促进,中村惠美在新凯恩斯主义经济学理论研究方面取得了相当出色的学术成果与贡献。可见,宏观经济学的传统问题并不会随着时代的发展而失去意义,反而会因为新数据、新思路的出现而更显其智慧。一个月前,张博辉教授在2021年CAFC开幕式的主旨演讲中同样也指出这一点:数据构建了研究的核心

看过上述故事,让我们再重新回到姜纬老师的讲座:创新非常重要,这决定了论文能够最终发布,但创新必须建立在大家十分熟悉的框架和语境下。中村惠美的研究也恰恰证明了这一点:理论是旧的,数据是新的,而研究结果也是新的。

毫不夸张地说,在理论研究尤其是经济学研究方面,数据永远是研究的基础,你的数据水平的高度决定着研究成果的高度。

2020年AER期刊统计报告深刻体现着数据对发刊的重要性

那么当你在做研究时不妨先问问自己:那些在某个研究领域中已经被翻来覆去研究过成千上万次的数据,真的能够支持你发一篇顶刊吗?

更何况,数据库的新颖性已经不足以支持你的研究了——别忽视数量。

从姜纬老师的报告中不难得知:二十年前发表一篇顶级期刊只需要2-3个数据库,而现在则需要5-6个;同样,Emerging topic和New dataset对发表的增进效果高达16%和51%,显然,这场新数据库的“军备竞赛”给论文的发表提出了更高的要求。

国内传统的基于公开数据的研究已经很难再发文出刊,在国外同样有这样的趋势,大量的进步学者已经开始在他们的研究中使用另类数据。

我们大可以将在论文写作中使用另类数据类比金融界在投资活动中使用另类数据,另类数据的“信息优势”无处不在,拥有新的数据库表明你不必和他人站在同一起跑线,另类数据的价值在于其包含α,新的idea在顶尖期刊上总是很受欢迎的。

Tell a story显然并非易事——至少要让这个story足够使人耳目一新。

但同样,对于金融研究的可复制性而言,另类数据显得有些令人捉摸不透。在金融界,信息优势会随数据传播而下降,一旦数据的自然生命周期结束,市场就会转向下一个数据;但在学术界,信息优势又常常没有那么重要——你可以选择接着走前人走过的路。在没有人能够百分百确定某个数据集能够回归出自己想要的结果之前,这个数据都会被一部分群体认为是有风险的,作为数据供应商,我们常常被质疑:这个数据能回归出我想要的结果吗?在此,CnOpenData团队想指出:信息优势对应的一定是sharp ratio,但同时,能否把握好这个优势,其决定权在使用者手中。作为数据供应商,我们考虑数据是否完整、字段是否丰富、表格结构是否完备、业内是否需要;作为数据使用者,自然也应当考虑做研究需要什么数据、数据是否符合预期、使用逻辑是否正确、理论是否稳健,综合上述二者,自然不难出好的结论。

尊重原始数据,是我们共同的信念。

以上是CnOpenData团队以供应商视角对另类数据的思考,感谢所有支持、关注我们的学者们,我们对这个行业充满信心。

CnOpenData的另类数据

CnOpenData目前已形成了涵盖专利数据、上市公司数据、银行数据、土地数据、医疗数据、气象数据、文本数据、分地区数据、交通数据、娱乐数据在内的十大数据系列,也将陆续推出工业企业、税收调查企业、海关企业等数据扩展字段,敬请各位学者关注!

另类数据的崛起——CnOpenData在行动(下)相关推荐

  1. 人工智能系列:数字经济下,另类数据产生的量化投资机会

    随着Thasos数据公司在2018年通过监测特斯拉员工手机的信号输送,成功在特斯拉公司发布财报前准确预测出特斯拉第三季度的产量,另类数据挖掘逐步介入大众的视野.在随后数年,诸多企业通过对另类数据的挖掘 ...

  2. 另类数据:投资中的怪咖

    指数基金一般是小白投资理财的首选,可是,你是否知道指数基金背后的构造逻辑呢? 都说投资时不懂不要投,相信当我们了解了其背后的构造逻辑后,能够更好地选择基金产品,也能更安心地赚钱! 本文就带大家来了解一 ...

  3. 另类数据的全面解析与24种场景应用!

    什么是另类数据? 另类数据是投资过程中使用的非传统数据,它使得越来越多以前无法收集的信息变成了可以分析的数据 ,而从这些杂乱无章的信息中找到规律的能力也变得无比强大. 另类数据是用于金融交易的非传统性 ...

  4. 另类数据:跟踪期货高手持仓策略(完整录播)

    数量技术宅团队在CSDN学院推出了量化投资系列课程 欢迎有兴趣系统学习量化投资的同学,点击下方链接报名: 量化投资速成营(入门课程) Python股票量化投资 Python期货量化投资 Python数 ...

  5. 中国大数据金融中心崛起:贵州落子大数据

    中国大数据金融中心崛起 如今,已然抢跑两年多的"大数据",成为贵州金融发展的基石,成为撬动大西南经济发展的杠杆. 对贵州而言,贵州落子大数据,大数据引导金融发展,大数据建立信用体系 ...

  6. 策略死守“传统数据”招招落于人后?-也许您需要另类数据

    在大数据技术突飞猛进的时代,传统的数据公布和使用方式(比如坐等公司财报或静候研究员实地调研)已经愈发显得跟不上节奏,投资者们开始发掘新的"数据金矿"--另类数据. 那么,什么是&q ...

  7. 大数据交易市场崛起,隐私计算助力产业链数字化转型|算力智库隐私专栏

    大数据交易市场正在经历一个新的转折点.前几日,在2020年中国国际服务贸易交易会的论坛上,北京市市长陈吉宁宣布了建立大数据交易所的消息.几天后,<北京国际大数据交易所设立工作实施方案>正式 ...

  8. 【金融科技前沿】可感知经济学(群体行为,另类数据,揽月系统,ESG)

    本周的金融科技由微众银行AI部门的吴海山老师为我们带来了"可感知经济学"(Senseable Economics)的分享.除了关于可感知经济学的前沿知识外,笔者感受最深的是吴老师很 ...

  9. ElasticSearch面试 - es 在数据量很大的情况下如何提高查询效率啊?

    面试题 es 在数据量很大的情况下(数十亿级别)如何提高查询效率啊? 面试官心理分析 这个问题是肯定要问的,说白了,就是看你有没有实际干过 es,因为啥?其实 es 性能并没有你想象中那么好的.很多时 ...

最新文章

  1. idea搭建简单spring-boot项目
  2. cannot import name 'get_all_providers'
  3. 关于Mysql 修改密码的记录
  4. Java生鲜电商平台-用户管理的架构与实战
  5. RocketMQ源码解析-PullConsumer取消息(2)
  6. Android FrameWork——StatusBar
  7. php反向解析域名,域名系统 – Cloudflare,反向DNS和php邮件,最终在垃圾邮件文件夹中...
  8. 含有自增序列的表中使用truncate与delete的不同结果
  9. Redis笔记(五)Redis的事务
  10. swagger常用注解汇总
  11. 多模态算法在视频理解中的应用
  12. XLNet 详解(看不懂你来骂我)
  13. NFA到DFA的子集构造法
  14. 大数据开发工程师是做什么的?
  15. 计算机房灭火器配备标准,消防灭火器配备标准是什么
  16. SAP(Self-Attentive Speaker Embeddings for Text-Independent Speaker Verification)
  17. 33 +创意的蓝色网站设计的灵感
  18. Linux车机平台pulseaudio多alsasink配置
  19. Xampp/MySQL Mysql的启动失败问题(端口号被占用):Xampp port 3306 in use by“ Unable to open process“
  20. U盘背景、图标个性设置

热门文章

  1. 3分钟教你如何在VPS上搭建Hexo!
  2. 12月非农数据意外不及预期一半 现货金起落13美元后再趋稳
  3. WebConfig中的sessionState设置之不理
  4. Tensorflow多GPU计算
  5. 致青春、致所爱的生活
  6. 浅谈私有云端的人脸识别与人证比对
  7. c++ thread 带参数编译错误:/usr/include/c++/4.8/functional:1697:61: error: no type named ‘type’ in ‘class st
  8. leetcode 151 Reverse Words in a String (python)
  9. Maven 使用手册
  10. Ansys Zemax | 用于数字投影光学中均匀照明的蝇眼阵列