关注公众号,发现CV技术之美

(本文阅读时间:7分钟)

编者按:2020年新冠疫情肆虐全球,为了控制疫情蔓延,找到应对措施,美国疾病控制中心公布了大量疫情相关数据,向全世界顶级科研机构救助,希望科学家们可以利用技术能力,提供具有较高参考价值的预测数据,从而帮助制定有效的控制策略。微软亚洲研究院基于时空预测技术,训练了针对新冠疫情的预测模型,并于2020年下半年被美国疾控中心采纳使用。在过去的近一年中,该预测模型的表现整体优于全球其它四十几家科研机构提供的预测模型。日前,微软亚洲研究院基于此前的技术积累,正式推出了面向全行业的时空预测开源工具 FOST。

什么是时空概念?“时”是指时间序列,“空”即空间上的相互影响和联系。例如,物流行业每个站点的历史派件量是时序关系,而各中转/配送站点间又存在空间上的联系;再比如,在新冠疫情防控中,各级行政区域的每日感染病例数字,单独来看是时序关系,而彼此之间的关联则属于空间关系。

“时空”因素在各行业中的广泛存在,使时空预测成为众多行业进行科学决策、优化效率的关键。近日,微软亚洲研究院推出了面向全行业、具有高度通用性与易用性的时空预测开源工具 FOST(Forecasting Open Source Tool)。存在相关需求的企业和机构可以基于这一便捷易用的工具生成高效的时空预测解决方案。

GitHub 链接:

https://github.com/microsoft/FOST

共性抽象:时空预测开源工具FOST

近年来在与行业伙伴的紧密合作中,微软亚洲研究院的研究员们发现,时空预测需求普遍存在于物流、电信、医疗、交通等许多行业中。然而,当前大部分的时空预测还只是停留在研究阶段,真正应用时,大家只是相互借鉴思路,想要解决实际问题还需要各自从头开始一点点摸索,并没有一个简单、易上手的通用工具。

基于与多家企业在时空预测上的合作研究,微软亚洲研究院的研究员们抽象出了行业共性问题,将多年的技术和经验积累进行转化,推出了具有极高行业通用性的时空预测工具 FOST。

FOST 架构图

要使时空预测工具兼顾通用性和可用性,需解决三个常见问题:第一是数据的质量问题,这就需要降低数据噪音,减小信息缺失的影响;第二是时序上要能对趋势、周期、突发等各类维度具有良好的包容性;第三则是在空间维度上打破以往预测模型只能单点预测的局限性,能够在空间结构中准确预测并利用关联影响。

为此,微软亚洲研究院为时空预测工具 FOST 集成了三大功能模块,来应对多种复杂时空条件下的预测:

  • 数据处理:数据降噪,提升数据质量

    在 FOST 中,数据的收集由用户自主完成,这既保证了能够基于多样的场景数据训练出不同的业务场景模型,又保证了用户数据的隐私安全。之后,FOST 会针对存在噪音等问题的质量低下的数据进行清洗,提升数据质量,确保模型训练的准确度。

  • 时序解码:轻量级时序神经网络

    在时序预测上,微软亚洲研究院采用了轻量级深度时序神经网络。

    深度时序神经网络主要用来捕捉实际业务场景中的复杂历史规律。以物流行业为例,可能数据显示某几个站点在夏季派件量比平时多,那么是否就可以推测出下个夏天派件量同样会上涨呢?实际的关联关系通常并不是这么简单就可以推断出来的。深度时序网络的作用就是找出其中的复杂关联和细节规律。

    但深度时序神经网络往往面临训练速度慢,对于噪声敏感的问题。同时在数据量不充足的情况下,容易过拟合训练数据。因此,微软亚洲研究院在深度时序神经网络的基础上通过对时序数据降维,使结构轻量化,从而加速训练效率并稳定预测结果。

  • 空间解码:图神经网络构建层次图

    在空间层上,微软亚洲研究院采用了图神经网络,通过节点间的空间联系,来建模信号变化在空间上的相互影响和关联。例如在疫情数据预测中,一个地区的疫情结果会受到其他区域,尤其是相邻地区的影响,所以预测时也不能忽略空间上的关联。对此,微软亚洲研究院利用图神经网络,在预测疫情发展信息时,也将其他省市的信息参考进来,进一步提升预测的精度。引入图卷积网络后,无论是针对县区的细粒度预测,还是省市级别的粗粒度预测,结果的准确性都大大提升。

微软亚洲研究院副院长刘铁岩表示,“FOST 不是一个自上而下的研究产物,也并不是一开始就有明确计划要进行研发的,而是经过与产业界的深度接触后,我们发现了很多行业在时空预测方面存在的共性需求,包括问题挑战、解决方案等多个层面。因此,我们决定将共性问题抽象出来做成一个通用的开源工具,帮助更多企业借助先进的人工智能技术节省精力、成本,提升运营及创新效率。”

凭借高通用性,应对众多行业时空预测需求

在与时间、空间概念密切相关的行业中,时空预测工具 FOST 如何运作并发挥作用?

依然以较为典型的物流行业为例。如果物流企业希望通过 FOST 对某个大站点的次日派件量进行预测,首先,企业需要在底层的深度时序神经网络模块中输入近一段时期的时间序列数据,包括这个站点的每日总出库量和总收件量,及以该站点为终点或中转站的派件量,之后模型的时序模块会先学习历史数据中的特征,并表示为隐空间中的一组向量。

接下来则需要进一步叠加相邻站点的时序规律信息进行空间上的信息聚合。一个例子是站点与其相邻站点之间往往存在这样的关系——当相邻站点快递件数增加时,就会将一部分快件发送给该站点。在这种情况下,当在时序上预测出该站点次日派件量为200件,同时又看到空间层上相邻站点次日快递件数预计会急剧增加时,就可以预估出该站点次日的派件量可能将远超200件,这样就将站点空间上的关联关系也融入到了模型中。

上述仅是物流行业的例子。很多其他行业场景,如网络基站流量预测、交通流量预测、电力输送预测,与物流行业同样存在共通的时空概念,时空预测工具 FOST 在这些行业上的作用原理也基本类似。

不过要注意的是,对于关联性越大的节点,在预测时就越要优先考虑他们的关联关系,否则如果将所有关联信息都进行无差别计算,那计算量将会巨大到难以承受。比如原本就已经有数千个地点,如果还要将所有地点间的关系都考虑进来,这样的计算量对服务器的要求会非常高,是一般企业所无法承担的一笔开销。对此,微软亚洲研究院也做了很多优化,包括在图随机采样时会优先考虑强关联的信息,从而提高整个预测工具的运行效率。

此外,在某些行业中,空间概念未必仅停留在地理空间层面。例如,在医疗行业的糖尿病患者病情预测中,同一类糖尿病的不同患者,就可视作多个不同空间。一个病人的病情发展规律可以作为历史参考,帮助预测出其他患者的病情发展趋势。

微软亚洲研究院的时空预测开源工具给各行业用户提供了一个简单易用的深度学习“利器”。通过使用 FOST,用户不仅可以有效提升业务场景预测的准确率,还可以避免从头开发类似平台的重复工作。未来,微软亚洲研究院将在当前版本的基础上,持续优化时空预测工具上模型的准确性和训练效率,助力更多企业和机构通过构建时空预测能力创造更大的价值。

END

欢迎加入「计算机视觉交流群

“遇事不决,量子力学”?微软亚研院开源时空预测开源工具:FOST,应对各行业共性预测需求!...相关推荐

  1. 遇事不决,量子力学;不懂配色,赛博朋克。推荐一个Python可视化库

    遇事不决,量子力学;不懂配色,赛博朋克.推荐一个Python可视化库 12月10日,历经多次跳票后,波兰公司CD Projekt Red制作的<赛博朋克2077>终于正式发售,在Steam ...

  2. 传微软亚研院停招国防七子+北邮实习生,18所「实体清单」高校也在劫难逃?...

      转载于 新智元   编辑:桃子 时光 snailnj [新智元导读]听说微软亚洲研究院要停招国防七子及北邮学生了?根据北邮人论坛上讨论,事实却是如此.那么,究竟为何? 一觉醒来,着实大睁眼. 网传 ...

  3. 微软亚研院CV大佬代季峰跳槽商汤为哪般?

    整理 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 近日,知乎上一篇离开关于MSRA(微软亚洲研究院)和MSRA CV未来发展的帖子讨论热度颇高,这个帖子以MSRA CV执行研究主任 ...

  4. 微软亚研院:如何看待计算机视觉未来的走向?

    本文分享自百度开发者中心微软亚研院:如何看待计算机视觉未来的走向? 先说一个现象:在深度学习的驱动下,计算机已经在多个图像分类任务中取得了超越人类的优异表现.但面对一些不寻常的图像,以"深度 ...

  5. 无需Grouping,中科大和微软亚研院提出Group-Free的三维物体检测方法,性能远超之前最好方法。...

    ©PaperWeekly 原创 · 作者|刘泽 学校|微软亚洲研究院实习生 研究方向|计算机视觉与深度学习 无需 Grouping,中科大和微软亚研院提出 Group-Free 的三维物体检测方法,性 ...

  6. 微软亚研院创研论坛CVPR2020分享会 圆桌会议 内容小记

    微软亚研院创研论坛CVPR2020分享会 圆桌会议 内容小记 今天观看了微软亚研院举办的 创研论坛 CVPR2020 论文分享会,分享会邀请了计算机视觉领域多个子领域的大佬们分享已发表的CVPR202 ...

  7. 微软亚研院:CV领域2019年重点论文推荐

    点击我爱计算机视觉标星,更快获取CVML新技术 微软亚洲研究院是国内顶级CV研究机构,众多CV黑科技的诞生地,2020年始,亚研院盘点了2019年CV领域重点论文,大部分附有开源代码,希望对大家有帮助 ...

  8. 微软亚研院提出用于语义分割的结构化知识蒸馏 | CVPR 2019

    作者 | CV君 来源 | 我爱计算机视觉 今天跟大家分享一篇关于语义分割的论文,刚刚上传到arXiv的CVPR 2019接收论文<Structured Knowledge Distillati ...

  9. 微软亚研院副院长周明:从语言智能到代码智能

    11月6日上午,在中国中文信息学会和中国计算机学会联合创办的"语言与智能高峰论坛"上,微软亚洲研究院副院长周明,以<从语言智能到代码智能>为题,介绍了智能代码理解和生成 ...

最新文章

  1. FCKeditor 2.6 精简版
  2. 为什么不推荐正沿+lockup+负沿的scan chain?
  3. 用C#语言构造蜘蛛程序
  4. 用python倒序输出一个字符串_Python 反转字符串(reverse)的方法小结
  5. [云炬创业基础笔记]第一章创业环境测试8
  6. Linear Regression Example
  7. linux 计划任务 实例,计划任务 cron 的配置和实例
  8. 树状数组维护区间和的模型及其拓广的简单总结
  9. Java使用Cipher类实现加密,包括DES,DES3,AES和RSA加密
  10. j2me on android,J2ME和Android的几个基本区别
  11. Scala下载及IDEA安装Scala插件(保姆级教程超详细)
  12. android 换机 备份,Recovery(Android手机备份功能)
  13. 基于几何图形搭建障碍物地图的方法(MATLAB)
  14. 手码-在U-boot SPL 移植新的PMIC芯片驱动
  15. 推荐几款好用的云笔记软件
  16. Dissect ActiveX Control Safety
  17. (论文阅读)基于融合深度卷积神经网络的人脸识别方法研究-褚玉晓
  18. 企业管理之道:中层管理者,到底该管理什么?
  19. Python爬虫实战使用scrapy与selenium来爬取数据
  20. 大无语!!记录一下mac dpabi 安装报错:未定义函数或变量 ‘dpabi‘。Chrome浏览器!!!

热门文章

  1. B树与B+树【转载】
  2. Java类初始化及实例化过程
  3. 入门讲解:使用numpy实现简单的神经网络(BP算法)
  4. 软件工程 - 版本管理 - git 的基本实用方法 - 添加一个完整的项目目录的命令的细微差别
  5. oracle必备文件,oracle初学者必备基础
  6. ajax高效分页查询,基于 Jquery+Ajax+Json高效分页实现代码
  7. vhdl和c语言,VHDL语言中的信号、变量与常量异同比较(转)
  8. java如何实取随机数_java - 如何在Kotlin中获取随机数?
  9. win10怎么修改服务器地址,电脑Windows10怎么修改IP地址的方法
  10. matlab中文帮助_拿走不谢,simulink,stateflow,ecoder帮助手册中英对照版首发