注:本文只是借用新冠肺炎全球确诊人数作为历史数据,来介绍SAP Analytics Cloud基于机器学习的Time Series Forecasting功能,并没有对现实世界中新冠肺炎的发展趋势做出任何实际预测。

Jerry之前的文章 SAP Analytics Cloud和SAP Cloud for Customer的集成 介绍过,我们最近在做一个项目,通过微信小程序在SAP Cloud for Customer里创建数据,并使用SAP Analytics Cloud对这些数据进行分析和预测。

作为一款用于商业智能和协作式企业计划的解决方案,SAP Analytics Cloud结合了预测分析和机器学习技术的强大功能,能够帮助企业相关人员制定明智的决策,实现更卓越的业务成果。

作为SAP Analytics Cloud的突出亮点之一,我们希望能够在项目里尝试其强大的基于机器学习的数据预测功能。SAP Analytics Cloud里基于机器学习的功能点有不少,本文先介绍从使用步骤上来说最简单的Time Series Forecasting(基于时间序列的智能预测)功能。

该功能通俗地说,就是利用过去一段时间产生的历史数据,利用机器学习算法,预测出最近的将来可能会发生的数据。至于背后算法的原理,使用SAP Analytics Cloud的用户一般都不会去关心。

为了体验SAP Analytics Cloud的Time Series Forecasting功能,我选择了全球新型冠状肺炎病毒逐日确诊的人数作为历史数据,并使用SAP Analytics Cloud对其增长趋势进行预测。从下载新冠肺炎确诊人数的历史数据,到最后看到预测的数据,总共耗时不超过20分钟,这说明SAP Analytics Cloud的时间序列预测功能是相当容易操作的。

操作思路如下:

(1) 从相关网站下载新冠肺炎确诊人数的历史数据。
(2) 将历史数据导入SAP Analytics Cloud,创建Model.
(3) 基于Model创建Story,在Story里创建一个Line Chart控件,使用该控件提供的Time Series Forecasting即可。

从下面这个网站下载新冠肺炎确诊人数的历史数据:

https://ourworldindata.org/covid-sources-comparison

下载到本地是一个csv文件,其中有三个数据源,分别来自Johns Hopkins(美国一所常青藤大学), 世界卫生组织WHO和ECDC(欧洲疾病预防和控制中心). 我们选择其中一列即可,本文我选择Johns Hopkins提供的数据。

从csv文件导入到SAP Analytics Cloud生成Model的步骤我就不逐一截图了:

其间有个小问题,SAP Analytics Cloud里支持的Date类型的Dimension的格式如下:

而csv文件导入到SAP Analytics Cloud后,日期列的格式为MMM DD, YYYY的格式,不属于SAP Analytics Cloud支持的日期格式中的任何一种,因此无法直接将这一列设置成类型为Date的Dimension.

所以我们首先要将这一列的数据转换成SAP Analytics Cloud支持的日期格式,比如转换成DD-MM-YYYY, 即日,月和年之间用“-”分割。

首先将原始的MMM DD,YYYY根据逗号拆分成新的三列:MMM,DD和YYYY:

即下图的Date_3, Date_2和Date_2_2, 这三列相当于编程代码里的中间变量:

然后再创建新的一列,编辑公式如下,将刚才生成的日,月和年三列的内容用“-”连接起来。

CONCAT(CONCAT(CONCAT([DD],’-’),CONCAT([MMM],’-’)),[YYYY])

最后生成的经过公式计算后的列位于下图最右边,此时YYYY,MMM和DD这三列的使命已经完成,可以删除了。

这个模型创建好之后,基于该模型创建一个Story,在空白的页面里插入一个Line Chart(线状图):

新冠肺炎的确诊人数选择为Measure,日期选择为Dimension:

SAP Analytics Cloud会默认将Date这个日期类型的Dimension对应的数据进行汇总(Aggregation),因此我将层级结构设置为4,这样得到的统计图表如下图所示:

再选择Drill Down on Date,就能看到每一天的明细数据了:

比如在3月18日这天,全球新冠肺炎的确诊人数快接近43万了。

此时如果要查看SAP Analytics Cloud根据历史数据预测出最近的将来可能会到达的数据,只需要在Line Chart里选择Forecast->Automatic Forecast:

预测完成,SAP Analytics Cloud将这次预测的质量评分为最高分5分,预测出了未来三天即3月19日,3月20日,3月21日的全球确诊人数。

同样的,我们可以设置过滤器,仅仅查看SAP Analytics Cloud根据过去的历史数据,预测出某一个国家未来三天可能达到的确诊数字:

例如,根据SAP Analytics Cloud的预测,美国的确诊人数将在3月19日这一天达到一万。

在Forecast的高级选项里,还能切换使用其他的算法,比如Linear Regression(线性回归)和Triple Exponential Smoothing(指数平滑法)进行预测。

关于SAP Analytics Cloud Time Series Forecasting背后使用的机器学习算法和不同的预测算法之间的区别,SAP官网上有概要介绍:

https://www.sapanalytics.cloud/resources-your-guide-to-time-series-forecasting/

随着Jerry项目的进行,我会继续分享在项目中学到的SAP Analytics Cloud相关知识。最后希望新冠肺炎在全球的肆虐能早日结束,大家都能回复到正常的生活工作状态中来。感谢阅读。

要获取更多Jerry的原创文章,请关注公众号"汪子熙":

使用SAP Analytics Cloud显示全球新冠肺炎确诊人数和发展趋势的预测相关推荐

  1. 使用SAP Analytics Cloud展示全球新冠肺炎确诊总人数的分布情况

    截至2020年3月27日,全球新冠肺炎总确诊人数为五十二万七千三百二十九人. 确诊人数最多的三个国家:美国,中国,意大利 第四第五是:西班牙,德国. 要获取更多Jerry的原创文章,请关注公众号&qu ...

  2. 推荐一个提供全球新冠肺炎确诊,死亡和治愈人数的网站,提供csv下载

    我有一个需求,每次向SAP Cloud for Customer发送HTTP get请求时,需要自动填充自定义头部字段的值为当年时间戳,这个功能可以通过在http头部定义名为date的变量, 同时在P ...

  3. Python数据分析高薪实战第十天 EDA实战-全球新冠肺炎确诊病例趋势分析

    27 初识 EDA:全球新冠肺炎确诊病例趋势分析 从本讲开始,我们会通过四个具体的案例来将我们之前学习的 Python 数据分析方面的知识全都串起来.一方面能够融会贯通,另一方面也能帮你掌握数据分析基 ...

  4. ​​​​​​​微信、Facebook牵手合作,抗击全球新冠肺炎疫情

    抗击新冠肺炎,已经成为全球共同的一场战"疫".3月25日,在世界卫生组织(WHO)的支持下,微信联合Facebook等各大科技互联网平台共同发起了一项科技公益倡议,通过" ...

  5. 盖茨基金会宣布再追加捐赠1.5亿美元,支持全球新冠肺炎响应行动

    比尔及梅琳达·盖茨基金会(简称"盖茨基金会")宣布再次追加捐赠金额,以支持全球对新冠肺炎(COVID-19)疫情的响应行动.此次盖茨基金会额外赠款1.5亿美元,并承诺将动用基金会& ...

  6. 抗击肺炎:新冠肺炎疫情数据可视化及疫情预测分析

    疫情当前,共克时艰. 在新型冠状病毒感染的肺炎疫情牵动社会人心的关键时刻,本文将利用数据分析.数据挖掘.机器学习相关方法,围绕疫情态势展示.疫情走势预测进行分析,挖掘复杂异构多源数据之间的关联关系,以 ...

  7. 使用SAP Analytics Cloud显示新冠肺炎病毒感染人数的实时信息

  8. 2021-2027全球与中国新冠肺炎安全和防护产品市场现状及未来发展趋势

    2021-2027全球与中国新冠肺炎安全和防护产品市场现状及未来发展趋势 COVID-19安全和预防产品是一系列保健和疾病预防产品,涵盖各种设备. 它旨在准备,预防和应对Covid-19的紧急情况并进 ...

  9. SAP Analytics Cloud和SAP Cloud for Customer的集成

    最近Jerry做的一个项目需要使用SAP Analytics Cloud和SAP Cloud for Customer进行集成.以前我对这个领域是一无所知,正好借此机会学习. 项目背景在Jerry之前 ...

最新文章

  1. LeetCode第 146 号问题: LRU 缓存机制
  2. 手机短信验证码真的安全吗?
  3. [CentOS7] systemd
  4. Webservice入门教程_用CXF编写基于Spring的WebService
  5. creating a tensor from a list of numpy.ndarray is extremely slow Please consider converting the lis
  6. 朋友圈有趣的灵魂都去哪了?这几个优质公号给你答案
  7. 前端学习(1422):ajax获取服务器端的响应
  8. 分别标记区段的 飞鸽传书 左、右端
  9. 有趣的图说 HashMap,普通人也能看懂
  10. matlab将矩阵分解成lu,10行代码实现矩阵的LU分解(matlab)
  11. php不兼容_怎么解决php不兼容问题
  12. html超链接地址隐藏,如何在Excel中隐藏超链接地址?
  13. 华硕的电脑装linux系统安装教程,华硕笔记本电脑一键重装系统详细教程
  14. a later version of node.js is already installed. Setup will now exit.
  15. mplayer全参数
  16. 3dmaxs坐标轴不显示灰色显示(没有坐标轴箭头)
  17. HDU 1512 Monkey King 左偏树 + 并查集
  18. Oracle EBS R12 整合ADF
  19. PRTG - Paessler Router Traffic Grapher 6.0.5.516/517 软件试用
  20. 为什么我可以正常上网,却ping不通自己的外网IP呢???

热门文章

  1. centos下配置vsftpd
  2. 待字闺中:日志查询。(网络摘要)
  3. va_start、va_end、va_list的使用
  4. ibernate ID生成策略 小知识
  5. Linux服务器部署邮件服务器详细操作文档
  6. BZOJ2535 [Noi2010]Plane 航空管制 【贪心 + 堆】
  7. JAVA 通过 Socket 实现 TCP 编程
  8. 【模糊数学】编程实现文献“研究生招生中的模糊聚类分析方法”
  9. 51nod 1258 序列求和 V4
  10. CSS3中制作倒影box-reflect