大数据的关键思考系列29:数据预测
作者 | 橙子
审核 | gongyouliu
编辑 | gongyouliu
在上次内容中,我们讲到了“大数据与时尚业”,今天我们讨论一下“数据预测”。
从大量数据的收集到找出有用的规律,要预测结果需经得起时间考验,非常不容易。如果不能将预测付诸行动,或者与现实偏差太大,便,前功尽弃。
随着技术进步,数据应用经历了几个重要阶段:从最早期的描述性分析(发生了什么),到诊断性分析(为什么发生),直到今天每一个行业和垂直领域都在努力开展的预测分析(即根据已有的历史数据预测未来)。实际上,最重要的是真正改变生活的数据应用正悄然兴起,商业分析正朝着这个方向走,这就是“Prescriptive analytics” (可译为指导性分析或处方分析),预测不同行动产生的结果,并基于预测给出具体的行动建议。这也是商业分析的突破,预示我们已走入商业核心,创造新的商业模式指日可待。
美国创新公司Flyr Lab把预测分析和指导性分析用于预订机票,基于大量数据和对航空公司制定价格的理解,以此预测未来的机票价格。其实预测价格并不新奇,但利用预测有效地锁定低价机票,这种产品很有意思。
Flyr lab开发了一种新产品叫foresight,并将其用在一个预订机票网站getflyr,从而进入到指导性分析阶段。当你犹豫是今天买300美元的机票还是等几天再买时,getflyr或许可以帮你解决烦恼。你只需花3~30美元,就可锁定未来七天内300美元的机票价格,而且也不必担心机票加价,因为getflyr会为机票价格涨幅买单,而票价下跌时你可以享受低价的机票。这一切都是基于大量的实时计算和模型学习调整,最终呈现给用户明确的解决方案。
上述的例子就是一个概率游戏,若这个为确定性买单(Paid for certainty)的例子普及到日常生活中,可以衍生无数的可能性。机票例子中动态定价能力是这个产品的关键,实时票价的趋势预判和参与人数令风险更容易控制。
哈佛大学医学院的一份研究报告提到,他们在研究参加过战争的退伍军人的战后创伤和精神愈疗时,开发出一个精算模型。这个模型基于近100万名退伍军人数据,能够预测退伍军人的犯罪倾向。美国军方也曾在2004年至2009年试图建立退伍军人的数据库,以研究退伍后军人的行为风险。该数据库表明,其中近6000名退伍军人曾发生暴力犯罪——从谋杀到纵火,等等。哈佛大学医学院的研究者们将这些数据和军队数据、人口数据以及犯罪和医疗数据相结合,开发出了精准模型,以预测参战退伍军人未来的犯罪率。最终结果证明,超过50%的犯罪都发生在模型判定的高风险人群中。未来,或许潜在嫌犯会被提前监控,尽管从传统意义上看,警方的使命是破案而不是防止犯罪。但现在的大数据技术为预测犯罪提供了可能,预防并阻止恶性枪击事件的发生,将在一定程度上为普通民众的生活带来安全保障。
大数据的重要性已不言而喻,而大数据技术在商业活动、社会生活中的作用也越来越明显,越来越重要。
本期的内容到这里就结束了,下期会和大家探讨“大数据与气候”。
本文的视频版本可以直接点击下面视频观看,欢迎关注数据与智能视频号获取更多精彩视频。
大数据的关键思考系列29:数据预测相关推荐
- 「大数据的关键思考系列」6:全域大数据
作者 | 橙子 审核 | gongyouliu 编辑 | auroral-L 全域大数据 在上一期中和大家探讨了"'活'的数据才是大数据".今天和大家分享的是"全域大数据 ...
- 「大数据的关键思考系列」18:阿里巴巴数据化运营的内三板斧之‘通
作者 | 橙子 审核 | gongyouliu 编辑 | auroral-L 阿里巴巴数据化运营的内三板斧之'通' 在上一期内容中,我们讲到阿里巴巴的数据化运营有三板斧,分别是混.通.晒.那么今天想和 ...
- 「大数据的关键思考系列」15:阿里巴巴的大数据实践(1)
作者 | 橙子 审核 | gongyouliu 编辑 | auroral-L 数据盲点的价值 上期内容中和大家探讨了 "数据盲点的价值",那么今天想和大家分享的是"阿里巴 ...
- 「大数据的关键思考系列」21:阿里巴巴运营数据的外三板斧之“存、管、用”(下)...
作者 | 橙子 审核 | gongyouliu 编辑 | auroral-L 阿里巴巴运营数据的外三板斧之'存.管.用' 在上一期内容中,我们讲到了运营数据的外三板斧之"存.管", ...
- 大数据的关键思考系列32:移动大数据的3T
作者 | 橙子 审核 | gongyouliu 编辑 | gongyouliu 在上一期内容中,我们讨论了"负面信息也是决策关键",本期内容想和大家讨论的是"移动大数据的 ...
- 大数据的关键思考系列27:大数据与娱乐业
作者 | Harper 审核 | gongyouliu 编辑 | gongyouliu 在上一期的内容中,我们讨论了"大数据与医疗",本期内容和大家聊一聊"大数据与娱乐业 ...
- 美团住宿业务数据治理体系化思考与实践
全网最全大数据面试提升手册! 一.序言 二.背景介绍 三.治理体系化思考 3.1 什么是数据治理体系化? 3.2 数据治理体系化如何解决目前治理存在的问题? 3.3 业务数据管治体系框架如何建设? 3 ...
- 数据治理体系化思考与实践
一.序言 美团住宿数据治理团队通过多年数仓建设及数据治理的经验沉淀,并结合业务发展阶段对于数据治理的诉求,将治理的思路逐步从专项.表象.问题驱动的治理,转变为自动化.体系化的治理,并从标准化.数字化. ...
- 大数据及人工智能基础系列2 B+树
B+树 是 大数据的常用存储结构,感谢July的分享. 从B 树.B+ 树.B* 树谈到R 树 作者:July.weedge.Frankie.编程艺术室出品. 说明:本文从B树开始谈起,然后论述B+树 ...
最新文章
- python 函数的嵌套 和 作用域链
- C语言中基本的不平衡二进制搜索树实现(附完整源码)
- Linux CENTOS6.5 图形命令互转
- webpack打包css文件
- ADD_SHORTCUT_ACTION
- 全国青少年信息学奥林匹克联赛
- python3 如何读中文路径_Python3操作pdf文件之ReportLab
- java spring 事务传播_深入理解Spring的事务传播行为
- 进行网络数据采集时用 CSS——避免蜜罐
- Gossip 协议详解
- 安装内存条后系统蓝屏怎么解决
- php网站banner图片切换,最简单的Banner轮播左右切换效果代码及实现思路(附带源码)...
- Python提取信息测试
- Kubernates(k8s)工作负载之工作负载资源
- 写的不错的家庭关系的文章,转自天涯。《2》
- MySQL学习笔记_03
- 如何用redis设计一个运动步数排行榜?
- Cocos2dx游戏开发素材/学习网站分享
- 高性能计算,云上见!
- 汶川地震牵动我全家人的心
热门文章
- Seek Tiger创世节点的推出,对于Web3舞台的重要性
- 2017.2.19 日课
- 在浏览器输入一个网址到得到页面的过程(详细)
- 孤尽班第24天 -- JWT
- 如何解决数据库统计时的会计年度和会计月份问题
- string::find()函数和string::npos函数的介绍
- OpenSSL密码库算法笔记——第5.4.9章 椭圆曲线点的加法
- Ivanti宣布收购软件优化专业公司Concorde Solutions
- 隐私计算领域大咖推荐,这些国内外导师值得关注
- 电话号码验证区号-号码-分机