一只火鸡,每天都去收集主人喂它的饲料是多少,那么一定时间之后,它认为能够预测明天主人喂多少吃的给他,直到感恩节的前一天晚上,还做出了第二天的预测……

结果是第二天命运就突然发生了重大的转折……

好了,如果这只火鸡统计学家华丽丽的转身进化为火鸡大数据学家,那么它收集的数据就不仅仅是喂食的数据了。他会去收集的数据就不会只针对这一个具体的目标了。

它会去收集天气信息、地理信息、火鸡们的各种习俗、社交数据、LBS信息、火鸡祖宗十八代的生老病死、每类火鸡不同的生活环境……

OK,看见了吧,这位火鸡大数据学家,不需要进行具体的分析,也不需要详细的建模,只需要做很简单的聚合,就会发现每年的感恩节之前,大量的火鸡的生命线戛然而止。它甚至不用明白人类的习俗,也不用具体的去分析原因,数据自然就能揭示出这种规律。

好了,我们的火鸡大数据学家,已经明白了它的宿命,那么怎么办呢?有没有办法突破既定的命运呢?它高呼“我命由我不由天!”,”起来,不愿意做奴隶的火鸡“……

当然,我们都知道,自古圣贤都不得好死,也许这只火鸡会很快就被和谐掉,也有可能被其他的火鸡当成巫师烧死……

那么,作为一个有大数据思维的火鸡,他在无法改变社会的同时,应该如何改变自己呢?继续从数据入手。

首先,他会在通过聚类分析,大量的数据中发现有一些离群点,也就是逃过了平安夜之前那一刀的火鸡们,找到这些离群点之后,将他们作为重点观察目标。

它通过分析,知道火鸡的自然生命是5——6年,那么再次筛选出能够逃过3次平安夜的火鸡们,看看它们存在一些什么样的共同特征。

接下去,如果小数据情况下,这样的样本可能非常少,能三次逃过那一刀的火鸡哪怕用凤毛麟角来形容也不为过;但是在大数据情况下,根据大数原则,只要数据量只够多,再低的几率,都会产生大量的样本。

有这些样本,火鸡大数据学家就开始进行大数据挖掘分析了,比如将这些样本的习俗特性进行分类,可以生成决策树,那么火鸡大数据学家,就能够根据这些if条件,来预言今年平安夜,有哪些火鸡有可能逃过一劫。

又如,进行关联分析,找出与被杀火鸡关联支持度最高的一些特征,这些频繁项集都是被杀的先兆,所以它首先要改变自己的习惯,让自己避免有这些习性。

然,任何预测和分析,都是有风险的,神通不敌天数……我们伟大的火鸡大数据学家预测到了最后,但是气数已尽,非火鸡力所能改变,最终难逃一刀。

故事就这样结束了么?错!神通不敌天数,那好,天数还算不尽人(火鸡)心呢!根据博弈论的原理,当对手知道了你的行动,那么就会做出对自己最有利的绝定,所以这只伟大的火鸡大数据学家做出了一个决定:服!毒!自!杀!!

作为一个大数据学家,如果只是小小的老鼠药,就太丢份了,火鸡大数据学家会收集大量的禽类和人类死亡和疫病信息,终于选择了H70N90(比H7N9强大10倍)这种超强病毒!同样的关联分析,得出最容易感染H70N90的禽类的行为,然后有意识带领着”不明真相的群众”一同努力,终于集体感染了这种病毒。

当然,我们的火鸡大数据学家只是一个理工屌丝宅,还没有升级成为恐怖份子,)如果是恐怖份子,他会在大数据分析的支持下,避免在疫情大爆发的之前表现出被感染的迹象,然后找到各种最容易传播疫情的方式,足以拖着大量的人类一同去见上帝。)在感染了H70N90之后,还是表现出了各种症状来提醒人类,让人类提取有所准备,伟大的火鸡大数据学家选择了在烈火中永生。

这就是大数据,一个足以改变一切、颠覆一切、毁灭一切、创造一切的神奇造物。

一个火鸡界大数据学家的一生相关推荐

  1. 未来智能制造就是跨界大数据

    摘要:"未来智能制造就是跨界大数据,即用户大数据.制造流程大数据和供应链大数据三者打通. "未来智能制造就是跨界大数据,即用户大数据.制造流程大数据和供应链大数据三者打通.明年'双 ...

  2. 如何选择一个合适的大数据可视化工具

    高质量的可视化工具对数据分析是必不可少的.数据可视化工具是一种应用软件,它帮助用户以可视化和图形化的格式显示数据,并提供数据的完整轮廓.饼图.曲线.热图.直方图.雷达/蜘蛛图只是可视化的一小部分,这些 ...

  3. 部门有界 数据无界 大数据需要大胸怀

    最近在推进一些跨域的事情,聆听了一些教诲,获得了一些新的感悟,作为大数据管理者,拥有技术是远远不够的,更需要有大胸怀,特此分享于你. 1. 在架构层面,大数据平台要是企业级的 大数据平台从技术层面讲没 ...

  4. 云栖大会不能错过的一个专场——阿里大数据

    摘要: 2017云栖大会 不能错过的一个专场--阿里大数据论坛 系统性揭秘阿里巴巴背后的数据中台,如何从EB级别海量数据中掘金 导语: 将阿里十余年在大数据领域沉淀的技术能力和应用实践对外分享,首次系 ...

  5. FusionInsight,一个融合的大数据平台

    随着物联网技术和应用的普及,以运营商.互联网以及实体经济行业为代表的企业产生了越来越多的数据,大数据的发展越来越蓬勃. 从2007年开始,大数据应用成为很多企业的需求,2012年兴起并产生了大数据平台 ...

  6. 论一个糟糕的大数据码农的自我修养

    幸福的家庭都是一样的,不幸的家庭各有各的不幸 - 论一个糟糕的大数据平台工程师的自我修养 本来想写写如何成为一名优秀的大数据平台开发工程师,但说实话,这个话题太简单了!虽然我没有被Jeff dean大 ...

  7. 一个常见的大数据平台架构

    这是一个典型的大数据架构,且对架构进行了「分层」,分为「数据源层」.「数据传输层」.「数据存储层」.「编程模型层」和「数据分析层」,如果继续往上走的话,还有「数据可视化层」和「数据应用层」.

  8. 从另一个角度看大数据量处理利器:布隆过滤器

    思路:从简单的排序谈到BitMap算法,再谈到数据去重问题,谈到大数据量处理利器:布隆过滤器. 情景1:对无重复的数据进行排序 @给定数据(2,4,1,12,9,7,6)如何对它排序? 方法1:基本的 ...

  9. 一个好的大数据分析软件包含哪些功能

    随着数字时代的到来,数据已经成为企业最重要的资源.现在企业面临的问题是如何在数据的海洋中获取有价值的信息.在这样的市场背景下,数据分析软件应运而生,许多企业习惯于使用数据分析软件来处理数据.这是因为使 ...

最新文章

  1. 在Windows系统中安装WAMP
  2. python 分布式框架_python分布式框架rq的使用
  3. python3.10_概述 — Python 3.10.0a2 文档
  4. 使用smokeping监测网络
  5. Qt关闭程序的时候创建json文件,再次启动时重新加载到界面上
  6. 6 QM配置-质量计划配置-定义检验特性的编号范围
  7. 《HTML5与CSS3实战指南》——第2章 HTML5样式的标记2.1 The HTML5 Herald简介
  8. linux创建django项目,Ubuntu 16.04下配置Django项目
  9. Java Web学习笔记13:AJAX基础
  10. mysql like n_MySQL LIKE 子句
  11. (篇一)作为一个程序猿,这些C语言实例你必须会!
  12. rss阅读器 java_RSS阅读器
  13. 在服务器上导出dmp文件,远程在服务器上导出dmp文件
  14. 新版 AS9100D:2016航空航天质量管理体系标准变化内容
  15. 360锁屏壁纸在哪个文件夹
  16. 哺乳期这几种还真的要少吃,不能吃的食物真有那么多?
  17. nginx实现静态文件的token认证
  18. pygame 播放音乐
  19. 易语言如何调用c dll文件,易语言调用C++写的DLL
  20. memcpy函数(多积累进大厂)

热门文章

  1. 最新!互联网大厂各职级薪资对应关系图(2020年初)
  2. AC 瘦AP配置 ensp
  3. Docker Networking Docker 网络设置
  4. 多媒体信息即时通讯功能详解
  5. 基于数学形态学的道路裂缝病害检测
  6. 这三种目的投简历,投了也是白投
  7. PhpStorm 2022.1.1(PHP集成开发)
  8. 打架必备!擒敌拳1-16动连贯动作 分解动作
  9. 中国丙烯酸酯和丙烯酸乙基己酯共聚物市场市场发展现状及需求潜力分析报告2022-2028年
  10. MobTech受邀参与华为开发者联盟沙龙,谈数据智能撬动增长