大数据已经成为一个如此普遍的流行词,但有人认为其几乎是毫无意义的。

一名IT行业专家表示,其曾从事信息技术工作超过十年,并记得当时订购新的驱动器和存储设备来处理文件和电子邮件,那时读取上千兆字节的信息,当时以为这样大量的数据就是大数据。

经过七年职业生涯的变迁,这个IT专家就职于亚马逊公司,并在他们的数据仓库中运行SQL查询。该数据库的范围之广,让其甚至花费一个星期的时间汇总数据,而无需再采用Excel表格。他以为明白了什么是大数据,但事实证明,并没有任何线索。

大数据如此普遍已经成为一个流行词,但它几乎是毫无意义的。在一次聚会上,这位专家听到有人说,“每家公司都是一家大数据公司。”并让他解释时,他说,如今每家公司都在购买和销售大数据。这位专家认为虽然所有的公司都可以使用大数据或基于大数据的应用程序,但并不是所有的公司都立足于他们的商业模式。他认为在其职业生涯被这种误解迷惑过,因此,他分享了一些自己的误解。

以下是IT高层管理者对于大数据六个最大的误解和错觉:

1.所有的数据是大数据

调查机构Gartner公司称,大数据必须是大容量,高速度或多样化的各种数据。这意味着,如果你的数据只是处理容纳一个Excel文件,那么你不是在处理大数据。如果你只处理测量千兆字节的数据集,并采用个人电脑能处理,那么你不是在处理大数据。也许你正在处理数千兆字节电子邮件,而你不知道如何处理它,但这并不意味着它是大数据。

2.大数据解决每一个问题

一些高管认为大数据可以解决一切问题。他们中的许多人都掌握大数据分析来解决问题,而不是使用常识。有一次行业专家和IT高管们试图找出为什么其网站访问人数和销售在四月的一个星期期间急剧下跌,前一年同一周没有经历过同样的下降。他们要求进行分析,在分析之后,直到有人说,“嗯,我们每年都看到网站数据在复活节减少,而去年复活节是在三月。”大数据和分析没有帮助我们弄清这一点,但通过社会常识和日历却可以弄明白。

3.大数据是没有意义的

关于大数据的“一切”错误观念的另一面是:大数据并不重要。这个观点可以更容易理解,因为大数据的定义表明,它很难处理和理解。如果你不能从大数据中洞察见解或用它来为你的系统提供益处,那确实是毫无意义的。而有着这样观点的IT管理人员虽然了解大数据,却从未从中学到了什么。

为了让大数据变得有意义,你需要能够处理和使用它,其大数据的公司能够更方便实施。这些公司通过收集,清洗起来,组织数据,并通过数据科学家或其他系统可处理,并输出其方式。一旦数据科学家从数据是分析出信息,或者公司的系统使用的数据来执行类似的供应链业务运营,那么公司高管将开始看到大数据的价值。

4.大数据是很容易的

不幸的是,这是一个常见的误解。让我们看看在世界上的每一个产品的有关信息和定价(免责声明:这是我的公司做的),例如。对于一个单一的产品来说,例如一双鞋,人们需要收集以下数据:

•品牌

•类别

•样式

•颜色

•鞋跟的高度

•材料

•尺寸

•宽度

•出售它的商店

•在这些商店的价格

•随着时间的推移,这些商店的价格

•每次看价格时,其库存如何

这是数学:查询数据库表明,11家不同的零售商在销售同一款,同一颜色的这双鞋。让我们假设正在收集一年中,每个商店销售这款鞋每周的价格和库存数据。这意味着我们有这双鞋的572条记录。如果我们想要追踪春定价和库存信息,其中包括所有16个女鞋的尺寸,这个数字将是9152条。这只是针对一双鞋收集的数据,而在商店鞋柜里的每一双都会创造更多的数据点。

增加的复杂性,在高需求的时间和促销时间收集的价格数据往往比每周一次收集还要多。每日价格和库存信息将意味着一双鞋子有着4015个数据点。亚马逊网站将添加描述这些产品的信息和每个尺寸,以及其对应的不同的价格。因此一双鞋的数据迅速膨胀。想象一下,在这个时代,多达数十亿的产品信息,将其放到你的电子表格中。因此,传统的收集和分析系统将面临大数据的规模的严峻挑战。

5.不完美的大数据是无用的

这个错误让人疯狂的,因为完美的尺度基本上是不可能的。例如,IT部门试图实现让10亿个具有520个数据点的产品保持一个让人梦寐以求的“五个九”的完美标准(99.999%)。那么在此数据集中,仍然会有5200万个不正确的数据点。

大数据很少达到这种完美的原因很多。许多大的数据来源是远远不够完善。亚马逊公司作为抓取大数据来源之一的网站,很可能在产品名称产生拼写错误。大数据也需要建立和组织其机器学习和算法;在产品数据的世界里,这些可以很容易地根据标题或名称错误将产品进行分类。

缺陷并不表明无用,但。一个有能力的数据分析师可以去除异常,并从大数据中拔出重要的见解,即使有很多缺陷。开发人员可以添加过滤器,减少进入你的系统的错误,,并制定庞大的数据集,这将提高数据质量随着时间的推移训练算法。其中大数据的一个最大好处是,可以弥补偶尔缺陷,让你获得更好的见解。

6.只有大公司需要大数据

小型营销企业需要网站的流量和关键字搜索的数字。小型购物公司需要尽可能多地链接联盟计划的大型零售商的产品,按需交付服务,并需要可靠的位置数据。这只是那些需要大数据的小型公司的一小部分。

大型公司可能会产生更多的自己的大数据,但几乎每家公司都在现代经济使用上构建了大数据或应用程序。这意味着所有的企业可以获得访问见解和信息,并获得这些庞大的数据集提供的好处,而无需建立和管理创建和分析大数据所需的基础设施。

如今,无论企业规模如何,都不可回避地采用大数据业务。希望了解这些,可以消除误解和错觉。毕竟,我们生活在大数据世界中。如果管理人员更好地理解复杂性,陷阱和大数据的能力,他们会更好地运行业务,做出更好的决策。

本文作者:Harris

来源:51CTO

高层管理者对于大数据的6个误解相关推荐

  1. 第四章 数据和企业管理,高层更看重大数据

    大数据带来的好处让很多占得先机的企业尝尽了甜头,其后的其他企业相继模仿.穷追不舍.要在这个充满机遇的时代打下一片江山,需要企业上上下下都对大数据有敏锐的把握,专业的综合人才是能够带给企业全新的驱动力的 ...

  2. 人们对大数据的几点误解

    如今,"大数据"的概念已经存在一段时间了,但是很多人似乎仍觉得它被神秘面纱所笼罩.因此,在本文我们将揭示出一些人们对于顶级大数据技术与应用的误解. 每个企业都需要访问数据,从交易. ...

  3. 大数据中存在哪些误解

    事实上,如果企业能够搞清楚围绕着大数据的一些误解,可能能够帮助他们避免制定错误的业务发展方向,进而化险为夷,防止浪费大量的时间和金钱,耗费企业的市场竞争地位,或者损害企业的声誉. 就像任何新科技一样, ...

  4. 《决战大数据》读书笔记

    这段时间在梳理这几年工作有什么沉淀下来和所得时,发现自己总是容易陷入细节,不能很好地拎出一条主线来,也不知怎么拔高一个层次或角度来梳理这几年的数据分析工作. 幸好的是当你心中有所困惑的时候,总是有优秀 ...

  5. 论企业大数据的落地路径

    相信大家都知道工业4.0理念,即利用物联网技术将生产中的供应.制造.销售信息数据化.智慧化,但推行效果并不是很理想,其中很大一部分原因是企业忽略了自身内部信息系统仍有冗余的现象而盲目跟风,过程中由于缺 ...

  6. 关键时刻战略—激活大数据营销 - 电子书下载(高清版PDF格式+EPUB格式)

    guanjianshikezhanlvo-陈刚 & 李丛杉 在线阅读                   百度网盘下载(iqc3) 书名:关键时刻战略-激活大数据营销 作者:陈刚 & ...

  7. 大数据助力智慧城市建设

    在大数据时代,政府治理能力的提升越来越离不开云计算.大数据等技术创造的智慧,而这些"技术智慧"的诞生更离不开城市管理者发掘大数据应用的人类智慧.管理部门不仅要对技术有热情,更要有准 ...

  8. 从直觉主义到量化分析 让大数据做主

    文章讲的是从直觉主义到量化分析 让大数据做主,还记得去年8·15电商竞争价格大战吗?如果你是某电商CEO,你还会采用这样的竞争战略吗?变化是永恒的主题,企业管理不能一成不变.在大数据时代,电商采用价格 ...

  9. 大数据失败案例之七宗罪

    要实现大数据分析项目的最佳实践并非易事.正因如此,Gartner研究总监Svetlana Sicular题为"大数据7大失败案例"的报告吸引了思科工程师Karen Liu的注意. ...

最新文章

  1. ubuntu mysql 更新时间_Ubuntu Server 修改mysql timeout超时时间
  2. 关于owner group others的测试
  3. 计算机网络第六章:应用层
  4. esxi添加网卡驱动
  5. LRU缓存算法缓存设计和实现
  6. C++学习之路 | PTA乙级—— 1084 外观数列 (20 分)(精简)
  7. python自然语言分析 何翠仪_如何用 Python 中的 NLTK 对中文进行分析和处理?
  8. (zt)说说大型高并发高负载网站的系统架构
  9. 2015.3.4 VS2005调用MFC dll时报错及解决
  10. java 发布应用_发布java应用程序的步骤
  11. springbank 开发日志 springbank是如何执行一个handler的requestMapping对应的方法的
  12. Linux内核部件分析 设备驱动模型的基石kobject
  13. python压缩视频文件_python压缩图片和视频
  14. 人工智能畅想——《人工智能简史》读后感
  15. FFmpeg 视频旋转处理命令
  16. 电商数据分析基础指标体系
  17. 硬盘出现“文件或目录损坏且无法读取”的故障,怎么解决?
  18. 一本通 1287:最低通行费 C++
  19. vue项目使用qrcodejs2生成二维码
  20. docker nginx部署.net core后端站点和angular前端站点

热门文章

  1. hbuilderx简单网页代码_Python爬取网页数据
  2. 【模型解读】从2D卷积到3D卷积,都有什么不一样
  3. 速卖通代运营收费标准,什么样的商家适合找代运营公司
  4. 全球及中国电镀砂轮行业盈利模式分析与十四五投资规划研究报告2021年版
  5. 外国人居留证办理手续
  6. filebeat获取nginx的access日志配置
  7. mac打开class文件
  8. sublime 解决中文乱码
  9. 3/14课程 第三章 结构化的项目前期和面向对象的项目前期实例
  10. JS实现表格Table动态添加删除行