转载自:http://www.techug.com/what-is-big-data

关于大数据,有这样一段话:

“Big data is like teenage sex,everyone talks about it,nobody really knows how to do it,everyone thinks everyone else is doing it,so everyone claims they are doing it.”

看完这句话,大家对什么是“大数据”有点概念了吗?目前,大多数人对大数据的概念还停留在:就是海量的数据,PB(1PB=1024TB)级别的,甚至是 EB、ZB 以上的数据,通过对这些数据进行深入分析,就能得出非常有价值的结论,指引企业做出最佳决策。

大数据就是那种每个人都听过,或者看过此类文章,但却不怎么了解的事物。

其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数据分析,是通过提出假设然后获得相应数据,最后通过数据分析来验证假设。而大数据不是这样的,大数据是从收集的海量数据中,通过算法将这些来自不同渠道、格式的数据进行直接分析,从中寻找到数据之间的相关性。简单而言,大数据更偏重于发现,以及猜测/印证的循环逼近过程。

而大数据的价值体现在对它的分析利用上。一直以来,大数据的瓶颈并不是数据规模巨大导致的存储、运算等问题,而是在前端数据的收集途径,以及对数据进行结构化处理,进而引导后期的商业决策中的模型和算法问题。

各个行业都在产生数据,现代社会的数据量正持续地以前所未有的速度增加着。这些不同类型的数据和数据型,极其复杂,包括结构化、半结构化和非结构化的数据。企业需要整合并分析来自复杂的传统和非传统信息源的数据,包括企业内部和外部的数据。随着传感器、智能设备和社会协同技术的爆炸性增长,数据的类型变得难以计数,包括文本、微博、传感器数据、音频、视频等。

而现在大热的数据分析师正在做的是这样的工作:收集信息,将信息结构化数据化,最后才是我们能看到的大数据带来的神奇力量。但问题是其中对数据进行处理工作量太大了。根据访谈和专家测算,数据分析师的 50%~80% 的时间都花在了处理数据上。

在智能手环公司 Jawbone 负责数据工作的 Monica Rogati 说:

处理数据是整项工作中巨大的部分。但有时我们感到沮丧,因为好像不停地处理数据就是我们做的所有事情。

这听起来有点像冰山理论,即我们能看到的大数据只是冰山露出来的一个小角,而我们看不到的地方,如大数据的前期工作,就是海水下是更巨大的部分。

但咨询公司麦肯锡曾在 2011 的报告中指出:

“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”

是的,存在问题的地方也潜藏着机会。原始数据的格式和来源不可计数,举一个例子,假如一家食品行业的企业需要进行大数据的收集和分析,它能收集的数据包括产量、出货的位置信息、天气报告、零售商每日销售量、社交媒体评论等。而根据这些信息,企业能够洞察出市场的风向和需求的变化,进而制定相应的产品计划。

的确,获得的信息越多越有利于企业做出明智的决策。但这个决策是建立在不同的数据集之上的,这些来自各种传感器、文档、网页、数据库的的数据,全部都是不同的格式,它们必须要被转换为统一的格式,这样软件才能理解它们,进行分析。

将各类数据进行格式统一是一个严峻的挑战,因为数据和人类语言一样都具有模糊性,有些数据人类知道是什么意思,但电脑却不能识别,因此我们需要人工来一次又一次地重复这个工作。

现在已经有不少的初创公司试图开发相关的技术来减轻这项工作,例如 ClearStory Data,一家在帕洛阿尔托的初创公司,它开发的软件能识别不同的数据来源,将它们整合,并将结果用视觉方式呈现,如图表、图形或数据地图。再如 Paxata,一家加州的初创公司,专注于数据的自动化——发现、清理、调配数据,通过 Paxata 处理过的数据能被送入各种分析或可视化软件工具。

大数据目前的情况和计算机发展的轨迹有点相似。一种先进的技术,最初往往只被几名精英掌握,但随着时间流逝,通过不断地技术创新和投资,这项技术,或者说工具,会变得越来越好。特别是当其融入到商业领域中后,这项工具就能得到广泛应用,成为社会中的主流。

所以我们现在是历史的见证者,看着大数据如何一步步完善,我们都需要掌握或选择一个最佳的分析方法,以更好地挖掘出大数据的价值。

继续探索吧。

大数据是个什么鬼啦?相关推荐

  1. 如何从大数据中获得农业数据_大数据在农业中的四大应用

    原标题:大数据在农业中的四大应用 农业大数据到底是什么鬼? 相信许多人都有这个疑问.简而言之,一切与农业相关的数据,包括上游的种子.化肥和农药等农资研发,气象.环境.土地.土壤.作物.农资投入等种植过 ...

  2. [转]大数据+HR”不再是忽悠

    引子 都说HR要用数据说话!现实中很多HR不是拿不到数据,而是不知道怎么进行数据的转化和运用.HR要提升岗位价值,显化工作效益,为公司战略提供决策依据,那必须得会数据的分析和转化. HR手中的数据越来 ...

  3. 大数据技术-hive窗口函数详解

    有不少同学一听这个标题,hive窗口函数是什么鬼?没听说过还有窗口函数这个东西啊,其实它的用处可大了,下面听小千慢慢道来. hive窗口函数 窗口函数指定了函数工作的数据窗口大小(当前行的上下多少行) ...

  4. oracle 删除主键_大数据量删除的思考 4

    译者  汤健 · 沃趣科技数据库技术专家 出品  沃趣科技 在本系列的前一期文章中,我制作了一些图,突出显示了按表扫描执行大量删除操作和按索引范围扫描执行大量删除之间的主要区别.根据所涉及的数据模式, ...

  5. 大数据和人工智能时代下的运筹学

    首发于[运筹帷幄]大数据和人工智能时代下的运筹学 大话"人工智能.数据科学.机器学习"--综述 1 2 个月前 作者系美国克莱姆森大学运筹学硕士,Ph.D. Candidate,师 ...

  6. 卷王指南,大学计算机专业,面临分专业,计科,软工,大数据,物联网,网络工程,该选什么?

    同学们好,我是王老师--二哥呀!(笑喷) 好巧!前几天有同学私信问过我这个问题:大学计算机专业,面临分专业,计科,软工,大数据,物联网,网络工程,该选什么?再加上高考结束后填报志愿,想必 CSDN 上 ...

  7. 没想到这一天来的这么快 大数据之下再无隐私

    2019独角兽企业重金招聘Python工程师标准>>> 作者:肥肥猫 我最近发现个诡异的事情. 我前几天在淘宝和京东分别搜过一样特别小众的商品,小众到什么程度呢?小众到一般人根本不知 ...

  8. 大数据里面说的“移动计算比移动数据划算”究竟是什么意思

    经常看到一些大数据相关的博客,提到这样的一句话:移动计算比移动数据便宜. 然后巴拉巴拉一大堆解释,每一句解释里面又会出现新的一些名词,节点啊,容器啊啥的. 当然,这些东西对于一些有大数据经验的人来说, ...

  9. 大数据江湖之即席查询与分析(上篇)--即席查询与分析的前世今生

    如今,大数据领域新技术层出不穷,可谓百家争鸣,甚是红火.不乏有些玩家动辄搞出个大数据平台,可谓包罗万象,号称无所不能.小弟则以为在大数据江湖中如能修炼好独门绝技,有能拿得出手的看家本领已然实属不易.小 ...

最新文章

  1. Java项目:CRM客户管理系统(java+SSM+jsp+mysql+maven)
  2. CCNA-EiGrp学习
  3. CMD(SA400 Command)
  4. linux tr 变量大小写,使用tr命令快速达到大小写互换——深圳培训linux
  5. ncnn源码编译安装
  6. weex css单位,Weex系列(7) ——踩坑填坑的总总
  7. Makefile和automake中判断CPU位数
  8. 保证一个用户已选取的记录不被其他用户选取
  9. typeorm_Nestjs 热更新 + typeorm 配置
  10. 中科院博士整理的机器学习算法知识手册,完整 PDF 开放下载!
  11. 服务至上——安擎的待“客”之道
  12. 大屏监控系统实战(15)-打包上线及总结
  13. 计算机常发故障英语,vipkid英语常见问题解决办法
  14. 2014年二级c语言题库,全国计算机二级c语言题库试题
  15. matlab现值与终值函数_Matlab金融工具箱中的主要功能函数
  16. CR渲染器全景图如何渲染颜色通道_无需凤凰流体,就可以制作3D火焰效果?「渲云渲染」...
  17. android缓存清理代码,安卓缓存清除和计算
  18. 《初等数论及其应用》第三章 素数和最大公因子
  19. 路由 router-view 实现点击跳转时不打开新网页,而是在当前显示
  20. 通过基因组选择预测杂交水稻的表现(数据挖掘)

热门文章

  1. S3C2440—7.存储控制器访问外设
  2. 2019年10月全国程序员工资统计,一半以上的职位5个月没招到人。
  3. 谷歌浏览器设置自动播放视频(转)
  4. 武汉理工大学计算机学院研究生复试,2017武汉理工大学计算机考研复试经验
  5. 计算机英语长句,英语长句分析经典100句.doc
  6. 校园电竞,为何如今仍“无利可图”?
  7. 腾讯云部署flask,在云控制台打开端口后,还需在服务器内查看防火墙端口状态
  8. 【Android安全】小米8刷机、救砖、root教程
  9. 解决Request method 'POST' not supported问题
  10. java高级工程师_java 初级、中级、高级工程师等 如何区分?