无论是在公司上班或是在学的莘莘学子,我们每天上传至云端的档案数量,多达1亿张相片、10亿份文件… 更别提数位影音、交易、生物医疗… 每天全球所所创造的资料量高达 2.5 exabyes。
但资料量大就是大数据吗?

大数据是什么?

大数据(Big Data)又被称为巨量资料,也指数量庞大而无法以传统方式处理的资料,其概念其实就是过去10年广泛用于企业内部的资料分析、商业智慧(Business Intelligence)和统计应用的总和。但大数据现在不只是资料处理的工具,更是一种企业思维和商业模式,因为资料量大量增加、软件技术进步、储存设备成本下降和云端环境成熟等等,让资料分析从过去的洞悉历史进阶到预测未来,甚至是破旧立新,开创新的商业模式。

大数据的兴起使资料探勘、统计领域成为热门科目,也使大数据工具开发更加快速、更容易取得与使用。而无论何种产业皆能透过分析大数据预测未来趋势,使大数据成为各行各业都在发展的数位技术。

大数据的特性

一般来说大数据的特性可被归类为「3V」,包括资料量(Volume)、资料多样性(Variety)与资料实时性(Velocity)。但其实不论是几V,大数据的资料特质和传统资料最大的不同是,资料来源多元、种类繁多且大多是非结构化的资料,而且更新速度非常快,导致资料量大大增加。

1.资料量(Volume)

大数据与传统数据有一差异在于资料量的多寡,因资料量远大于传统数据,所以以「大数据」一词来区分两者。若是以量化表示,大数据特别指在一天内可生成1TB以上资料量的数据(等于128个8G随身碟,相当可观!)也因为资料量大,无法以传统的方式储存处理,因此发展出大数据这一新型态科学。

2.资料多样性(Variety)

与我们常见的转帐纪录、浏览纪录仅纪录一种数据不同,大数据的资料类型庞大且复杂,由于形式多元复杂,大数据储存也需要不同于传统数据的储存技术。

3.资料实时性(Velocity)

大数据与传统数据一大的不同点,就是数据生成的速度极快。由于网际网络与信息设备普及,每一个人随时随地都可以创造数据,数据生成的速度已与过去不可相比。同时也强调资料的时效性,随着使用者每秒都在产生大量的数据反馈,过去三五年的资料已毫无用处,一旦资料串流到运算服务器,企业便须立即进行分析、实时得到结果并立即做出反应修正,才能发挥资料的最大价值。

在3V成为大数据主要定义后,随着储存资料的成本下降、取得成本也下降,大数据发展出第四个特性:Veracity(资料真实性),意指除了资料量,也需要确认资料的真实性,过滤掉不真实的数据与异常数值之后,分析出来的结果才能达到准确预测的目的。

大数据分析步骤

第一步.取得

数据随时随地都在产生,可以说是随手可得。大型的企业,搜集客户的使用纪录就可达到以数据预测未来的目标;若是中小型的企业,则可主动提供问卷请客户填写,逐步累积信息量。

第二步.储存

由于资料量庞大,处理储存大数据是第一个难关。因此处理大数据时多使用分散式处理系统,透过分割资料与备份储存,突破存储器过小的障碍。

第三步.运算

为达到预测未来的目的,机器可以透过分类、回归分析、排序、关联分析等方式找出其中规律,并运分析工具进行运算。

第四步.视觉化

经过分析后的数据为数字与列表,阅读上不易。因此可搭配视觉化工具,将数据转化为图表的方式会变得容易阅读与理解。

Lalamove为一结合科技数据的物流公司,我们运用过往的客户数据数据库,并由专业的客户维运部门专员分析客户以往的使用模式,在未来需求量可能暴增的时节,提早提供客户专门的配送规划及协助,使客户在爆单季节无须额外担心物流运送相关的问题!

一次搞懂什么是大数据相关推荐

  1. 一分钟搞懂云计算和大数据对人到底有啥用?

    都2019年了,大数据和云计算居然还有人不知道到底是干啥的,今天马小哥就来个大家讲一下云计算和大数据是做什么的,保证你能会! 首先,云计算是什么. 以前呢,一家公司要做网站,必须得有服务器.普通电脑做 ...

  2. 上手机器学习,从搞懂这十大经典算法开始

    上手机器学习,从搞懂这十大经典算法开始 翻译 | AI科技大本营(rgznai100) 参与 | 林椿眄 编辑 | 波波,Donna 在机器学习领域,"没有免费的午餐"是一个不变的 ...

  3. 【转载】不是技术也能看懂云计算,大数据,人工智能

    (点击上方公众号,可快速关注) 作者: 刘超 www.cnblogs.com/popsuper1982/p/8505203.html 原标题:不是技术也能看懂云计算,大数据,人工智能 我今天要讲这三个 ...

  4. 【深度学习计算机指令系统,彻底搞懂指令十大寻址方式】

    系列文章目录 1.<带你深挖计算机底层逻辑,打通你计算机基础知识的任督二脉> 2.<深度学习计算机底层原理,深度剖析存储器> 3.<基于内存全面理解高速缓冲存储器> ...

  5. 不是技术也能看懂云计算,大数据,人工智能

    我今天要讲这三个话题,一个是云计算,一个大数据,一个人工智能,我为什么要讲这三个东西呢?因为这三个东西现在非常非常的火,它们之间好像互相有关系,一般谈云计算的时候也会提到大数据,谈人工智能的时候也会提 ...

  6. 一文读懂云计算、大数据和人工智能间的关系和区别

    公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! 今天跟大家讲讲云计算.大数据和人工智能.为什么讲这三个东西呢?因为这三个东西现在非常火,并且它们之间好像互相有关系 ...

  7. 不懂技术也能看懂云计算,大数据,人工智能

    我今天要讲这三个话题,一个是云计算,一个大数据,一个人工智能,我为什么要讲这三个东西呢?因为这三个东西现在非常非常的火,它们之间好像互相有关系,一般谈云计算的时候也会提到大数据,谈人工智能的时候也会提 ...

  8. 终于,不是技术的你也能俗懂云计算、大数据、人工智能了!

    来源:刘超的通俗云计算 数据猿官网 | www.datayuan.cn 今日头条丨一点资讯丨腾讯丨搜狐丨网易丨凤凰丨阿里UC大鱼丨新浪微博丨新浪看点丨百度百家丨博客中国丨趣头条丨腾讯云·云+社区 我今 ...

  9. 一篇文章带你读懂真正的大数据公司

    马云卸任演讲时说了这么一句话:很多人还没有搞清楚什么是PC互联网,移动互联网来了,我们还没有搞清楚移动互联网的时候,大数据时代又来了. 现在的数据,可谓是时下最炙手可热的东西了.想当年,有" ...

最新文章

  1. Python深度学习:基于TensorFlow
  2. SAP WM中阶为多个TR创建了Group后将TR从Group里删除?
  3. 宝塔linux面板php配置教程,「大商创安装」大商创X宝塔linux面板安装配置教程
  4. 全球及中国电动自行车零件和配件行业运营状况及未来发展趋势预测报告2022年版
  5. MATLAB读写Excel数据
  6. 安卓 java中改布局_android-选项卡布局中的地图视图throwing,java....
  7. Dockder的CS模式:
  8. Elasticsearch Restful API
  9. base64转化字节流 js_js - blob流和base64,以及file和base64的相互转换
  10. 80后的你现在有多少资产?
  11. Python开发之用户密码存储
  12. mysql可视化工具
  13. Android自定义Dialog的Match_parent无效问题解决
  14. Push rejected: Push master to origin/master was rejected by remote
  15. FreeMind 思维导图的使用
  16. 【高速接口-RapidIO】5、Xilinx RapidIO核例子工程源码分析
  17. 云计算是什么 如何分类 有什么
  18. matlab 插值生成曲面,[转]Matlab曲面拟合和插值
  19. 网狐登陆服务器启动失败
  20. 阿翔编程学-Lucene入门与使用

热门文章

  1. 上手阿里云服务器(一)——搭建LAMP开发环境、防火墙、文件传输
  2. html文字往右边偏移怎么做,div向右偏移设置 css让div靠右移必定距离
  3. vue3 setup语法糖事件引用和写法
  4. 计算机考研四大名著,2017考研英语翻译每日一句:四大名著
  5. win10蓝牙鼠标、耳机无法连接,无蓝牙开关标志解决方案
  6. 2018最新苹果APP上架App Store流程(超详细)
  7. 宾果消消消鸿蒙版,宾果消消消最新版
  8. zlib库使用简单讲解
  9. Tomcat多实例Nginx负载均衡
  10. 时间转换 秒(s)转 ()天 ()小时() 分钟 ()秒