数据的四大特征_大数据

我们总是在谈数据分析,数据分析什么的,那我们现在先不谈数据分析,我们先来谈谈数据分析的基础——数据。那么到底什么是数据,数据有什么特征呢?这个问题虽基础却重要。

这里我们所说的数据,仅指应用于企业运营的市场信息。它是认识事物的中间环节,是事物的表面特征,其作用在于消除事物的不确定性。它至少具有以下四个基本特征。

数据分析师分析数据的特征之一时效性

所谓时效性是指数据的发生和运用要有个提前期,失去时效性,就失去了潜在机会。

举个例子,以前在广州有个大厦,它对数据的时效性运用的就很好。据说有一年,它的经理和别人聊天,人家无意间提起说那年春天广州的雨水将特别大,于是他特意去了广州气象台证实,证实后,他开始调查,发现深圳一家厂子里积压着20万多把雨伞。当时正是11月份,旱季,这家厂子压着20万多把雨伞早就想出手,所以这个大厦的经理就去了深圳,以极低的价格就把雨伞盘进来了。结果那年广州的春天来得特别早,一过春节,这雨哗哗就下起来了,他趁机20多万把雨伞往出卖,结果一销而空。这就是利用了信息的时效性。

简单吗?很简单,只需要到气象台问一下,但是,有多少企业会问呢?其实并不多,因为很多企业就没有提前获取数据的意识。经常是等到下雨了再进雨伞,那就没买卖做了。

数据要具有时效性,或者说数据分析要有预见性,因此,大家在采集数据的时候,要注意数据的时效性,要具备用现在的数据预测未来市场的走向的意识。

数据分析师分析数据的特征之二分散性

数据的分散性,具体表现在两个方面。

1、没有固定发生地

数据没有固定发生地,因此,需要多渠道采集数据,除了上网、图书馆查资料、还要留意电视、杂志等媒体的信息,关注统计局、行业协会、研究机构的数据或者直接做市场调研。

2、零散分布,相互关联才完整

数据是零散的,真正能还原数据的完整性,并充分利用数据的,都是勤于思考,努力寻找数据关联性的人。

在旧社会的解放区,人人都听到,河北省出了一个白毛仙姑,但是谁也没有去琢磨,当时只有20岁的贺敬之琢磨出来了:这叫做旧社会把人变成鬼,新社会把鬼变成人。于是他就写出了不朽的名著叫做《白毛女》,正可谓“人人之所见、人人所未思”。

数据分析师分析数据的特征之三概率性

什么是概率性?简单理解就是看似结果不确定的事情,多次重复,就会显示出一定的规律性。

比如我们抛硬币。抛5次、10次,到底有几次正面向上不好说,但若抛几百次,几千次,正面向上的可能性就稳定在50%左右。

有一个生产装汽水、装啤酒的塑料箱的小厂厂长,了解了数据的概率性,就把北京邮政编码本找来,找到北京130个单位,发了130封信,结果就回来1封,让他拿着样品过去看看,概率够低的。这个厂长怕别人搞不好,就自己夹着箱子去了。这家单位在4楼,厂长把箱子递过去,那老兄看都没看,一推窗户,‘磅’的一声,就给扔出去了。然后那老兄就往下跑,这厂长就在后面追,到了楼下,一看这箱子,一点没坏!那老兄说:“行!这箱子挺结实的,定货!”半年的买卖就有了。玩的就是概率。

数据的概率性告诉我们:成功=努力+等待。

数据分析师分析数据的特征之四再创性

所谓再创性是指我们所看到的数据只是一种现象和启示,不同的人会得出不同的结论。而要想透过现象看本质,需要用发展的眼光看问题,通过深入的分析,找出隐藏在市场现象背后的机会。

例如,二战后,松下幸之助开始研制一个非常不起眼的家庭用电机,好多人嘲笑他,说电机都是工厂用的,你这电机家庭干什么使呢。但是,松下幸之助看到了家用电机的发展,他说:‘现在是零,将来就是无限。’用发展的眼光看问题,才能再创性地挖掘机会。

再讲个故事:有甲、乙两个推销员,同时到非洲的一个岛国卖鞋子。这个岛国里人人都光着脚丫。甲推销员一见到他们都不穿鞋,于是认为鞋子在这里没有销路;而乙推销员将数据进行再创,看到他们不穿鞋,于是拿着鞋子来做调查,经调查发现:这里的人之所以不穿鞋,是因为他们的脚都特别宽,而市面上的鞋太窄,他们穿不进去。于是他建议公司生产出专门适合这个岛国的鞋子。此外,他还把尺寸合适的鞋子送给当地的酋长,酋长一穿鞋,感觉舒服极了,而老百姓一看酋长都穿鞋了,他们也想穿。等到老百姓也想穿,就有市场了,原来都不穿鞋,现在人人都要穿鞋,于是乙推销员让鞋子很有销路。这个故事说明,数据只是现象和启发,只有深入的分析,才能再创性地挖掘机会。

以上就是数据的四个特征:时效性、分散性、概率性、再创性。

数据分析师了解数据的四个特征,对于我们的数据工作具有启发。例如,数据采集就要充分考虑到数据的这四个特征:http://www.cda.cn/view/559.html

基于时效性,数据采集要有项目周期;

基于概率性,数据采集要有抽样设计;

基于分散性,针对不同的数据来源要有不同的采集方法和问卷设计

基于再创性,要对采集到的数据信息深入地分析和解读

转载于:https://www.cnblogs.com/amengduo/p/9587701.html

数据的四大特征_大数据相关推荐

  1. python大数据是什么意思_大数据是什么意思

    大数据是指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合.大数据的五大特征:1.大量:2.高速:3.多样:4.低价值密度:5.真实性. 大数据(big data),指无法在一定时间范 ...

  2. 大数据介绍项目流程_大数据介绍

    大数据介绍项目流程 About Big Data 关于大数据 什么是大数据?(What is Big Data?) In modern world, there are many big proble ...

  3. 大数据审计的发展_大数据时代的审计发展趋势

    大数据时代的审计发展趋势 □ 文 / 曾国建 [期刊名称] 中国石油企业 [年 ( 卷 ), 期] 2016(000)011 [总页数] 2 在大数据时代,人们获取信息.数据的容量是海量的,将会更加从 ...

  4. 大数据简介视频下载_大数据简介

    大数据简介视频下载 We are going to deliver a series of Tutorials on the following concepts one by one: 我们将逐一提 ...

  5. 大数据项目一般金额多少_大数据分析师年薪一般多少?学什么专业才能从事大数据?...

    近几年,大数据为各个领域带来了全新的变革,大数据的重要性越来越被企业和国家所看到,大数据工作者的需求再次被无限放大,他们的薪资和社会地位也在不断上涨.马云在演讲中就提到,未来的时代将不是IT时代,而是 ...

  6. 大数据 智能交通调度_大数据技术在智能交通中的应用

    龙源期刊网 http://www.qikan.com.cn 大数据技术在智能交通中的应用 作者:庄斌 来源:<名城绘> 2018 年第 04 期 摘要:随着时代的发展和社会需求变化,现代智 ...

  7. 大数据平台容量评估_大数据平台

    系统概述 大数据应用支撑平台提供数据支撑服务,对外发布数据服务进行数据价值变现.包含数据采集.数据治理.数据交换.数据存储.数据计算相关组件的搭建.验证,并建立大数据仓库. b)功能要求 1.数据采集 ...

  8. 5000字 大数据时代读书笔记_大数据时代 读书笔记

    大数据时代 维克托·迈尔·舍恩伯格 首先作者抛出了大数据时代处理数据理念上的三大转变:  要全体不要抽样. 首先,要分析与某事物相关的所有数据,而不是依 靠分析少量的数据样本.全数据模式,样本 = ...

  9. 大数据项目开发案例_大数据开发相关术语解析

    Java['dʒɑːvə] 当前软件开发行业应用最广.就业量最大的编程语言,在各类编程语言排行榜长期位列第一.是企业软件开发的首选语言,也是Android系统的开发语言. Java吸取了C++语言的众 ...

最新文章

  1. 关于Android中的乱码
  2. OpenLayer + Ags 综合应用(一)--OpenLayer 地图展现
  3. 产品经理在跨部门沟通中常见问题和解决办法[转自UCDChina]
  4. 浅析Faiss在推荐系统中的应用及原理
  5. 我的世界——用一桶水一直灭岩浆一直刷黑曜石
  6. ArcGIS 10.6字段计算器(Field Calculator)字段任意填充编码序列(奇数、偶数序列、自定义间隔)
  7. LinuxDay19——加密与安全(2)
  8. 17. Window confirm() 方法
  9. 数据结构---堆的相关操作
  10. 公网服务器与局域网手机长连接
  11. ati.c ATI顯卡開發源代碼
  12. windows进程 windows多进程编程
  13. mysql qps 索引查询_mysql QPS 抓取和分析
  14. maka html5,MAKA H5制作
  15. QoBean的元语言系统(一)
  16. 数据库中delete和drop的区别
  17. 第2章 无人艇局部危险避障算法研究
  18. ceph rgw lc工作流程
  19. ENVI+IDL使用
  20. FFmpeg 源码之分配与释放 AVPacket 常用函数

热门文章

  1. python战斗2:看到一个页面编码
  2. CI框架下nginx重写规则
  3. [leetcode]Palindrome Number @ Python
  4. 架构师要了解那些??
  5. php.exe占用资源过大,记录一次php占用系统资源过高的问题
  6. w7 mysql不启动_Win7安装mysql5.7服务无法启动没有任何报错信息处理:
  7. 博达路由器如何配置互联网ip_如何成为技术大牛第七步——路由器下接交换机单臂路由配置方法...
  8. ims系统 呈现服务器,基于IMS的呈现服务器的设计与实现
  9. 为支持nginx高并发而修改的一些Linux内核参数
  10. Java Integer类中的parseInt和valueOf的区别