2018-03-26 Python开发者交流平台


什么是数据分析?

数据分析:是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,而对数据加以详细研究和概括总结的过程。


为什么会有数据分析?

随着计算机技术、互联网技术、数据库技术等科技的高速发展,人们产生数据、获取数据、存储数据变得越来越容易,而这些数据里也隐含着人们在生产生活中的一些规律。

数据分析就是为了从数据中发现这些规律性的信息,帮助企业/个人预测未来的趋势和行为,做出具有针对的决策,从而使得商务和生产活动具有前瞻性。

"二十四节气歌、朝霞不出门,晚霞行千里...." 对于一些简单的自然现象,我们的老祖先们通过归纳提取得出很多经验知识,但是现代人类世界中有太多的复杂问题,数据量极大,已经远远超出了人脑可处理的范围。怎么办?

数据分析是 数学与计算机科学 相结合的产物,在实用应用中,人们可以人们通过计算机工具和数学知识处理数据,得出结果作出判断,以便采取适当行动,

课外阅读:数据分析真实故事

啤酒与尿布

有一个叫萨姆 沃尔顿的人,大家应该都知道吧?如果不知道,那么沃尔玛,应该知道。是萨姆 沃尔顿将一个百货商店奇迹般地经营为全球最大的连锁零售企业。早在1985年10月就被《福布斯》杂志列为全美富豪排行榜首位,连美国总统布什都赞扬他是地道的美国人,展现了企业创新精神,是美国梦的缩影…

1983年,当一般零售商还在进行信息化建设的时候,沃尔玛已经开始与休斯公司合作,花费了2400万美元发射了一颗人造文星,此后先后投入6亿多美元建立起电脑与卫星系统,还发明了条形码、无线扫描枪、计算机跟踪存货等技术。借助于整套的高科技信息网络,沃尔玛的各部门沟通、各业务流程可迅速、准确的运行,数据库系统很快积累了海量的经营数据,包括大量的顾客消费行为记录。

一年一度的圣诞节就要到了,沃尔玛的工作人员按照惯例筹备节日的营销策略。这一次它们使用了一种新的‘购物篮分析’的软件,对海量的顾客消费行为进行分析,一个意外的发现让人们瞠目结舌,跟尿布一起购买最多的商品竟然是啤酒!

紧接着,沃尔玛派出市场调查人员和分析师对这一结果进行了深入研究,证实了它揭示了一条隐藏的在‘啤酒与尿布’背后的美国人的一种行为模式:一些年龄在2535岁的年轻父亲下班后经常要到超市去买婴儿买尿布,而他们中由30%40%的人会顺手为自己购买几瓶啤酒。

此后,沃尔玛马上采取行动,将卖场内原来相隔很远的妇婴用品与酒类饮料区的空间距离拉近,使顾客更加方便。然后对本地区新生育家庭的消费能力进行了调查,对这两个产品的价格也做出了调整,并向一次购买达到一定金额的顾客赠送婴儿奶嘴以及其他小礼品,结果是尿布与啤酒的销量双双大增。

出奇制胜

2006年世界杯上,阿根廷和德国在1/4决赛中120分钟难分高下,在点球大战开始之前,老门将卡恩将一张纸条递到莱曼手中。莱曼每次扑点球之前都要看一眼纸条。结果是,莱曼所有点球都判断对了方向,除了两个点球质量太高无力回天外,其余全部扑出,阿根廷只能黯然出局。

问题是,那张纸条上究竟写了什么?

上面记录着阿根廷队的克鲁兹、阿亚拉、罗德里格斯以及坎比亚索习惯的脚法。德国队守门员教练科普克如此精确的预测出阿根廷球员射出的点球方向,并不是他有什么过人的占卜天才。那张草草的扑点球秘籍来自于德国科隆体育学院数据分析小组夜以继日的努力。

分析小组收集了阿根廷球队13000个点球的录像,所有这些采集回来的点球数据被录入数据库中,并根据阿根廷射门练习的数据找出了一些可以描述射门动作的行为特征,比如“阿亚拉,短助跑,右下角;里克尔梅,斜上助跑,右下角;马克西,长距离助跑,左上角;坎比亚索,长距离助跑,右侧;索林,短助跑,右下角,特维斯,短助跑,中路…….”

这些行为特征描述了阿根廷堆谁伐点球、怎么罚点球的规律。最终从这些特征中提炼出很少的更具体的特征。正是这张纸条把大力神杯交到了德国队手中。小纸条上总结的这些规律就是数据挖掘与分析的结果。

【文末福利】

关注 【编程微刊】微信公众号:

回复【小程序demo】一键领取130个微信小程序源码demo资源。

回复【领取资源】一键领取前端,Java,产品经理,微信小程序,Python等资源合集8G资源大放送。

数据分析概述和理论基础相关推荐

  1. 第1章 数据分析概述

    <Python数据分析基础教程>学习笔记. 第1章 数据分析概述 1.1 数据的性质 1.1.1 数据的概念 所谓数据就是描述事物的符号,是对客观事物的性质.状态和相互关系等进行记载的物理 ...

  2. CDA Level1知识点总结之数据分析概述与职业操守

    数据分析概述与职业操守 策略分析 考点总结 前导课 数据分析概述与职业操守 1. 数据分析概念.方法论.角色 2. 数据分析师职业道德与行为准则 3. 大数据立法.安全.隐私 习题整理(易错题.难题) ...

  3. 大数据技术技能分析大赛——第一章 python数据分析概述

    目标:掌握python,进行数据处理.统计分析.回归建模和数据可视化. 教材:<大数据分析务实初级教程(python)## 标题> 第一章 python数据分析概述 1.数据分析概述 1 ...

  4. 时间序列数据分析—概述

    时间序列数据分析-概述 本文依据知乎大佬的文章 概述 ​ 随着工业界大规模时间序列数据(例如物联网,医疗数字化,智慧城市等领域)的出现和算力的提升,时间序列数据分析的重要性日益凸显.因此伴随着大量时间 ...

  5. 1 python数据分析概述

    1 python数据分析概述 1.1 概述 数据分析的概念 数据分析的流程 数据分析的应用场景 1. 客户分析 2. 营销分析: 3. 社交媒体分析 4. 网络安全 5. 设备管理 6. 交通物流分析 ...

  6. 《谁说菜鸟不会数据分析——入门篇》学习笔记 ——第二章 数据分析概述

    第二章 数据分析概述 一 .什么是数据分析(狭义) 1.1 定义 数据分析是指根据分析目的,用适当的分析方法及工具,对数据进行处理与分析,提取有价值的信息,形成有效结论的过程. 1.2 作用 (1)现 ...

  7. 1 数据分析 概述 Excel操作基础

    数据分析 1 数据分析概述 1.1 什么是数据分析 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用. 数据分析是为了 ...

  8. CDA数据分析师 - 数据分析概述

    1.数据分析概述 [领会] 数据分析和数据挖掘的概念 强调商业数据分析中对业务的理解 商业数据分析和预测的本质 数据分析的 8 个层次 大数据对传统小数据分析的拓展 [熟知] 明确数据分析目标及意义 ...

  9. CDA Level 1 PART1:数据分析概述 描述性统计分析

    数据分析概述 描述性统计分析 CRISP-DM方法论 SEMMA方法 集中趋势与离散趋势指标

最新文章

  1. 让你的eclipse插件只下载一次
  2. Windows 7 几个小问题的解决方法(二)
  3. 复随机变量及高斯熵的概念
  4. trl meaning genearlly we find 6
  5. boost::dynamic_property_map相关的测试程序
  6. Leetcode--461. 汉明距离
  7. python中set()函数==》创建一个无序不重复的元素集(创将一个集合)
  8. 拓扑排序——最大食物链计数(洛谷 P4017)
  9. CVE-2020-16875: Microsoft Exchange远程代码执行漏洞通告
  10. MSMQ 和 MQTT
  11. JUC并发编程超详细详解篇
  12. c++调用python接口_PySpark源码解析,教你用Python调用高效Scala接口,搞定大规模数据分析...
  13. 大数据学习入门级书籍推荐
  14. 国内计算机论文期刊,国内都有哪些计算机领域的投稿期刊
  15. hdu4415 Assassin's Creed
  16. 联想天逸 510S 2022怎么样
  17. 神经网络的三种训练方法,神经网络常用训练方法
  18. 学习笔记-NTLM中继
  19. Delphi7企业原版_史上最经典的delphi 版本
  20. 好好学习天天向上之InfoPath学习系列(一):Form Services与InfoPath初识

热门文章

  1. 容器化技术与微服务结合---结合springcloud微服务框架进行部署(含切换成阿里云docker仓库)(五)
  2. Lustre(待修正)
  3. 余额宝​微服务深度治理
  4. 公众号文章、底部菜单栏关键词自动回复投票、报名、预约、查询等链接?
  5. Mac Charles 抓包 iPhone Https(详细流程)
  6. Excel Spreadsheet Compare工具
  7. 各厂商接入交换机通过ACL限制端口应用的配置信息
  8. csdn写博客时图片插入方法
  9. 利用群晖nas备份华为手机数据
  10. 洛谷P3964 [TJOI2013]松鼠聚会 切比雪夫距离转曼哈顿距离