为什么要学数据分析,有以下几点原因:

1、解决数据价值最大化的问题

2、解决业务发展过程中的瓶颈

3、解决自身技术的瓶颈

1 数据分析引言 - 分解数据

前言说的好:“熟谙一切数据分析技术方法的分析者会比其他人技高一筹:他们知道如何处理所有的数据材料,如何将原始数据转变成推进现实工作的妙策,如何分解和构建复杂的问题和数据集,进而牢牢把握工作中的各种问题的要害。”

本文通过一个流程,一个案例讲解了如何分析数据,同时还提到了三个模型。

1.1 一个流程

解决问题的流程
序号 流程 流程说明
1 确定

确定问题

害处:未明确确定自己的问题或目标就进行数据分析就如同未定下目的地就上路旅行。

方法:客户将根据你的分析作决策,你需要尽量从他那里多了解一些信息,才能确定问题。

2 分解

数据分析总的来说就是分解问题和数据,使其成为小的组成部分;进行有效的比较是数据分析的核心

将大问题划分成可管理、可解决的小问题;

将数据分解为更小的组块;

在本操作步骤中出现了两个名词:名词一“比较因子”,名词二“基准假设”,后续对其解释

3 评估

在这一步对前两步了解到的情况作出各种结论

评估分解组块的关键就比较

在这步书中讲到:“在撰写最终报告的时候,一定要提到你自己,这样客户才知道你的结论出自何处”,“你提交给客户的报告要以得到客户理解、鼓励客户以数据为基础作出明智的决策为重点”

4 决策 把上述结论重新组合在一起,作出(建议)一个决策

1.2 一个案例

Acme公司首席执行官希望数据分析师通过对公司旗舰产品“貌洁超强保湿霜”的销售情况分析来帮他提高销量

1.3 三个模型

1.3.1 心智模型(Mental Model)P21

心智模型(Mental Model)又称:心智模式,是指深植我们心中关于我们自己、别人、组织及周围世界每个层面的假设、形象和故事。并深受习惯思维、定势思维、已有知识的局限。

“心智模式”是一种思维定式,是指我们认识事物的方法和习惯。当我们的心智模式与认知事物发展的情况相符,能有效的指导行动;反之,当我们的心智模式与认知事物发展的情况不相符,就会使自己好的构想无法实现。

心智模型有如下三个基本预测:

(1)人们通常仅对他们认为真实的东西建立心智模式;

(2)人们通常只构建一个而不是多个心智模式;

(3)人们倾向于只从他们构建的一个心智模式中提取数据与信息做出决策与选择。

心智模型的特点:

(1)每个人都具有心智模式。

(2)心智模式决定了我们观察事物的视角和做出的相关结论。

(3)心智模式是指导我们思考和行为的方式。

(4)心智模式让我们将自己的推论视为事实。

(5)心智模式往往是不完整的。

(6)心智模式影响着我们的行为的结果,并不断强化。

(7)心智模式往往会比其有用性更加长寿。

心智模型的特性:

这六个特质并非相互独立的:

(1)不完整性(Incomplete):人们对于现象所持有的心智模式大多都是不完整。

(2)局限性(Limited):人们执行心智模式的能力受到限制。

(3)不稳定(Unstable):人们经常会忘记所使用的心智模式细节,尤其经过一段时间没有使用它们。

(4)没有明确的边界(Boundaries):类似的机制经常会相互混淆。

(5)不科学(Unscientific):人们常采取迷信的模式,即使他们知道这些模式并非必要的。

(6)简约(Parsimonious):人们会多做一些可以透过心智规划而省去的行动。

1.3.2 数据模型(Data Model)P21

数据模型(Data Model)是对现实世界数据特征的模拟和抽象,用于描述一组数据的概念和定义,它从抽象层次上描述了系统的静态特征、动态行为和约束条件;数据模型是数据库中数据的存储方式,是数据库系统的基础,为数据库系统的信息表示与操作提供一个抽象的框架。

数据模型的组织要素:数据结构、数据操作、数据约束 。

数据模型的层次类型:概念数据模型、逻辑数据模型、物理数据模型。

数据模型的分类:层次模型(Hierchical)、网状模型(Network) 、关系模型(Relation)

1.3.3 统计模型P22

统计模型(stochasticmodel;statisticmodel;probabilitymodel)指以概率论为基础,采用数学统计方法建立的模型。有些过程无法用理论分析方法导出其模型,但可通过试验测定数据,经过数理统计法求得各变量之间的函数关系,称为统计模型。常用的数理统计分析方法有最大事后概率估算法、最大似然率辨识法等。常用的统计模型有一般线性模型、广义线性模型和混合模型。统计模型的意义在对大量随机事件的规律性做推断时仍然具有统计性,因而称为统计推断。常用的统计模型软件有SPSS、SAS、Stata、SPLM、Epi-Info、Statistica等

深入浅出数据分析 - 数据分析引言相关推荐

  1. 深入浅出理解数据分析系列之:Python安装Excel文档库openpyxl和Pycharm为项目安装Excel文档库openpyxl

    深入浅出理解数据分析系列之:Python安装Excel文档库openpyxl和Pycharm为项目安装Excel文档库openpyxl 一.Python安装openpyxl 二.Pycharm为项目安 ...

  2. 数据分析--数据分析是什么?

    数据分析是什么? 数据分析与数据挖掘之间的关系 数据分析 数据挖掘 数据分析的基本步骤 python和数据分析 数据分析就是通过得到的数据,来发现各种规律之间的关系 数据分析与数据挖掘之间的关系 数据 ...

  3. Pandas数据分析⑥——数据分析实例(货品送达率与合格率/返修率/拒收率)

    Pandas系列目录如下: Pandas数据分析①--数据读取(CSV/TXT/JSON) Pandas数据分析②--数据清洗(重复值/缺失值/异常值) Pandas数据分析③--数据规整1(索引和列 ...

  4. 深入浅出的数据分析方法

    [与数据同行]已开通综合.数据仓库.数据分析.产品经理.数据治理及机器学习六大专业群,加微信号frank61822702 为好友后入群.新开招聘微信群,请关注[与数据同行]公众号,后台回复" ...

  5. 数据分析入门,深入浅出的数据分析

    很多朋友选择从事数据分析,主要是看到这个岗位的发展前景和薪资待遇. 时下正值大数据与人工智能高速发展的时刻,相信很多对数据分析感兴趣的朋友想要转行.但是有些小白并不知道数据分析到底是什么?需要掌握哪些 ...

  6. 谁说菜鸟不会数据分析--数据分析那些事儿

    一.数据分析是"神马" 1.  何谓数据分析 简单来说,数据分析就是对数据进行分析,较为专业的说法,数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总.理解 ...

  7. python科学计算三剑客_1-python数据分析-数据分析介绍、数据分析三剑客之NumPy

    数据分析三剑客 numpy pandas(重点) matplotlib numpy模块 NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库.侧重在于数值计算,也 ...

  8. [机器学习与数据分析] 数据分析常用方法

    一.描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估计和描述的方法.描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分.   ...

  9. 数据分析-数据分析报告

    1.初始数据分析报告 1.1数据分析报告是什么 数据分析报告是数据分析原理和方法,运用数据来反映.研究和分析某项事物的现状.问题.原因.本质和规律,并得出结论,提出解决办法的一种分析应用文体. 1.2 ...

  10. DA0207 数据分析——数据分析之EXCEL

    数据分析 1.    对比分析 没有对比的数据毫无意义,对数据的观察应基于对手数据,同比环比数据等. 1. 数据趋势分析 趋势分析一般而言,适用于产品核心指标的长期跟踪,比如,点击率,GMV,活跃用户 ...

最新文章

  1. 将ResultSet转为List
  2. 有關window.showModalDialog的應用11/30
  3. YOLO训练Pedestrain
  4. mysql查询索引like_通过索引查询慢速搜索LIKE%MYSQL
  5. 日期时间选择器-jeDate日期控件
  6. php数据库备份脚本
  7. 错误请联系管理员文件 index.php,帝国CMS订单、反馈信息、投稿与留言发邮件通知管理员的方法...
  8. 可视化idea_给IDEA换个酷炫的主题,这个有点哇塞啊!
  9. 使用Directory.EnumerateFiles进行批处理
  10. 【293天】我爱刷题系列052(2017.11.25)
  11. [leetcode]831. 隐藏个人信息
  12. 批量查询数据的sql语句
  13. unknown source怎么解决?unknown source是什么意思【详解】
  14. Augustus:真核生物基因结构预测软件-安装篇
  15. win2008服务器虚拟内存设置,电脑虚拟内存设置(Win 7/8/10、Windows Server 2003 - 2019)...
  16. 电子与通信工程专硕考分_分享我的苏州大学电子与通信工程专硕考研经历
  17. Camera成像原理(raw图如何产生的)
  18. JavaScript video标签使用
  19. 面向对象系统分析——类图包图
  20. 全世界最著名的经济金融学网站

热门文章

  1. MentoHUST讲解教程(锐捷破解)
  2. 图吧工具箱2021最纯净的电脑硬件工具箱
  3. 动态SLIC加载(DBSLDR)激活win7
  4. xp计算机u盘重装系统,用U盘给旧电脑重装XP系统,自己摸索的方法:两大步骤、两个关键...
  5. tcpip详解有必要看吗_全屋净水知识|前置过滤器有必要安装吗?看完秒懂
  6. TCPIP详解 IP路由选择
  7. GB/T2659-2000《世界各国和地区名称代码》
  8. 时区时钟插件html,World Clocks插件,世界时钟Chrome插件,轻松查看各国日期时间...
  9. 利用POI导出excel
  10. 第6篇 熊猫烧香专杀工具编写