//   学习《深入浅出数据分析》---分解数据


分解数据

如何处理所有的数据材料,如何将原始数据转变成推进现实工作的妙策,如何分解和构建复杂的问题和数据集,进而牢牢把握工作中各种问题的要害。


固定基本流程

确定---->分解---->评估---->决策

第一步是了解问题

确定:确定问题

分解:分解问题和数据,使其成为更小的组成部分

评估:对前两步了解到的情况做出各种结论

决策:最后,把这些结论重新组合在一起,做出(建议)一个决策


确定问题

未明确确定自己的问题或目标就进行数据分析就如同未定下目的地就上路旅行一样。

客户将帮助你确定问题 

·····“要从客户那里多了解一些信息”。

你的客户可能:

  • 相当了解或不甚了解自己的数据
  • 相当了解或不甚了解自己的问题或目标
  • 相当了解或不甚了解自己的业务
  • 目标明确或优柔寡断
  • 头脑清醒或稀里糊涂
  • 富有直觉或善于分析

要成为客户肚子里的蛔虫,优秀的数据分析师帮助客户思考自己的问题,不会等着客户告诉他们该做什么。要是能够向客户指出他们毫无察觉的问题,客户会真心诚意地感谢此人。有些人会把问题视为机会,赢得竞争优势。


例子--Acme化妆品公司

首席执行官:“看看我们的数据,给我分析分析,说说我们该如何提高销量。”

····为了更好摸清这位首席执行官的真正意图,你想问什么问题?

例如:

目标量化

您希望销量提高多少?

您觉得我们怎样才能办到?

您觉得销售提高多少是可行的?目标销量合理吗?

竞争对手 

我们竞争对手销量如何?

好奇的数据


把问题和数据分解为更小的组块

数据分析的下一步就是把从客户那里了解到的问题和手头的数据放在一起,把这些问题分解为颗粒级的小问题让他们在分析时发挥最大作用。

将大问题划分为小问题

将问题划分为可管理、可解决的组块。你面对的问题常常含糊不清,例如:

“我们如何提高销量”

----->"我们最好的客户希望我们给他们什么?"

----->"那种促销方式最有可能产生效果?"

----->"我们的广告做的怎么样了?"

将数据分解为更小的组块

自己提炼重要的因子------>汇总/原始数据表

尝试分解最重要因子的最好起步方法是找出高效的比较因子。

进行有效的比较是数据分析的核心。


评估组块

形成自己的判断,正如分解时一样,评估分解组块的关键就是比较。

通过对上面因子的相互比较,你看出了什么?

针对问题的观察结果:

  • 消费者是11-15岁少女,她们基本上是唯一的消费群体。
  • 正在尝试增加关于扩展社会网络的广告费,但是新做法是否成功尚未可知。
  • 少女在消费群体中的销售潜力是无限的。
  • Acme的竞争者极为危险。

针对数据的观察结果:

  • 2月份的销量与上年9月份的销量相比略有上升,但尚属持平。
  • 销量与目标相去甚远。
  • 看来降价无助于销量达标。
  • 削减费用可能会影响Acme的销量达标能力。

提出建议

让自己和客户仔细研究你对数据的评估,从而有能力做出最好的决策。

能简单则简单,但确保自己的意见传达到位。


当分析过程中得到了一些错误或不完整的信息

看似是好消息,但是如果市场已经饱和,再多投广告可能就不会有太大效果。

注意:数据没有体现少女消费者市场的任何情况,只是首席执行官假定了少女消费者是产品唯一购买者。

此刻注意一个定义:心智模型

心智模式是根深蒂固于心中,影响我们如何了解这个世界,如何采取行动的许多假设、成见、图象、印象,是对于周围世界如何运作的既有认知。我们通常不易察觉自己的心智模式,以及它对行为的影响。

其实,“心智模式”是一种思维定式,我们这里所说的思维定式并非是一个贬义词,而是指我们认识事物的方法和习惯。当我们的心智模式与认知事物发展的情况相符,能有效的指导行动;反之,当我们的心智模式与认知事物发展的情况不相符,就会使自己好的构想无法实现。所以,我们要保留心智模式科学的部分,完善不科学的部分,取得好的成果。

你对外界的假设和你确信的观点就是你的心智模型。

你的统计模型取决于你的心智模型。

心智模型应当包括你不了解的因素——不确定因素

除了少女消费者,有其他买家吗?

深入挖掘数据

要看的数据很多,但是任务很明确,找出除少女消费者意外购买产品的群体。

现在该写报告了。要让客户详细地浏览你的思考过程——你是如何得出这个看法的?

根据这个看法,你建议客户如何改进业务?这条信息如何能帮助他提高销量。

回顾一下

数据分析[1.2]--《深入浅出数据分析》1-分解数据相关推荐

  1. 深入浅出数据分析读书笔记

    深入浅出数据分析读书笔记 一.数据分析引言 1.数据分析的基本流程:确定--分解--评估--决策.一个完整的分析项目可能经过多轮流程 确定:客户的论点和数据 分解:将手头的资料汇总为有用的格式 评估: ...

  2. 《深入浅出数据分析》小结

    可以学到分析现实问题的系统性方法.从卖咖啡到开橡皮玩具厂,再到要求老板涨工资,此书告诉我们如何发现和解密数据在日常生活中的强大作用.从图形图表到Excel和R计算程序,<深入浅出数据分析> ...

  3. 《深入浅出数据分析》为读者送上了章回小说的精彩

    2010年2月,春节将至,我向博文视点的某个邮箱寄出了一封请求参加翻译任何一本图书的邮件.很快,有人回信,内容简单明了:请下载并试译第1章1~17页内容.落款是博文视点编辑徐定翔.于是我试译,寄出,然 ...

  4. 《深入浅出数据分析》样章下载

    序言 真难以相信,他们竟把这些东西写进讲数据分析的书里了. 本节回答一个热门问题:"作者为什么非要把这些东西写进一本讲数据分析的书里?" 谁适合阅读本书? 请先回答几个问题: 1. ...

  5. 《深入浅出数据分析》第九章——R语言

    文章目录 记录第一次接触R语言 一.R语言下载安装 二.运行 三.补充 1.加载csv文件 2.hist函数 记录第一次接触R语言 <深入浅出数据分析>第九章讲到R语言,在这记录一下,就当 ...

  6. 【数据分析】什么是数据分析? 分析和管理数据以做出决策

    数据分析是一门专注于从数据中提取洞察力的学科,包括数据的分析.收集.组织和存储,以及用于执行此操作的工具和技术 数据分析定义 数据分析是一门专注于从数据中提取洞察力的学科.它包括数据分析和管理的过程. ...

  7. python大数据分析实例-如何用Python分析大数据(以Twitter数据挖掘为例)

    原标题:如何用Python分析大数据(以Twitter数据挖掘为例) 来源:艾翻译(http://www.itran.cc/) 原文标题:Twitter Data Mining: A Guide to ...

  8. python dataframe groupby_【Python数据分析基础】入坑必备的数据预处理操作

    本文解决的是2类目标业务: 有数据不知道怎么做数据分析操作的. 自己有思路不知道怎么落地实现的. Python数据分析基础必用品 office软件(推荐2016版) Python开发环境(推荐Anac ...

  9. python部分引入total值的问题_Python数据分析基础与过程综述,关键数据预处理异常点的发现与处理,python,及,流程,回顾,重点,之,值...

    一. python数据分析基础库的导入 基本是固定搭配 import numpy as np #科学计算基础库,多维数组对象ndarray import pandas as pd #数据处理库,Dat ...

最新文章

  1. CIIS 2020专题论坛丨机器智能产业发展蓝图初现
  2. 使用python进行utf9编码和解码
  3. JAVA如何在画板加分数_自学了java一段时间,做了个最低配的画板
  4. VSC为_计及功率控制模式的VSC-MTDC交直流并列运行系统概率潮流计算
  5. HOW-TO:具有MySQL的JEE应用程序中具有集群功能的Quartz Scheduler
  6. 麒麟810加持,华为nova 5z让你一步从青铜变王者
  7. 人工智能TensorFlow工作笔记004---还记得标准差嘛_标准差的由来
  8. spring mvc和swagger整合
  9. java进制转换的简单方法
  10. 怎么知道当前计算机用户名和密码,怎么查看电脑当前所设置的密码
  11. Day10:捡烟蒂投资法:便宜组合
  12. 一零二、Vue中自定义emoji表情包
  13. codeforces 1677A. Tokitsukaze and Strange Inequality
  14. 全面了解风控指标体系
  15. Android Studio与Bmob关联
  16. 在厦门,“隐藏”了一个超高逼格的智慧园区
  17. 9 迭代器与组合模式
  18. PDFCrackers Plus版
  19. 概率论的学习和整理12: 正态分布
  20. 哈佛管理论丛-谁背上了猴子

热门文章

  1. 【解决方案】城市道路如何管控渣土车?EasyCVR助力搭建渣土车运输联网监控系统
  2. git小乌龟TortoiseGit的使用
  3. ES6-ES11-第一部分-let、const、解构赋值、模板字符串、简化对象写法、箭头函数、函数参数默认值、rest 参数、扩展运算符、Symbol、迭代器、生成器、Promise、Set、Map
  4. android edittext 美化,android EditText的美化
  5. 华硕笔记本U盘装系统教程
  6. 插值、拟合、线性和非线性的区别
  7. C语言解决猴子吃桃子问题
  8. Python Flask Web教程020: flask模板
  9. 本程序实现求n*m的二维数组元素的最大值,请将程序补充完整,以实现规定功能
  10. 设备配网专题《原理分析,设备配网技术之AirKiss微信配网》