前  言

为什么要写这本书
在我做数据分析培训和咨询的过程中,经常会有学员来问我,有没有合适的统计分析方面的参考书可以推荐。被学员问得多了,慢慢地就有了写本书的冲动,一是毕竟自己写的书和培训的内容比较配套,二是写书对自己来说也是一个总结和提高的过程吧。
“理想很丰满,现实很骨感”,原来觉得自己手里有不少案例,各种工具的使用也算是比较熟练,写起书来应该得心应手,进度也会比较快,但是真到开始动手写作时,才发现并不是那么简单。从框架目录的确定、章节内容的选择、语言风格的打磨,到分析结果截图的选择等,每一个环节都需要细细地思量和斟酌。这本书的写作使我从2016年4月到11月的这段时间非常疲劳,颈椎病也复发了,因为在写书的同时,我的数据分析方面的培训并没有停止。
我在写作本书的时候,给自己规定了几个原则:
一是要实用,要能够解决企业工作中的实际问题。
二是要尽可能地降低读者上手的难度,那种操作非常繁复、需要强大坚实的统计分析理论基础,或者需要编程才能实现的功能,我都没有放在本书中。原因很简单,即使本书讲了那些难度比较大的内容,读者也很难真正应用起来。
三是语言风格尽可能轻松活泼一点,尽量避免很严肃、很晦涩的专业术语,我很难做到“寓教于乐”,但还是尽己所能让本书的阅读轻松一点吧。
在本书的写作过程中,我经常提醒自己这三条原则,并且要求自己遵守它们。
简言之,给读者带来一本“有用的、上手比较容易的、读起来比较轻松的”数据分析书,这就是我写这本书的原则和动力。
读者对象
这本书的读者对象是企事业单位中从事数据分析的非统计专业人士:
企业中的市场部相关人员,包括市场分析人员、产品设计和研发人员、销售经理等。
企业中的生产部人员,包括生产经理、质量控制经理等。
企业中的财务部人员,包括财务总监、财务经理等。
企业中其他需要经常和各类数据打交道的管理人员和一般工作人员。
如果读者是高校或者科研院所的教师、学生、科研人员,要从事专业学术论文的撰写或者纵向科研项目的研究工作,不建议你将本书作为主要的阅读和学习的书籍,因为使用的工具、模型、方法都会大相径庭,例如撰写学术论文经常要使用Eviews、Stata等专业计量工具,而这些专业计量工具在企业中使用的概率非常低。
如何阅读本书
本书分为三大部分,第一部分基础篇(第1章和第2章)主要介绍数据分析的概念、术语、方法、模型等,为后续的内容展开奠定基础。
第二部分制表篇(第3章到第5章)介绍数据的采集、整理以及常用数据报表的制作。
第三部分数据分析篇(第6章到第14章)占据了本书的大部分篇幅,囊括了常用的、有代表性的、实用的功能,包括数据扫描、数据标注、异常值分析、回归等。
正文中所提“案例文件”为本书的配置案例资料,请通过网络自行下载,下载地址为http://www.hzbook.com。
勘误和支持
由于作者的水平有限,编写的时间也很仓促,书中难免会出现一些错误或者不准确的地方,恳请读者批评指正。如果你发现本书有错误,或者有其他宝贵意见,请发送邮件到我的邮箱jhyjhy8888@163.com,我很期待能够收到你们的真挚反馈。

目 录

1.1  一眼就看到结论还需要数据分析吗
1.2  数据分析能给我们带来什么
1.3.3  合适的工具
1.4  数据分析的流程
1.5  如何成为数据分析高手
第2章
2.1  基本概念和术语
2.1.2  术语
2.2  选择称手的软件工具
2.3  在分析需求和模型之间搭起桥梁
第3章
3.1  数据采集的几条重要原则
3.2  用“逐步推进法”推测需要的数据
3.3  耗时耗力的数据整理过程
3.3.1  重复、空行、空列数据删除
3.3.2  缺失值的填充和分析
3.3.3  数据间逻辑的排查
3.4  数据量太大了怎么办
3.4.1  放到数据库中处理
3.4.2  用专业工具处理
3.4.3  数据抽样
第4章 数据分析的基础:制表(上)
4.1 以数据合并为目标的制表
4.1.1 跨工作表合并
4.1.2 跨工作簿合并
4.2 以数据筛选为目标的制表
4.2.1 普通数据筛选
4.2.2 高级筛选
4.2.3 计算筛选
4.2.4 函数筛选
4.3 以获得概要数据为目标的制表
4.3.1 分类汇总方法
4.3.2 数据透视表汇总
第5章 数据分析的基础:制表(下)
5.1 “七个百分比”让你懂得大部分表格类型
5.1.1 行总计的百分比
5.1.2 列总计的百分比
5.1.3 全部总计的百分比
5.1.4 父行(列)的百分比
5.1.5 累计占比
5.1.6 环比
5.1.7 同比
5.2 分组功能经常让分析峰回路转
5.2.1 文本的分组
5.2.2 等步长的数据分组
5.2.3 不等步长的数据分组
5.2.4 日期型的分组
5.3 随意生成各种派生指标
5.3.1 添加字段
5.3.2 添加项
5.4 从大数据库中挑选要分析的数据:Microsoft Query
5.5 强大的SQL
5.5.1 SQL的基本语法
5.5.2 SQL的应用
第6章 数据扫描:给数据做体检
6.1 在EXCEL中给数据做扫描
6.2 SPSS中给数据做扫描
6.3 在Modeler中给数据做扫描
6.4 其他相应的指标
第7章 数据标注:给数据上色
7.1 大数据块的整体标注
7.1.1 突出显示单元格规则
7.1.2 特殊数据选取规则
7.2 根据业务逻辑在数据中标注上色
7.2.1 数据条、色阶、图标集的应用
7.2.2 规则的理解
7.2.3 根据业务需求改变规则
7.3 采用公式实现复杂强大的数据标注
7.3.1 理解逻辑表达式的含义
7.3.2 复杂逻辑公式的应用
7.4 如何在一张表格中实现多种标注规则
7.4.1 多规则的应用
7.4.2 如何理解“遇真则停止”
第8章 找到数据中的“特殊分子”
8.1 什么是异常值
8.2 异常值的判断标准
8.3 用绘图技巧找到异常值
8.3.1 散点图
8.3.2 面板图
8.4 用公式函数法发掘异常值
8.5 三倍标准差法
第9章 相关分析与决策树
9.1 Pearson相关
9.1.1 应用场景
9.1.2 输出指标的解析
9.2 典型相关分析
9.2.1 操作步骤
9.2.2 结果解读
9.3 决策树
9.3.1 什么时候需要用决策树
9.3.2 决策树的操作和指标解释
第10章 聚类
10.1 多维度数据的分类怎么办
10.1.1 低维度数据的分类方法
10.1.2 高维度数据的分类需求
10.1.3 常用的聚类操作介绍
10.2 聚类的烦恼1:如何面对数量级差别大的数据
10.3 聚类的烦恼2:如何判断聚类的质量
第11章 回归
11.1 如何寻找现有数据的内在规律
11.1.1 什么是数据拟合
11.1.2 多元线性回归
11.2 logistic回归
11.2.1 回归(客户“买”与“不买”)
11.2.2 多元logistic回归(多个品牌的选择)
11.2.3 多元有序logistic回归
第12章 关联分析
12.1 因果关系的弱化
12.2 关联分析的指标
12.2.1 支持度
12.2.2 置信度
12.2.3 提升度
12.3 什么样的数据适合做关联分析
12.3.1 商超数据
12.3.2 金融数据
12.3.3 生产质量数据
12.4 关联分析的具体操作
第13章 预测
13.1 什么是预测,预测的准确度高吗
13.2 移动平滑
13.3 指数平滑
13.3.1 二次指数平滑
13.3.2 三次指数平滑
13.4 对周期性数据的分解
13.5 ARIMA预测法
第14章 高级绘图技巧
14.1 怎样才算图画得好
14.2 双轴图的技巧和运用
14.3 不同数量级数据的高效对比展示
14.4 数据标签的妙用
14.5 图形中的重点标注
14.6 绘图美学—多点审美素养
14.6.1 整体布局
14.6.2 线型的选择
14.6.3 色彩对比
后记 数据分析经验之我见

《数据分析实战:基于EXCEL和SPSS系列工具的实践》一导读相关推荐

  1. 《用户体验设计 本质、策略与经验》一2 设计师

    本节书摘来自异步社区<用户体验设计 本质.策略与经验>一书中的第2章,第2.1节,作者[美]Robert Hoekman Jr.,更多章节内容可以访问云栖社区"异步社区" ...

  2. 《用户体验设计 本质、策略与经验》一导读

    目 录 1 简介 2 设计师 3 适应 4 理解 5 质疑 6 交流 7 劝说 8 领导 9 学习 10 不讲理

  3. 2018年用户体验设计的10个趋势

    设计和体验从未像现在这么重要.在过去的10年当中,设计不断适应着用户的新需求,发生了翻天覆地的变化.虽然我们不大可能预测太远的未来,但是我们仍然可以对明年的设计趋势有一个基本的猜测.今天的文章,我们将 ...

  4. 4点,从今天谈用户体验设计经验京东亚马逊购物

    4点意见.从今天在京东和亚马逊的购物体验谈用户体验设计 导读: 今天,想给自己买一款笔记本,货比三家.打开京东和亚马逊的首页.搜索"笔记本",在对照和购买的过程中,我有明显不同的感 ...

  5. 精美网页设计案例_用户体验设计的精美艺术

    精美网页设计案例 There are interactive experiences that simply blow you away. You know it's been a positive ...

  6. 实现线程哪种方法更好_实施数据以实现更好的用户体验设计的4种方法

    实现线程哪种方法更好 Gone are the days when design used to rely mainly on the color palettes and the creativit ...

  7. 面向对象的用户体验设计(持续更新10.29)

    注:本文为原创产品设计译文,由于原文较长,预计分为5次完成.首发PMCAFF,转载请私信,感谢捧场,欢迎交流,谢谢~ 原文:Object-Oriented UX 2012年6月,我在CNN.com工作 ...

  8. 用户体验设计和精益设计的平衡之道

    对你而言那个更重要:是制作出拥有杀手级用户体验的产品来吸引用户?还是尽快制作出能满足用户的产品并抢占大量的市场份额? 假设一款产品用户体验非常差的话,用户不会使用它,但假设作为市场上的先入者,用户也会 ...

  9. 【破茧成蝶-用户体验设计】读书笔记

    第一篇:成为用户体验设计师的信念 01.什么是用户体验设计 以用户为中心的一种设计手段,以用户需求为目标,为提升用户体验而做的设计. 用户体验设计首先是要解决用户的某个实际问题,其次是让问题变得更容易 ...

  10. 为何用户体验无法被设计,如何为用户体验设计

    近来许多设计师开始谈论用户体验(UX).我们试图取悦用户,甚至提供某种魔力,这样他们才会爱上我们的网站.应用程序和启动界面.用户体验是一个非常模糊的概念,导致许多人对它产生了错误的理解.此外,很多设计 ...

最新文章

  1. 高校人工智能热的“冷”思考
  2. Fedora 31 将被“砍掉”或推迟更久发布,但和 IBM 无关
  3. 数据结构-二叉排序树
  4. The serializable class XXX does not declare a static final serialVersionUID field of type long的警告...
  5. PHP笔记-PHP中构造函数要注意的地方
  6. 没有qpress_MySQL 大数据备份方案之Percona XtraBackup
  7. go 的时间与时间戳计算
  8. 3dContactPointAnnotationTool开发日志(八)
  9. Android Studio控制台输出乱码,编译时期输出乱码,outpot乱码解决
  10. 解决问题—麦肯锡方法:解决问题的七个步骤
  11. 165个站长在线工具箱网站源码/野兔在线工具系统V2.2.7中文版
  12. 闰年2月29天,我们都知道怎样判断,但知道为什么那样做吗?
  13. .NET学习路线总结之LINQ查询
  14. 语音输入转文字怎么操作?分享几种语音转文字技巧
  15. freemark导出word全过程 + 图片不显示问题
  16. 笑话 php 程序员,[每天程序员]笑死人不偿命的程序员段子
  17. Disruptor并发框架,核心组件RingBuffer
  18. 十分钟,让你了解DSP/DMP/SSP
  19. 走进JavaWeb技术世界5:初探Tomcat的HTTP请求过程
  20. 2021-11-26 ubuntu触摸板和小键盘设置

热门文章

  1. 微信开发者工具:单个安装微信开发者工具中没有的扩展(通过vsix 离线安装)
  2. Terra Gate 安装
  3. 冤家路窄?——软件开源与软件专利保护
  4. where is java_Linux下的搜索查找命令的详解(whereis)
  5. 一、概述(知识图谱构建射雕人物关系)
  6. 学习可爱彩色线条PS极简马克笔简笔画:鞋子篇
  7. vue : 无法加载文件 C:\Users\Administrator\AppData\Roaming\npm\vue.ps1,因为在此系统上禁止运行脚本
  8. REDO文件损坏修复
  9. 钢笔墨水能否代替打印机墨水_uv打印机喷头波形和墨水关系
  10. 微信公众号删除cookie失败,cookie设置了过期时间不管用,微信公众号cookie比较诡异,删不掉,解决办法,原生JS封装cookie统一操作删除cookie,读取cookie,删除cookie