1.数据的预处理:
    是在对数据分类或者分组之前所做的必要处理 内容包括 数据的审核 筛选 排序
    
    1.1 数据审核:检查数据中是否有错误 主要从完整性和准确性去审核 考虑数据的适用性和时效性
                  完整性:是否有遗漏 填写是否齐全
                  准确性:是否有错误 和  异常值[看异常值是否正确]
                  
    1.2 数据筛选:找出符合特定条件的某类数据[使用Excel]

1.3 数据排序:按照一定顺序将数据进行排列 以便于发现明显的特征或者趋势 有助于对数据的纠错 重新归类或分组提供方便
    
    1.4 数据透视表:借助Excel来生产数据透视表 进行分类汇总和作图 形成一个符合需要的交叉表(列联表)
                    列联表[两个或两个以上变量交叉分布的频数分布表] 二维列联表---->交叉表
                    
2.品质数据的整理与展示:
    预处理后的数据,根据需要进一步做分类和分组
    
    2.1 分类数据的整理与图示:
        需要计算出每一类别的频数/频率、比例/比率 形成一张频数分布表 再根据需要进行展示 以便于对数据的特征有初步的了解
            2.1.1 频数与频数分布:
                  频数是指落在某一特定类别或组中的数据个数 
                  把各个类别及其落在其中相应频数 用表格的形式表现出来----->频数分布
                  
            2.1.2 分类数据的图示:
                  用图形来表示会更加的形象和直观 ----> 条形图[长短直观表现]、
                                                       帕累托图[分类数据排序后频数的分布]、
                                                       饼图[研究结构性问题的分布,多个样本的分布情况]
                                                       两个总体或两个样本的分类相同且问题可比---> 环形饼图
                                                       
    2.2 顺序数据的整理与图示:
            1.累积频数:将各有序类别或组的频数逐级累加起来得到的频数
                        ----> 从变量大/小 向变量小/大一方进行累加 分别成为 向下/上累积
                        通过累积频数 可以看出某一类别以下/上的数值之间的频数之和 
                      
            2.累积频率:将各有序类别或组的百分比逐级累加起来得到的频数 也具有向上和向下累积两种方法
              
              
    2.3 数值型数据的整理与图示:
            1.数据分组:根据研究需要 将原始数据按照某种标准分成不同的组别 分组后的数据成为---->分组数据
                        分组目的:主要的为了观察数据的分布特征
                        方法:单变量分组[离散型] 组距分组[连续型]
                        最大/小值:上限和下限
                            1.确定组数:适中--->5≤K≤15
                            2.确定各组组距: (max-min)/组数 向上取整
                            3.根据分组整理成频数分布表(Excel)
                            注意:不重不漏的原则 
                                  不重:上组限不在内[相邻两组的上下限重叠 140-149 150-159]
                                  在组距分组中 如果全部数据中的最大值和最小值与其他数据悬殊 为避免出现空白组 可以采取“xxx以上”的方法
                        组中值:(上限+下限)/2
                        
            2.数据型数据的图示:
                        2.1 分组数据:直方图、折线、曲线
                        2.2 未分组数据:茎叶图[可以看出数据的分布形状及数据的离散状况 对称 集中]
                                        箱线图[最大值 最小值 (上/下)四分位 中位数]--->离群点 
                        2.3 时间序列数据:线图[用来反映现象随时间变化的特征] 
                        2.4 多变量:散点图 [两个变量之间的关系]
                                    气泡图[三个变量]
                                    雷达图[对比各变量数值总和、多个变量的相似程度]

3.合理的使用图表:
        正确的使用统计表和图表是做好统计分析最基本的技能 
            3.1 鉴别图形优劣的准则:尽可能的简洁 但要能够清晰地显示数据、合理的表达统计目的为依据
                1、显示数据 2、让读者把注意力集中在图形的内容上 而不是制作图形的程序上
                3、避免歪曲 4、强调数据之间的比较
                5、服务与一个明确的目的 6、有对图形的统计描述和文字说明

统计学上数据的处理和图标的展示原则相关推荐

  1. python在统计专业的应用_Python统计学一数据的概括性度量详解

    一.数据的概括性度量 1.统计学概括: 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析.总结,并进而进行推断和预测,为相关决策提供依据和参考.统计学主 ...

  2. 联想台式电脑一键恢复后桌面没有计算机了,桌面上的一键恢复快捷图标没有了怎么办?...

    故障现象: 桌面上的一键恢复快捷图标没有了怎么办?解决方案: Lenovo 家用系列电脑桌面上一键恢复快捷方式图标丢失找回的处理方法: 首先出厂预装系统解封装后,桌面上会有一键恢复的快捷方式的图标&q ...

  3. 计算机左下角文档,基本操作 单击考试系统界面左下角上的Windows资源管理器图标(3页)-原创力文档...

    基本操作 单击考试系统界面左下角上的Windows资源管理器图标,打开Windows资源管理器.在自己的考试文件夹中,完成下列基本操作(本题共5小题): 1.将STUDENT文件夹中的LICENSE. ...

  4. 误删桌面上的 计算机 图片,桌面图标删除不了怎么办 桌面图片不见找回【图文】...

    桌面图标便是我们所下载的软件app的操作图标,很多时候,当我们下载了一些功能性很高的软件时,会被附带一些病毒软件下载到电脑桌面上.这个时候,很有可能出现无法删除附带软件图标的现象.最大的可能性便是因为 ...

  5. iphonex桌面的计算机不见了,iPhone 桌面上找不到应用图标了怎么办?

    iPhone 上下载了很多 App,无法找到对应的 App 图标了怎么办? 确认应用是否已经下载 如果是找不到 App,不记得之前是否有卸载,无论是不是 iPhone 自带的 App,都可以在 App ...

  6. android手机+hd图标,手机上经常出现HD小图标?手机上的HD是什么意思?这里都告诉你...

    原标题:手机上经常出现HD小图标?手机上的HD是什么意思?这里都告诉你 手机上经常会出现"HD"字母,不知道什么意思,还以为是开通了什么业务? 如果你的手机上出现了"HD ...

  7. 离散度计算公式 python_Python统计学一数据的概括性度量详解

    一.数据的概括性度量 1.统计学概括: 统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析.总结,并进而进行推断和预测,为相关决策提供依据和参考.统计学主 ...

  8. Spark Machine Learning 03 Spark上数据的获取、处理与准备

    Chap 03 Spark上数据的获取处理 Spark上数据的获取.处理与准备 MovieStream,数据包括网站提供的电影数据.用户的服务信息数据以及行为数据. 这些数据涉及电影和相关内容(比如标 ...

  9. php文件在桌面删除不了图片吗,删除windows桌面上某个应用程序的图标,意味着什么...

    删除windows桌面上某个应用程序的图标,意味着:只删除了快捷图标,对应的应用程序被保留.桌面上的图标是一种快捷方式,是Windows提供的一种快速启动程序.打开文件或文件夹的方法. 本教程操作环境 ...

最新文章

  1. chrome弱网_请你进行一下弱网模拟
  2. VR Cinema 来了!未来的影院也许是酱紫滴
  3. 更改eclipse tomcat jvm heap
  4. 【DND图形库】二、创建控制台窗口和游戏循环
  5. no connection could be made because the target machine actively refused it.问题解决
  6. 字符串p型编码(信息学奥赛一本通-T1145)
  7. 实战系列-分布式锁的Redis实现
  8. oracle 磁盘响应慢,磁盘故障引起的系统变慢定位
  9. Lesson 3 Part 1 Locally weighted regression
  10. 这个时代,开发简单多了
  11. 盒模型知识点汇总(附实例、图解)
  12. 2019,最坏的一年,最好的一年,交学费要趁早
  13. 三种最常用的期货交易系统,99%的人都不知道
  14. 小鑫の日常系列故事(五)——卡片游戏
  15. 什么是剩余参数 ...arg
  16. ArcGIS栅格裁剪
  17. Tekton实践篇-Tekton和Argocd的梦幻联动
  18. sql:mysql:修改表注释、字段注释、查看与修改注释(修改备注)
  19. android 触摸 唤醒屏幕,android 怎么通过触摸屏幕来唤醒屏幕。
  20. 大疆精灵4RTK的运用

热门文章

  1. 心流体验:专注的快乐--读书笔记
  2. [Web前端] 子元素设置高度为100%, 却没有与父元素对齐高度.
  3. win10家庭版没有本地组策略编辑器
  4. 移动端系统:scroll,fixed
  5. u-boot 自定义命令
  6. 【致敬世界杯】球迷(我)和足球的故事
  7. 弱智的页面无法访问的问题
  8. Windows下RabbitMQ安装及配置
  9. 看了这篇文章,再也不用找人设计名片卡证啦!
  10. Pantoea(泛菌属)——肠道内善恶兼备的神秘细菌