怎样用excel剔除异常数据_注意避坑 | 这10个错误的Excel使用方法别再用了!
原标题:注意避坑 | 这10个错误的Excel使用方法别再用了!
01 这真有必要做那么多工作表吗?
太多的人觉得每个月一个表格存放数据,一年12个月,一个工作薄文件里放12个工作表,然后还有大量的插件批量生成工作表,批量重命名工作表、工作表排序等一系列的功能来辅助完成这些提速性工作。
这样的做法却从来没有人去思考它的 合理性所在,一路下来,前辈带后辈,模板都这样通用下来了,美其名说不用想太多,照着模板填下数就OK,不知道这些的思维方式害死多少人在没日没夜地在做表格。
正确的做表方式为: 同一主题的数据,尽可能地在一个工作表里完成,多个月的数据,要做区分,不过是多加一列月份,标记下这些数据的附加特征、属性就可以。后期数据分析时,数据源是连贯的,用数据透视表一引用,想看哪月数据就看哪月,想看整年数据也直接汇总下就有。
数据量太大,一个表存不下怎样办?
既然数据量这么大,就寻求下IT人员的辅助,或者自己再加一点点的学习,接触下数据库这东西,最终也不是个问题。
02 合并、拆分工作表,真的必要吗?
如果第一点里能够做好,这个第二点也是个伪需求,就算有需求,Excel的自助式BI组件,对处理这些需求也是分分钟的事情,学习难度也不过是日常表格基本操作的水平,小白级的用户都能轻松掌握。
笔者一直坚持小即是多, 不增加用户的学习负担,只推荐最好的解决方案,除非是万不得已的因为权限问题需要拆分工作表。
03 各种合并单元的各类技巧真的必要吗?
合并单元格不得不说,是数据处理过程中的一大雷区,许多的用户,为了所谓的审美美观,同一个数据内容,多行展示不好看,来个合并居中,好看多了。
殊不知这样一搞,整份数据源就面临灭顶之灾:排序、筛选不能用了,数据透视表也报错了等等。
更糟糕的是,各大插件还赶来帮倒忙,合并了数据不丢失,合并了可以还原数据等等。
正确的使用方式为: 最大可能性地不在数据源里使用合并单元格功能,可以随意在报表层面使用合并单元格进行最后的美观处理。报表层即是数据结果层,无需对数据进行其他的函数公式引用,数据透视表引用等。
一般来说,报表层操作步骤都很有限,想想一份打印的报表数据,才几十行数据就已经阅读够类的,几十行数据,合并个10多次的操作,用F4重复操作也没多难的事情。用不着天天去寻觅各大插件的高级批量处理功能。
04 批注功能衍生的各类需求
纵观各大插件的功能,发现还是许多功能围绕着批注来进行加强,如批量图片到批注,批量修改批注内容等。
我理解的批注:批注是个临时性的标记,用于查看过程中手工发现问题记录一下。
正确的做法是 把批注过的内容,需要重新以数据源的方式追加到数据源内,通常新建一列,填写相应的内容。
此时的好处是新建的列数据,可以进行查找替换、排序、筛选等正常的操作。无需很别扭地因为数据在批注里无法进行这一系列操作的尴尬。
同样的问题也出现在单元格的颜色标注上,这些的标注,可以美观加分一点,但如果是为了区分数据,有更进一步的数据分析意义, 请加上一列,把不同行的信息区分用文字来落实表达出来。
至于批注放个图片,需要查看时鼠标放至单元格上即可显示,好便利,这个也是个伪需求,图片插入到单元格里,或者利用自由报表的形式,重新对数据+图片的排版。无论是打印还是电脑阅读都比用批注存放图片来得更好。
05 动不动就选一列或一行进行操作
在Excel2007及之后,无论是行数还是列数,都有很大的扩展,若不小心在一行或一列里进行了数据引用、字体、颜色、背景、边框等设置,这些将会大大地增大了其作用范围。本来是设置几十个单元格,变成了设置几百万个单元格。
因为这些的不合规的操作,致使出现了工作薄文件突然增大,明明几百行的数据,文件却几十M的大小,明明简单的一个函数,运行起来却巨慢无比。然后也出现也插件界量身定制的工作薄、工作表瘦身功能。
正确的使用方式:
要用多少,引用多少的单元格 ,不要动不动就整列、整行的选择。一般整列、整行只是删除、调整行列高之类的整体性的操作才有需求。
使用Excel智能表功能 ,智能表功能不仅有间隔行颜色填充这样的表面性表现,同时它是结构化的数据,可以轻松地选择数据区域内的一行或一列或全表等操作。在做数据引用时非常轻松。
06 有那么多的删除、插入空行的操作吗?
对这些需求的人,也是没有分清数据源和报表的区别,数据源是基础,报表是引用数据源生成的结果数据。
一般的数据处理、分析的时间分配是80%的时间在做数据源的清洗、整顿。通常这些插入空行的操作,极大的破坏了数据源的数据结构,给数据源的清洗带来灾难性的问题。
在报表层的插入空行的操作,回到上面所说的,报表层,需调整的余地和动作很少,一般人工操作的步骤范围也是 可接受的范围内,最多是 数据透视表+自由报表功能,可满足绝大多数的报表排版需求。
至于这些插入、删除空行的操作,反正我是几乎没有用到过,是因为我做表太少还是我在思考和实践正确的做表习惯和思维,这个留给大家思考。
07 数据聚光灯功能的使用真的刚需吗?
学习VBA的人,或多或少都会接触到这个数据聚光灯的功能, 点击某个单元格,然后可以高亮其对应的行和列,防止数据看错行或看错列。
这个功能的开发,还分出了不少层级水平。
初级水平: 功能实现了,却破坏了原来的颜色标注,使原有的颜色标注被清除了。
高级水平: 无论是颜色标注还是条件格式的颜色,都可以保留,完美实现功能所需。
这个功能在插件界也是呼声很大,很多用户很想拥有,开发者也多数以能够成功开发完美的聚光灯功能来展示实力水平。
但问题是,对于数据源的查看,数据量是很大,但有了智能表的间隔行颜色区分,加上排序、筛选等操作,出现看错行列的机率几乎很少。报表层面数据量本来就少, 数据透视表也可以套用间隔行的颜色填充,看错的机率就更少。
说实话,真不知道这个需求的群体是哪些,如果真有,欢迎在下方评论区讨论一下。
08 从一个单元格提取出想要的信息
这个想必最多人吐槽的不合规的做表方式,一个单元格存储内容:猪肉,3斤,油8两,青菜800克。
就算各家插件有几种能耐帮你重新从一堆文本里把需要的信息提取出来,但这个意义何在,这就是加班做的事么?
犹如一栋高楼需要坚实的地基, 一份有价值的数据,也需要合理的前期数据规划,不是什么都临时性地做一下,把Excel当作一个草稿纸,反正信息记录下来了,日后要用到时,也可以从中取出来用。
但这个取的动作,代价之高,没几条生命可以折腾得住,更可气的是,这个烂摊子还要留给不少后来者一同来打扫,难受得很!
这些烂摊子的需求,也扭曲性地催生了一系列的插件功能,笔者不得不向其低头,同样提供了这类的文本处理功能,烂摊子多了去,何年可休也?
09 修改原有数据,最后无法还原
某些时候,因数据分析的上层需求,需要在数据源中提取相关信息作分析,如果数据源不规范,在数据处理过程中,通过查找、替换或各种插件的功能对数据源进行更改,并在原单元格上覆盖保存。
虽说此次的分析需求被满足了,但数据查找、替换过程中,也必然带来数据的丢失和变更。如简单一个转换大小写功能,处理成了全部大写,但哪天想看回原始的数据是怎样的,已经没法返回,或更有一些是一个信息量很大的单元格里,如上文的猪肉,3斤,油8两,青菜800克。。如果仅提取第1个猪肉的信息,后续,其他信息将无法还原。
正确的做法是: 使用函数公式,另起一列,通过函数公式的逻辑处理,从原来的数据中加工出最终想要的数据形式,例如Excel函数有转大写函数,用这个函数转一下,新列就是大写的,原来的数据还保留,可以追溯。
很悲哀的是笔者也同样支持此类的文本处理功能,但实在呼吁,最好的方式是另起一列,用自定义函数实现(可能需要点正则的知识,多数人就打退膛鼓了)。
10 中国式报表的大行其道
制作带斜表头,各种交叉表、各种大小类小计手工引用多个单元格求和等等。报表出来就是一大张,A4纸都不够排,列数据有几十上百列,看得了这头忘记那头,看报表时当然要用聚光灯功能。同时打印出来要拿把尺子来比对不要看错行。
以上林林总总,好像国有企业是个重灾区,领导要看的样式不敢不照做,多少生命就这样被领导着走一生。
多用数据透视表吧,数据透视表不能满足的部分,就用数据表公式引用下结果数据,每月要更新报表,刷新下透视表,然后复制粘贴到PPT之类的排版下。
End.
作者:Excel催化剂
来源:简书
本文为转载分享,如有侵权请联系后台删除返回搜狐,查看更多
责任编辑:
怎样用excel剔除异常数据_注意避坑 | 这10个错误的Excel使用方法别再用了!相关推荐
- 怎样用excel剔除异常数据_(如何剔除excel表格中重复的数据)excel表格怎么剔除异常数据...
请问 Excel 如何剔除与平均数偏差较大的数字再求平均数?谢谢. 把问题作为内容(邮件主定要包含"excel",本人以此据辨别非垃圾邮件,以免误删).excel样件(请特别注意: ...
- 怎样用excel剔除异常数据_【Excel技巧】IFERROR函数,从结果中剔除不需要的值!...
在Excel中使用IFERROR函数可以用来判断某些内容的正确与否,正确则返回正确结果,错误则返回需要显示的信息. IFERROR函数的语法为:IFERROR(value, value_if_erro ...
- 怎样用excel剔除异常数据_excel如何去除异常值?(excel表格数据异常丢失)
急!!!java用poi导出excel文件,打开导出的文件时报错"文件错误,数据可能丢失" 我遇到过这个问题后调查发现两个原因: 1.你的excel模版本身有问题,可以尝试新建一个 ...
- mysql scrapy 重复数据_小心避坑:MySQL分页时使用 limit+order by 会出现数据重复问题...
作者:猿码道http://www.jianshu.com/p/544c319fd838 0 问题描述 在MySQL中我们通常会采用limit来进行翻页查询,比如limit(0,10)表示列出第一页的1 ...
- FlyFish|前端数据可视化开发避坑指南(二)
FlyFish是云智慧开源的一款数据可视化编排平台.通过配置数据模型为用户提供上百种可视化图形组件,零编码即可实现符合自己业务需求的炫酷可视化大屏. 同时,FlyFish也提供了灵活的拓展能力,支持组 ...
- python检测异常数据_用Python中从头开始的实现完整的异常检测算法
利用概率的异常检测算法 异常检测可以作为离群分析的统计任务来对待. 但是,如果我们开发一个机器学习模型,它可以自动化,并且像往常一样可以节省大量时间. 有很多异常检测用例. 信用卡欺诈检测,故障机器检 ...
- cdatabase读取excel第一行数据_“蟒蛇”py对Excel的读取——数据操作用它,老板都得重新认识你...
在python自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在python文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在python文件中吗? 应对这一问 ...
- python向excel隔行写数据_【Python】将每日新增数据写入Excel
一.背景: 因为自己从网上获取了一些金融数据,也没有配置数据库,所以目前暂时是将数据以增量的形式存储在自己的OneDrive上. 二.代码演绎:导入相关数据包 import pandas as pd ...
- excel抓取数据_抓取具有要求的excel在线只读文件
excel抓取数据 In a previous article https://medium.com/@hanqi_47643/scraping-excel-online-read-only-file ...
- aspose excel中文文档_除了VBA,还有哪些编程语言可以操作Excel文件?
Excel(Microsoft office)是现在最常用的办公软件,主要涉及电子表格制作.数据处理.报表输出展示以及更高端的还有金融建模等:我们知道,在需要批处理多个Excel工作表以及工作簿的时候 ...
最新文章
- 前端性能毫秒必争方案(一)HTTP请求
- Spring单例的线程安全性
- 向您的JVM添加一些熵
- python连接数据库mysql错误1045_django 连接数据库出现1045错误的解决方式
- php fetch mode,odbc_fetch_into
- C语言算出一行的最大数,多输入输出练习1 (C语言代码)给定很多行数据,要求输出每一行的最大值。注意输入输出的格式要求...
- linux安装包文件格式,一般软件的安装包格式
- 统计分类分为描述性统计_了解描述性统计
- C语言实现 Base64 和 Base32 编解码
- 计算机网络专助理工程师考试时间,软考高级工程师职称考试时间
- PTC:能源互联网“双子星”,引领风电企业研发数字化变革
- kakfa安装与简单使用
- 声明式事务、SpringMVC详解
- AI一分钟 | 苹果在自动驾驶领域苦追谷歌,测试车增至27辆;比尔盖茨:AI代替人类工作是件好事
- 关于Parser的知识点总结
- vue使用JavaScript的Number方法或正则表达式进行表单验证,判断值是否为数字(包括整数和小数),验证值只能为小数点后一位
- 经典好文!java保留两位小数不四舍五入
- 【leetcode】解题日记(未完待续)
- Weir:原生 TiDB 支持的数据库中间件
- 每天5分钟玩转Kubernetes | Cluster IP底层实现
热门文章
- Android Dex 分包+热修复(QQ空间技术方案)
- java 中的radix_Java Scanner radix()用法及代码示例
- 为啥JAVA虚拟机不开发系统_我的YMLF OS (LINUX)上装了java为何运行不了eclipse 还提示没有java虚拟机 ?...
- 本地图片转换Base64的方法,Base64码转换为本地图片
- when函数c语言,when表达式
- 心动的本质是什么_风动,幡动,仁者心动,到底是什么在动
- FreeBSD下解决Nagios不发报警邮件的问题
- 【Matlab】MATLAB编辑器主题颜色更改(MATLAB Schemer)
- 计算机如何设置保存到桌面,如何设置电脑桌面背景
- 证书查询系统源码,全开源可二开,自定义查询条件字段