转自公众号‘机械生探路互联网’

作者: @赵之宇

数据清洗是数据分析师的基本功,可以说是没个数据分析师都必须要掌握的技能,这其中的基础就是用EXCEL进行数据分析,下面介绍一下一些比较常用的数据清洗的函数。

1、Trim

功能:去除单元格两端的空格。

语法:=TRIM(text)

text指要移除空格的文本或者单元格名称

说明:此方法只能删除字符串首尾的空格,而不能删除字符串中间的空格!因为英文单词之间的空格是必须的,Excel不会去除这种空格!

2、Clean

有时文字值包含起始空格、 尾随或多个嵌入的空格字符。这些字符进行排序、 筛选或搜索时,有时会导致意外的结果。

功能:删除文本中所有不能打印的字符。

语法:=CLEAN(text)

CLEAN 函数语法具有以下特点:

单元格中的软回车会生成代码,虽然肉眼看不到,事实是存在于表格中,此类字符输出至别的文本,可能会产生乱码.用CLEAN函数删除。

3、Concatenate

功能:连接单元格内的内容

语法:= CONCATENATE(text1, [text2], ...)

text1为必需,要联接的第一个项目。项目可以是文本值、数字或单元格引用。

[text2]表示text2为选填的意思,下同。

说明:concatenate能够连接的参数最多只有30个,而&则没有限制。

4、Mid

功能:提取字符串中间的字符串

语法:= MID(text, start_num, num_chars)

text必填。包含要提取字符的文本字符串。

Start_num必填。文本中要提取的第一个字符的位置。文本中第一个字符的 start_num 为 1,以此类推。

Num_chars必填。指定希望 MID 从文本中返回字符的个数。

5、Left

如果继续想从出生年月里提取年份,则需要用到left函数。

功能:提取字符串左边的字符串

语法:= LEFT(text, [num_chars])

Text,必需。包含要提取的字符的文本字符串。

num_chars,可选。指定要由 LEFT 提取的字符的数量。

Num_chars 必须大于或等于零。

如果 num_chars 大于文本长度,则 LEFT 返回全部文本。

如果省略 num_chars,则假定其值为 1。

6、right

与left类似,如果想从出生年月里提取月日,则需要用到right函数。

功能:提取字符串右边的字符串

语法:=RIGHT(text,[num_chars])

text 必需。包含要提取字符的文本字符串。

num_chars可选。指定希望RIGHT提取的字符数。

7、repalce

功能:替换字符串中的连续几个字符或者某个字符

语法:= REPLACE(old_text, start_num, num_chars, new_text)

Old_text必填。要替换其部分字符的文本。

Start_num必填。old_text 中要替换为 new_text 的字符位置。

Num_chars必填。old_text 中希望 REPLACE 使用 new_text 来进行替换的字符数。

New_text必填。将替换 old_text 中字符的文本。

8、substitute

功能:替换字符串中的连续几个字符或者某个字符

语法:=SUBSTITUTE(text, old_text, new_text, [instance_num])

text必填。需要替换其中字符的文本,或对含有文本(需要替换其中字符)的单元格的引用。

Old_text必填。需要替换的文本。

New_text必填。用于替换 old_text 的文本。

Instance_num虽然日程表需要数据点之间常量的步骤,预测.指定要用 new_text 替换 old_text 的事件。如果指定了 instance_num,则只有满足要求的 old_text 被替换。否则,文本中出现的所有 old_text 都会更改为 new_text。

9、find

功能:用于查找其他文本字符串(within_text)内的文本字符串(find_text),并从within_text的首字符开始返回find_text的起始位置编号。也可使用SEARCH查找其他文本字符串中的某个文本字符串,但是,FIND和SEARCH不同,FIND区分大小写并且不允许使用通配符。

用大白话解释为查找内容在第几个字的位置,大小写算不同内容。

语法:=FIND(find_text,within_text,start_num)

find_text必填。是要查找的文本。

within_text必填。是包含要查找文本的文本。

start_num。指定开始进行查找的字符。within_text中的首字符是编号为1的字符。如果忽略start_num,则假设其为1。

find函数还可以和left等函数结合,效率更高

Tao:小白从零开始数据分析02—Excel常用数据聚类及统计方法汇总​zhuanlan.zhihu.com

更多知识可以关注公众号‘机械生探路互联网

机械生探路互联网

有一起转行的小伙伴可以私信我,加个好友分享资料

以某个字符开始_小白从零开始数据分析01—Excel常用公式汇总(数据清洗)相关推荐

  1. python从0开始学编程课件_小白从零开始学编程(三)--python基本概念

    前言 从2020年3月份开始,计划写一系列文档--<小白从零开始学编程>,记录自己从0开始学习的一些东西. 第一个系列:python,计划从安装.环境搭建.基本语法.到利用Django和F ...

  2. cmd mysql 数据分析_小白学数据分析--与MySQL有关的小知识

    放在这个专题下,是因为有时候我们数据分析师的确是懂得一点数据库的操作知识或者会一些SQL,平时我用的比较多的就是MySQL,如果说我们一般就是要学一些SQL操作的话,可能就足以应付平时的工作,至于对象 ...

  3. 数据分析之EXCEL常用函数总结

    今天通过excel分析数据的时候,突然大脑宕机,瞬间想不起来excel各种函数的用法,下面整理了一下excel的常用函数 1.用函数识别重复数据的方法,COUNTIF函数 CUOUNTIF(range ...

  4. 15个常用excel函数公式_重要的27个Excel函数公式

    目录 一.数字处理 1.取绝对值 2.取整 3.四舍五入 二.判断公式 1.把公式产生的错误值显示为空 2.IF多条件判断返回值 三.统计公式 1.统计两个表格重复的内容 2.统计不重复的总人数 四. ...

  5. 【数据分析】Excel必备函数汇总

    文章目录 求和 单条件求和SUMIF 多条件求和SUMIFS 求平均AVERAGE 单条件 多条件 查找 纵向VLOOKUP函数 eg1已知身份证查姓名 eg2已知身份证查地区 Find函数 Find ...

  6. xman的思维导图快捷键_思维导图软件——MindMaster常用快捷键汇总

    思维导图,英文是The Mind Map,又叫心智导图,是表达发散性思维的有效图形思维工具 ,它简单却又很有效,是一种实用性的思维工具.今天就为大家带来一款非常好用的思维导图软件--亿图思维导图,Mi ...

  7. 概率密度变换公式 雅可比矩阵_机器人雅可比矩阵的理解和常用公式

    雅可比矩阵就是一种特殊的矩阵导数 考虑一个简单的问题: .其中x是自变量,y是因变量.对两边求导可得: .这里的 表示可以使式子成立的一个和a有关的一个值. 将上面的问题拓展到多维情况,可以得到: , ...

  8. Python 小白从零开始 PyQt5 项目实战(8)汇总篇(完整例程)

    本系列面向 Python 小白,从零开始实战解说应用 QtDesigner 进行 PyQt5 的项目实战.不跳过一个细节,不漏掉一行代码,不省略一个例图. 本系列从软件安装.环境配置开始,介绍了基本应 ...

  9. Python 小白从零开始 PyQt5 项目实战(4)基本控件

    本系列面向 Python 小白,从零开始实战解说应用 QtDesigner 进行 PyQt5 的项目实战. 什么叫从零开始?从软件安装.环境配置开始.不跳过一个细节,不漏掉一行代码,不省略一个例图. ...

最新文章

  1. 【PDF下载】给专业选手的 Python 笔记
  2. 别让用户发呆——设计中的防呆策略
  3. Nhibernate中的连接超时时事务回滚引发异常的处理方法
  4. qt结构体嵌套结构体方法_9.2 C++结构体类型变量
  5. apache+mod_wsgi配置
  6. swift 二进制读写_Swift二进制搜索树
  7. 反编译,修改jar文件
  8. php个人资料表单显示,php-如何显示用户从表单构建器中选择的带...
  9. Summarize 2014 Look Ahead 2015
  10. oracle数据库查询正在执行的sql,Oracle查询正在执行的SQL语句
  11. 遇到 oracle 错误 904,EXP-00008: 遇到 Oracle 错误 904
  12. cs231n---RNN、图像字幕、注意力机制Attention、梯度消失、爆炸、LSTM
  13. 快速查询每个快递单号物流详情,支持国内常用的快递公司
  14. 计算机程序扩展名是什么,LOG文件扩展名 - 什么是.log以及如何打开? - ReviverSoft...
  15. MT4如何设置手机app通知
  16. 【面试题目】你有12个硬币,其中有一个的重量与其他的不一样,有三次使用测量平衡的机会来找出重量不同的那个。该怎么做呢?
  17. 【智能优化算法-鲸鱼算法】基于鲸鱼算法求解多目标优化问题附matlab代码(NSWOA)
  18. 经营者购买餐饮商铺需要注意些什么
  19. CheriABI简介
  20. 那些年啊,那些事——一个程序员的奋斗史 ——121

热门文章

  1. Linux系统入门学习:在Debian或Ubuntu上安装完整的内核源码
  2. smooth_L1_loss_layer.cpp:28] Check failed: bottom[0]-channels() == bottom[1]-channels() (12 vs. 84
  3. OpenCV文字绘制函数putText()的使用
  4. 2022Go安装goimports第三方库命令
  5. 力扣:12正数转罗马数字(python) 简单粗暴解决方法
  6. 多继承中构造器和析构器的调用顺序
  7. PHP全栈开发(五):PHP学习(1.基础语法)
  8. laravel 重要概念 以及实现方式
  9. 【JS】//将中文逗号转换为英文逗号
  10. 《使用云计算和大数据进行性能测试》