200724 EXCEL
来源:七周成为数据分析师 b站视频
仅整理笔记
一、Excel的常见函数
(一)背景知识
1 bit 比特(最小储存单位)= 两种可能性,用0或1存储在电脑里
1 byte 字节 = 8 bit,如00000001,一共有2^8 = 256种可能性
英文+数字+符号:ASCII
汉字远远大于256种可能性,于是用2 byte组合表示,叫做GB2312
繁体字:GBK
少数民族的文字:于是又多了GB18030
万国码:unicode
(二)常见的文本清洗函数
1. Find
FIND(find_text,within_text,start_num)
Find(要查找的文本,文本所在的单元格,从第几个字符开始查找[可选,省略默认为1,从第一个开始查找])
- Find函数进行定位时,总是从指定位置开始,返回找到的第一个匹配字符串的位置,而不管其后是否还有相匹配的字符串。
- 区分大小写
- 一般和left、right函数连用
- 如果start_num大于1,不是从第一个数字开始查找,但还是会计算跳过的字符,从文本开头计算
2. Left & Right & Mid
left(text,num_chars)
LEFT(指截取的单元格内容,从左开始截取的字符数)
RIGHT(指截取的单元格内容,从右开始截取的字符数)MID(text, start_num, num_chars)
是从text所示的字符串中,从左边开始数,第start_num个位置开始,截取num_chars个的字符。
首先,打开DataAnalyst.csv表格,
(1)“salary”列,提取出工资的上下限
最开始,可能想到的方法是Left、Right函数去分别提取,但问题是有的工资下限是一位数,有的是两位数,并不方便;首先用替换把所有的“K”都改成“k”,然后用find函数去找第一个“k”出现的位置,再用left提取。上限同理,但注意得到的结果包含单位“k”,此时如果用替换操作,要记得先选择性粘贴——值,再替换,否则存的是公式,并不能达到替代k的效果。
3. Concatenate 合并多个文本
4. Replace & Substitute
REPLACE(old_text,start_num,num_chars,new_text)
REPLACE(要替换的文本区域,开始替换的字符串位置,要替换的字数,要替换的文本内容)substitute(text,old_text,new_text,[instance_num])
substitute(单元格,被替换的字符串,新字符串,指定替换第几个)
5. Text 可以根据指定的数字格式将数值转换成文本
TEXT(value,format_text)
Value 为数值、计算结果为数字值的公式,或对包含数字值的单元格的引用。
Format_text 为“单元格格式”对话框中“数字”选项卡上“分类”框中的文本形式的数字格式。
6. Trim(text) 去空格
把单元格内容前后的空格去掉,但并不去除字符之间的空格
7. Len()
- 空格将作为字符进行计数
- 返回字符串的长度
(三)关联匹配函数
1. Lookup
LOOKUP(lookup_value,lookup_vector,[result_vector])
e.g. LOOKUP(@P:P,{0,5,10,20},{1,2,3,4})
如果P列在0-5,返回1
2. Vlookup
VLOOKUP(Lookup_value要查找的值,Table_array在哪里找这个值,Col_index_num找到后返回查找区域的哪一列,[Range_lookup]匹配程度)
TRUE 近似匹配
FALSE 精确匹配
3. Index,Match,Offset
常用的index用法是:
INDEX(array单元格区域或数组常量,row_num,[column_num])
- 返回表或区域中的值
- 基本不单独使用,一般和Match或Offset组合使用
Match(lookup_value,lookup_array,[match_type])
- match_type可选
- 0,表示MATCH 函数会查找等于 lookup_value 的第一个值。无排序要求。
- -1,表示MATCH 函数会查找大于或等于 lookup_value 的最小值。lookup_array 参数中的值必须按降序排列。
- 1(默认),表示MATCH 函数会查找小于或等于 lookup_value 的最大值。lookup_array 参数中的值必须按升序排列,
- Index嵌套match = vlookup
OFFSET(reference以此为基准进行偏移,rows,cols,[height返回区域的行数],[width返回区域的列数])
rows&cols:正数表示向下向右偏移,负数表示向上向左偏移。
4. Row() & Column() 当前第几行第几列
5. Hyperlink 超链接
(四)逻辑运算函数
And
Or
IF
Is
Not
False True
(五)计算统计函数
Sum
Sumproduct:是在给定的几组数组中,将数组间对应的元素相乘,并返回乘积之和。
Count:COUNT函数只能对数字数据进行统计,对于空单元格、逻辑值或者文本数据将被忽略
Max
Min
Rank
Rand():0-1之间的随机数
Randbetween(bottom,top):输入的两个数之间的随机数
Averagea
Quartile(array,quant):quant = 0 -> min ; quant = 4 -> max
Stdev标准差
SUBTOTAL(function_num,ref1,[ref2],…)分类汇总
- function_num 要调用哪个函数
- ref1 汇总区域
Int 向下取整
Round 四舍五入
Countif(s)等等 统计和if结合的函数
(六)时间序列函数
Year
Month
Day
Weekday:参数2是选择星期一开始还是星期日开始
Weeknum:是一年中的第几周
DATE(year,month,day):其作用是将提取的数字变为日期格式
Now
Today
二、Excel的常见技巧
数据 —— 分列
开始 —— 条件格式 —— 数据条/色阶/图标集
插入 —— 数据透视表 —— 切片(对生成的数据透视表双击变成新表 或者 插入切片器插入图片,图片会跟着变化
视图 —— 冻结行/列
公式 —— 定义名称(根据所选择的数据创建别名,之后想使用就直接使用别名
数据 —— 删除重复值
数据 —— 数据验证 —— 列表 —— 设计对应的源约束只能选择哪些选项(结果是会出现下拉箭头
三、Excel的快捷键
Ctrl+方向键
Ctrl+Shift +方向键
Ctrl+空格键
Shift+空格键
Ctrl+A 选择整张表
Alt+Enter 换行
四、实战 —— 餐食数据
(记得复制一份数据,存放原始数据)
现在你有一份的餐食数据,我想通过excel知道
全国点评数最多的饭店是哪家?
(1)排序
(2)max+match+index函数哪个城市的饭店人均口味最好?
最好复制数据透视表的结果再进行排序。哪个类型的餐饮评价最好?
同数据透视表类型为川菜的店中,有多少个带「辣」字,又有多少个带「麻」字?
视频4:20口味、环境、服务,三个评价都在8.0以上的饭店有几家?它们在哪个城市的占比最多?
把筛选的结果复制到新表,然后进行数据透视上海地区中,各个类型饭店服务前五名?
视频9:20没有评价的饭店有几家?
筛选或者用count函数(不计算空值,反减即可将人均价格划分成0~50,50~100,100~150,150~200,200+这几个档次,各个城市分别有几家?其中占比又是多少?
match+数据透视表将点评、人均、口味、环境、服务这几个指标加工出一个综合评价系数,并且计算哪十家店是最好的(开放题)。
对所有地区的日本料理,做一次描述性分析(开放题)
200724 EXCEL相关推荐
- Excel如何设置单元格行高,办公入门
在使用Excel做设计文档时,遇到一个问题,一组报文放入一个单元格,但因为只显示一行,我的信息就成了下面这个样子
- java操作跨页的word cell,“excle如何打印不出现断行“EXCEL中,如何不跨页断行打印或显示,谢谢...
EXCEL中,如何不跨页断行打印或显示,谢谢 打印预览--页面设置--工作表--网格线(打勾) 试试! java导入excel 判断当前行有没有数据 工作中用到入excel一个方法,你还可以通过一些插 ...
- Excel+bat批量更改文件名
操作环境:Windows10 软件版本:Office2019 1.Win+R -> cmd中进入要改名文件夹 例如进入C盘根文件夹输入C: 2.生成文件名Excel表: 特定后缀文件 dir / ...
- 将文件名和文件修改时间批量输出至Excel中
操作系统:Windows10 软件版本:Office2019 1.打开一个空的Excel表格,Alt+F11,双击Sheet1进入代码编辑,输入代码如下: Sub main()ff = Dir(&qu ...
- LeetCode简单题之Excel 表中某个范围内的单元格
题目 Excel 表中的一个单元格 (r, c) 会以字符串 "" 的形式进行表示,其中: 即单元格的列号 c .用英文字母表中的 字母 标识. 例如,第 1 列用 'A' 表示, ...
- LeetCode简单题之Excel表列名称
题目 给你一个整数 columnNumber ,返回它在 Excel 表中相对应的列名称. 例如: A -> 1 B -> 2 C -> 3 - Z -> 26 AA -> ...
- Apache POI:解决数据库和Excel之间相互转换的烦恼~
目录 引言 一.简介 二.POI-Excel 写 1.创建项目 2.引入依赖 3.步骤 1. 创建工作簿 2. 创建工作表 3. 创建行 4. 创建单元格 5. 单元格中填入数据 6. 通过IO流生成 ...
- Python:数据导入、爬虫:csv,excel,sql,html,txt
''' 来源:天善智能韦玮老师课堂笔记 作者:Dust 数据导入 ·导入csv数据csv是一种常见的数据存储格式,基本上我们遇到的数据都可以转为这种存储格式.在Python数据分析中,我们可以使用pa ...
- excel 解析 java_java解析Excel(xls、xlsx两种格式)
https://www.cnblogs.com/hhhshct/p/7255915.html ***************************************************** ...
- xlrd.biffh.XLRDError: Excel xlsx file; not supported
具体报错如下: 问题发生的原因就是使用pandas 读取excel 的时候发生的问题,问题的原因是xlrd 的版本升级到2.0.1 的原因, 所以把xlrd 版本降低到1.2.0 问题处理了
最新文章
- 安卓高手之路 图形系统(4 Measure的算法)
- poj2140---herd sums
- Qt基于TCP网络程序发包封包抽象
- Java Integer类numberOfLeadingZeros()方法的示例
- 专刊文章 - Web UI框架引领J2EE新开发模式(代码生成器+手工merge半智能开发)
- 华为笔试题-磁盘容量排序
- C# 类型参数的约束
- 融合智能将成时代方舟?中科创达技术大会向未来答疑
- atitit.软件开发GUI 布局管理优缺点总结java swing wpf web html c++ qt php asp.net winform
- 面试后要请你吃饭_面试官发出这5个信号,暗示你面试基本成功了,请做好准备!...
- GOM登录器技术研究,闪退、掉线的原因分析和解决
- 系统架构师(1)计算机组成与结构
- (01)开发环境准备
- 工具类|Java生成商城常用的核销码,长度12位~
- 初识Continuation
- php 字体如何加粗和调大小,如何在PHP中使文本变为粗体?
- Matplotlib多子图绘图后保存单个子图
- 抢跑AT拿到消费金融牌照后,度小满能否走过“J型曲线”拐点?
- web前端学习(四):基于koa的EggJs框架,优雅而又完美的Nodejs框架
- linux系统如何安装到u盘,linux系统安装图解教程及卸载修复