数据导入
1.文本导入:数据-文本-语言-格式调整-Tab-分隔符(选择)-设置格式-完成
2.数据库导入:Access-数据透视表
3.网站导入:网站-网址粘贴–选择导入数据(黄色+)-鼠标右键-刷新/属性,刷新频率
数据清洗
重复数据处理
1.数据透视表:推荐使用方法,唯一值,重复次数也可知
选中区域-插入-数据透视表-行标签(唯一值)-汇总(计数,重复次数)
2.菜单删除法:只能得到结果,筛选条件不同,效果不同
选中区域-数据选项卡-数据工具-删除重复项
3.条件格式标记:只能得到重复值,无法得知重复次数和去重结果
选中区域-开始选项卡-条件格式-重复值
4.高级筛选:只能得到去重结果,不知重复几次
数据选项卡-排序和筛选-高级-选择不重复记录
5.函数法:countif 重复值重复几次,无去重结果
函数用法:=countif(range,criteria)
参数range 表示条件区域——对单元格进行计数的区域。
参数criteria 表示条件——条件的形式可以是数字、表达式或文本,甚至可以使用通配符。

合并单元格数据处理
取消单元格合并,并自动填充
定位条件:Ctrl +G/ F5 ,定位条件为空值
自动填充: = ↑ Ctrl Enter

空格数据处理
a.查找替换 : Ctrl + H
b.函数法 : trim函数 用法:= trim(目标单元格)
(可搭配VLOOKUP一起使用,当关键字段有空格时,VLOOKUP不能正常使用,应先用trim函数处理)

数据合并
字段合并:将某几个字段合成一个新字段
函数法:concatenate 或 &
用法:=concatenate(text1, [text2], …)
text1,text2可以是文本或者数值,项与项之间必须用逗号隔开。
&用法:目标单元格1 &目标单元格2 例:=A1&B1
注:
文本型数据(靠左排列) 无法计算(中间需要添加”-“)或 用&字符合并
数值型数据(靠右排列) 可以直接计算

字段匹配:将原数据表没有的,但其他数据表中有的字段,通过共有的关键字段进行一一对应。

单条件:VLOOKUP(精确匹配)/ index+match 组合函数.
用法:=VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)
1、lookup_value-判断的条件(索引列)
2、table_array-跟踪数据的区域(以索引列到目标列的之间范围)
3、col_index_num-返回第几列的数据
4、range_lookup是否精确匹配(0/1)
注:目标列一定要在索引列之后,且跟踪数据区域要以索引列开头;如果查询列在索引列后,要么改动数据使之前移,要么使用index+match组合。

用法:
MATCH函数(返回指定内容所在的位置)
=MATCH(lookup-value,lookup-array,match-type)
1.lookup-value:表示要在区域或数组中查找的值,可以是直接输入的数组或单元格引用。
2.lookup-array:表示可能包含所要查找的数值的连续单元格区域,应为数组或数组引用。
3.match-type:表示查找方式,用于指定精确查找(查找区域无序排列)或模糊查找(查找区域升序排列)。取值为-1、1、0 。其中0为精确查找。

INDEX函数(返回制定位置中的内容)
= INDEX(array,row-num,column-num)
1.array:要返回值的单元格区域或数组。
2.row-num:返回值所在的行号。
3. column-num:返回值所在的列号。

组合:=INDEX(C:C,MATCH(B1,A:A,0))
优点:查询效果与VLOOKUP一样,且不必查询列在索引列之后。

多条件:SUMPRODUCT数组函数 、SUMIFS函数、高级筛选法.
SUMPRODUCT 优点:自动更新,数据量大,打开文件计算慢 缺点:仅支持数值型匹配结果,不支持文本。
SUMIFS 优点:比上述函数简单,自动更新,数据量大,打开文件计算慢 缺点:仅支持数值型匹配结果,不支持文本。
高级筛选法​​ 优点:简单方便、快捷、支持文本 缺点:手动更新。

记录合并:将具有共同数据字段结构但记录信息不同的数据表合并在一张数据表中
数据抽取:保留原数据表中某些字段记录信息形成新字段新纪录
字段拆分
a.菜单法 数据选项卡-分列
数据-分列-选择位置-设置单元格-设置忽略列 (可完成只提取目标字段,保留原始字段,截取某一字段中的部分信息)
b.函数法(Mid,left,right)

数据计算
简单计算:+ - * / 直接在单元格内编写公式即可。

函数运算
日期运算:函数法
NETWORKDAYS(B2,C2) B2到C2有多少个工作日
NETWORKDAYS(B2,C2,$G 2 : 2: 2:H$2) B2到C2,扣除节假日有多少个工作日
NETWORKDAYS.INTL(B2,C2,11) 每周单休有多少个工作日
WORKDAY(C2,3) C2日期3个工作日后是哪天
DATEDIF (起始日期,结束日期,日期格式参数) 日期格式参数:Y-年 M-月 D-日 在单元格内输入公式“=DATEDIF(B2,C2,“Y”)" 注意:公式只能手动输入,公式标点都是英文状态下输入。

数据标准化
作用:将数据按比例缩放,使之落入一个特定区间。功能:消除变量间的量跟关系,不同单位,从而使得数据具有可比性。
常用数据标准化方法为0-1标准化 :X*=(X-MIN)/(MAX-MIN)
=C2-MIN($C 2 : 2: 2:C 14 ) / M A X ( 14) / MAX( 14)/MAX(C 2 : 2: 2:C 14 ) − M I N ( 14)-MIN( 14)−MIN(C 2 : 2: 2:C$14)

数据分组
a.IF数据分组: 判断条件,满足条件结果,不满足函数结果。 缺点:有层数限制,对逻辑思维要求高,易出错且麻烦。
b.VLOOKUP(模糊匹配) 从右往左找用IF{1,0}实现 实现左开右闭区间,根据自己的数据特征,把数据调到一个根本不可能出现的值,比如20.000000000001.

数据转换:数据行列转置 菜单法-选择性粘贴

数据类型
1.文本-数值 选择性粘贴-运算 X1或+0,运算 智能标记-转换为数字 选中数据后出现黄色叹号标记 转数字 数据-分列 第三步选数字
2.数值-文本 数据-分列 第三步 文本 TEXT函数 插入函数 第一个参数A2单元格,第二个参数数字显示位数 =TEXT(A2/10000,“0.0万”)
3.数值-日期 设置单元格格式-日期 数据分列-日期
4.数据转换 :二维转一维 数据透视表法:多重合并计算(ALT+D+P) 调出向导,多重合并计算数据区域,下一步,下一步,选择二维表,添加,双击透视表最后一个格。

数据分析(数据透视表)
对比分析 : 日期分组 、环比分析 、同比分析
结构分析 :定性分组(事物属性分析)、占比分析
分布分析 :定量分组
交叉分析 :(2个或2个以上分组变量关系)
矩阵分析 :(根据事物的两个重要属性,进行关联分析,找方法)
多表关联分析 : 将数据表添加至“数据模型”中,插入数据透视表,建立数据表之间的关系。

RFM分析:根据客户活跃程度和交易金额贡献,进行客户价值细分的一种方法。 指标 R 近度 最近一次购买时间间隔 数值越大,表示客户越久未发生交易 F频度 最近一段时间内购买次数 数值越大,表示客户交易越频繁 M额度 最近一段时间内购买金额 数值越大,表示客户价值越高。

快捷键
Ctrl + shift + 方向键 快速选中方向键的区域表格
Alt + enter 换行符快捷键
Alt + = 自动求和
Ctrl + 1 单元格格式对话框

小技巧
a.开始 填充 序列 可完成对数字日期工作日等快速填充
b.以文本形式输入数据 :半角 单引号+数据(与短日期形式相同的数据 应以文本形式输入)
c.快速显示日期是周几,可采用复制一列日期后,调整日期格式,星期显示
d.常用单元格设置:千 0,k 万 0!.0,万
e.数据有效性 数据验证 可以规范数据的填写

谷歌表格最常用的函数
IMPORTRANGE函数
作用:从指定的电子表格中导入相应范围的单元格。
语法:IMPORTRANGE( 谷歌表格地址 , “[表单名!]范围” )
=IMPORTRANGE("http网址,“表单名!引用范围”)

Query函数
作用:Google query语法类似于SQL,可以便捷的更换数据列的位置、按需求聚合数据。
语法:=Query(‘表单名’!引用范围,“查询语句”)
=Query(‘测试表格’!A:Z,“select A,B,D,F, limit 1000”)
查询语句:类似SQL语句。

数据分析工具篇---Excel相关推荐

  1. 谁说菜鸟不会数据分析python篇下载_谁说菜鸟不会数据分析(工具篇) 张文霖 中文PDF影印版[36.4MB]...

    谁说菜鸟不会数据分析(工具篇)张文霖 中文PDF影印版[36.4MB] 作者: 张文霖 等 图书分类: 软件 资源格式: PDF 版本: 影印版 出版社: 电子工业出版社 书号: 9787121204 ...

  2. 数据分析工具篇——数据读写

    数据分析的本质是为了解决问题,以逻辑梳理为主,分析人员会将大部分精力集中在问题拆解.思路透视上面,技术上的消耗总希望越少越好,而且分析的过程往往存在比较频繁的沟通交互,几乎没有时间百度技术细节. 因此 ...

  3. hive substr函数_数据分析工具篇——HQL函数及逻辑

    本篇文章我们梳理一下hive常用的函数,对于hive而言,常用的函数并不是特别多,往往记住关键几个,就可以解决80%的问题,这也是大家喜欢hive的原因,那么,常用的函数有哪些呢? 时间函数 1)时间 ...

  4. 数据分析工具篇——HQL原理及函数逻辑

    HQL原理及优化 HQL是数据分析过程中的必备技能,随着数据量增加,这一技能越来越重要,熟练应用的同时会带来效率的问题,动辄十几亿的数据量如果处理不完善的话有可能导致一个作业运行几个小时,更严重的还有 ...

  5. 数据分析工具篇pyspark应用详解——Pyspark实现PCA主成分

    pyspark不是所有的代码都在spark环境应用,可以将一些主要的运算单元切到spark环境运算完成,然后输出运算结果到本地,最后在本地运行一些简单的数据处理逻辑. pyspark主要的功能为: 1 ...

  6. Excel VS BI,谁才是真正的大数据分析工具?

    有人说,Excel能聚合运算,能分析,能做数据分析报表.而BI数据分析工具,看上去也就是做出来的报表更好看一些.事实真的是这样吗?当然不是.外行人看热闹,内行人看门道,BI数据分析工具比起Excel更 ...

  7. 哪些情况需用到数据分析工具

    在每个人的日常工作和生活中,最常用的数据分析工具是excel.实际上,对于那些专门从事数据分析的人来说,除了excel之外,数据分析工具还有许多更专业的软件. 数据存储层:Access,SQL Ser ...

  8. 深度讲述6款 “数据分析” 工具,告诉你数据分析应该学这个!

    "数据分析"可谓是当今社会一个超级火爆的岗位,不论是科班的,还是非科班的,都想从事这个行业,毕竟都觉得这个行业赚钱多嘛. "数据分析"大致可以分为业务和技术两个 ...

  9. 对比6款 “数据分析” 工具,学什么,一目了然!

    "数据分析" 可谓是当今社会一个超级火爆的岗位,不论是科班的,还是非科班的,都想从事这个行业,毕竟都觉得这个行业赚钱多嘛. "数据分析" 大致可以分为业务和技术 ...

最新文章

  1. AI 语言模型真的是越大越好吗?这个模型优于 Gopher
  2. HTTP Host 头攻击,是什么鬼?
  3. Windows cmd命令反斜杠问题
  4. linux下创建文件没有权限,分享一个Linux无法创建文件夹,但是目录权限却显示正常的问题和解决...
  5. Java面试题 synchronized底层实现原理?它与lock相比有什么优缺点?
  6. 大型分布式存储方案MinIO介绍,看完你就懂了!
  7. shell下利用运算方式编写倒计时脚本
  8. 看到抖音上 Python 工程师晒的工资条,我沉默了.....
  9. Java Queue 使用总结
  10. 机房(厂房)温度环境监控系统
  11. python turtle画阴阳_Python turtle绘制阴阳太极图代码解析
  12. 怎么查二手华为手机价格
  13. 解析博图数据块(昆仑通态触摸屏自动命名)
  14. 【渝粤教育】电大中专沟通技巧_1作业 题库
  15. python模块化 面向对象,Python学习记录4-面向对象,,OOP思想以模块化思
  16. 支付宝系统繁忙,请稍后再试的解决
  17. java 翻译 go语言_【翻译】go是面向对象语言吗?
  18. mysql 正序_请问mysql 中 怎么实现这种排序,按照状态排序正序,再按照开始时间排序正序,...
  19. 《本质思考 · 从底层思维构建解决问题的支点》读书笔记分享
  20. HTML5期末大作业:节日网站设计——中国传统节日春节 html+css

热门文章

  1. bzoj 4451: [Cerc2015]Frightful Formula 数学+排列组合
  2. python bisect_Python实现二分查找与bisect模块详解
  3. PPT也能制作滚动字幕,原来制作滚动字幕效果这么简单
  4. 【LastPass】chrome谷歌浏览器记录密码工具
  5. Asp.Net实现增删改以及分页例子一
  6. 计算机二级vf笔试题库,计算机二级VF笔试题库..doc
  7. SpringCloud+Vue在线教育网站——整合Gateway网关
  8. 应用程序无法正常启动(0xc0000022)。请单击” 确定“关闭应用程序。
  9. 岑溪洁净实验室设计布局规划总结
  10. 送书啦~《Android App开发进阶与项目实战》