一.为什么要学习Excel

1.Excel的学习路径:

  • Excel首先是一个好用的工具(不因为你会Python而成为数据分析师,而是能用任何工具来解决问题)
  • 应用场景:Excel,SQL,业务(敏捷,快速,需要立即响应的需求)

Python,BI,业务,ETL (常规,频繁,可复用可工程化的需求,例如词频统计,分组聚合等)

  • 如果是一位纯新手的话

Excel函数 ————> SQL函数 ————> Python 函数

(用图形界面了解函数) (用封装好的脚本语言了解函数) (了解编程函数)

2.EXCEL常见的函数

函数分为5类:文本清洗类/关联匹配类/逻辑运算类/计算统计类/时间序列类

  • 文本清洗函数:

1bit=两种可能性,用0或1存储

1byte=8bit ,如00000001,一共有256种可能性

UTF-8:英文存储8位,中文状态下存储24位

  • 常见的文本清洗函数
  1. FIND:找出字符在字符串中的位置 =FIND("k",A1,1) k-要查找的字符串;A1被查找的字符串;1-开始位置
  2. LEFT:从文本函数的第一个字符开始取值=LEFT(A1,FIND("k",A1,1))
  3. CONCATENATE:拼接函数(输入字符串1,字符串2.....)
  4. Replece:跟ctrl+F的作用等价
  5. SUBSTITUTE:=substitute(需要替换的文本,旧文本,新文本,第N个旧文本)
  • 屏蔽手机号码的后四位:=substitute(A2,RIGHT(A2,4),"****")
  • substitute函数经常用来去掉文本之间的空格:=substitute(A1," ","")

6.trim 去除单元格前后的空格

7.len文本字符串中的字符数

  • 关联匹配类函数:

8个函数:LOOKUP/VLOOKUP/INDEX/MATCH/ROW/COLUMN/OFFSET/HYPERLINK

  • 逻辑运算函数:false/true
  • 计算统计类函数:

12个函数:SUM/SUMPRODUCT/COUNT/MAX/MIN/RANK/RAND BETWEEN/

AVERAGE/QUARTILE/STDEV/SUBTOTAL/INT/ROUND

QUARTILE:四分位数 QUARTILE($C$2:$C$11,0)求最小值、=QUARTILE($C$2:$C$11,4)求最大值,=QUARTILE($C$2:$C$11,2)为中位数

  • 时间序列函数

8个函数:Year/Month/Weekday/Weeknum/Day/Date/Now/Today

案例:

给各区域店铺进行综合评分,部分数据如下:

  1. 对脏数据进行数据清洗,异常值和缺失值进行处理
  2. 最为关键的是不同维度如何给定系数:点评反应的是店铺热度,一定程度上会影响可以下单,但需要对数据LOG处理,人均价格是降权同时也需要log处理
  3. 最后算出来的值进行归一化(X-min)/(max-min)处理

归一化:把有量纲的表达式变为无量纲表达式的方法,把数据映射到0~1范围内之内处理,把需要处理的数据经过处理后限制在你需要的范围之内,归一化有统一,同一,合一的意思。

二.SQL数据库

1.数据库:

  • 数据库是数据存储的集合,表是数据结构化的信息。
  • 列存储表中的组织信息,行存储表中的记录信息
  • 主键是表中的唯一标示,主键不具备业务意义

注:(1)表的主键不做强制要求,但建议设立

(2)主键值必须唯一

(3)每一行必须有一个主键,不可为空

(4)主键值不可被修改

(5)主键值被删除后不可重用

(6)表A的主键可以作为表B的字段,此时不受约束

  • 数据类型:文本(char)/int(整数)/ float (小数点)/date(日期)/ timestamp(精确到秒时间)

2.SQL函数

  • LOCATE:找出字符在字符串中的位置 =LOCATE("k",A1,1) k-要查找的字符串;A1被查找的字符串;1-开始位置
  • LEFT 与LOCATE结合:LEFT从文本函数的第一个字符开始取值=LEFT(A1,LOCATE("k",A1)-1)
  • RIGHT 与LOCATE结合:RIGHT从文本函数的第一个字符开始取值=LEFT(RIGHT(salary,Length(salary)-Locate('-',salary))-1)
  • CASE WHEN THEN : 数据
SelectCASE WHEN (bottom+top)/2<=10  THEN '0-10',WHEN (bottom+top)/2<=20  THEN '10-20',WHEN (bottom+top)/2<=30  THEN '20-30'ELSE '30+'END

3.SQL练习

  • 统计不同月份的下单人数
  • 统计用户三月份的回购率和复购率(回购率一段时间与下一段时间对比;复购率是一段时间内客户购买次数)
复购率:
Select count(ct),count(if(ct>1,1,null)) from (
Select uerserID,COUNT(userID) as ct from data.orderinfo
WHERE ispaid="已支付"
and month(paidtime)=3
group by userID) t回购率:

  • 统计男女用户消费频次是否有差异
  • 统计多次消费的用户,第一次和最后一次消费间隔是多少?
  • 统计不同年龄段,用户的消费金额是否有差异?

sql截去最后一位_数据技能篇(EXCEL,SQL,Python)相关推荐

  1. sql截去最后一位_sql 取最后一条记录

    展开全部 SQL Server 查询最后一条记录有两种方法,一种是使用TOP命令e68a8462616964757a686964616f31333433616165,一种是使用LIMIT命令,具体方法 ...

  2. sql截去最后一位_SQL截取最后一个由字符分隔的字符串

    SQL如果一个字符串由某个字符分隔,例如:"火锅>中餐>极品美食"."10*20*300",怎么得到字符最后一个字符串("极品美食&quo ...

  3. sql截去最后一位_SqlServer从左边 最后 中间截取字符串

    SqlServer从左边 最后 中间截取字符串(摘录)2009-06-01 15:04 已知: 字段A='F:\photo\Winter Leaves.jpg' 要求:分段截取每段字符[字段A不能为T ...

  4. 爬虫找工作要掌握什么_数据分析师要掌握SQL到什么程度?

    是新朋友吗?记得先点蓝字关注我哦- 今日课程菜单 Java全栈开发 | Web前端+H5 大数据开发 | 数据分析  人工智能+Python | 人工智能+物联网 很多人入门学习数据分析,往往第一时间 ...

  5. hive编程指南电子版_第三篇|Spark SQL编程指南

    在<第二篇|Spark Core编程指南>一文中,对Spark的核心模块进行了讲解.本文将讨论Spark的另外一个重要模块--Spark SQL,Spark SQL是在Shark的基础之上 ...

  6. sql limit不接具体数字_这21个写SQL的好习惯,你要养成呀

    前言 每一个好习惯都是一笔财富,本文分SQL后悔药, SQL性能优化,SQL规范优雅三个方向,分享写SQL的21个好习惯,谢谢阅读,加油哈~ 公众号:「捡田螺的小男孩」 1. 写完SQL先explai ...

  7. spark-sql建表语句限制_第三篇|Spark SQL编程指南

    在<第二篇|Spark Core编程指南>一文中,对Spark的核心模块进行了讲解.本文将讨论Spark的另外一个重要模块--Spark SQL,Spark SQL是在Shark的基础之上 ...

  8. hive编程指南_第三篇|Spark SQL编程指南

    在<第二篇|Spark Core编程指南>一文中,对Spark的核心模块进行了讲解.本文将讨论Spark的另外一个重要模块--Spark SQL,Spark SQL是在Shark的基础之上 ...

  9. sql python excel_数据技能篇(EXCEL,SQL,Python)

    一.为什么要学习Excel 1.Excel的学习路径:Excel首先是一个好用的工具(不因为你会Python而成为数据分析师,而是能用任何工具来解决问题) 应用场景:Excel,SQL,业务(敏捷,快 ...

最新文章

  1. AI in 美团:吃喝玩乐背后的黑科技
  2. containerd — 容器引擎
  3. python安装教程32位-python为什么要装32位的
  4. MATLAB从入门到精通-Matlab R2020b新功能 | 子标题和标题/标签对齐功能!
  5. JavaScript中的对象与函数(一)
  6. Mybatis + Mysql 插入数据时中文乱码问题
  7. java新闻爬虫_java实现简单的爬虫之今日头条
  8. 向量时钟Vector Clock in Riak
  9. TRUNCATE TABLE和PURGE_TABLE的区别
  10. [Oracle][Corruption]究竟哪些检查影响到 V$DATABASE_BLOCK_CORRUPTION
  11. Java 哪些事最困扰你?
  12. git 常用操作,撤销修改
  13. Linux中对两文件处理
  14. linux 常见开机故障解决办法
  15. 教你React Native使用fetch实现图片上传
  16. php中使用curl
  17. OpenCv特征匹配
  18. python树莓派_树莓派python
  19. 06.complement 方法
  20. 你想要的宏基因组-微生物组知识全在这(2020.7)

热门文章

  1. delphi 的插件机制与自动更新
  2. Web应用程序的开发步骤
  3. C++中数组定义及初始化
  4. ARM汇编中ldr伪指令和ldr指令(转载)
  5. 使用sqlmetal工具自动生成SQL数据库的Linq类文件
  6. 搭建顶级域名下的个人博客网站
  7. Android 自定义View自定义属性的声明
  8. ref out的用法
  9. Oracle异常汇总
  10. PyTorch系列入门到精通——autograd与逻辑回归