sql截去最后一位_数据技能篇(EXCEL,SQL,Python)
一.为什么要学习Excel
1.Excel的学习路径:
- Excel首先是一个好用的工具(不因为你会Python而成为数据分析师,而是能用任何工具来解决问题)
- 应用场景:Excel,SQL,业务(敏捷,快速,需要立即响应的需求)
Python,BI,业务,ETL (常规,频繁,可复用可工程化的需求,例如词频统计,分组聚合等)
- 如果是一位纯新手的话
Excel函数 ————> SQL函数 ————> Python 函数
(用图形界面了解函数) (用封装好的脚本语言了解函数) (了解编程函数)
2.EXCEL常见的函数
函数分为5类:文本清洗类/关联匹配类/逻辑运算类/计算统计类/时间序列类
- 文本清洗函数:
1bit=两种可能性,用0或1存储
1byte=8bit ,如00000001,一共有256种可能性
UTF-8:英文存储8位,中文状态下存储24位
- 常见的文本清洗函数
- FIND:找出字符在字符串中的位置 =FIND("k",A1,1) k-要查找的字符串;A1被查找的字符串;1-开始位置
- LEFT:从文本函数的第一个字符开始取值=LEFT(A1,FIND("k",A1,1))
- CONCATENATE:拼接函数(输入字符串1,字符串2.....)
- Replece:跟ctrl+F的作用等价
- SUBSTITUTE:=substitute(需要替换的文本,旧文本,新文本,第N个旧文本)
- 屏蔽手机号码的后四位:=substitute(A2,RIGHT(A2,4),"****")
- substitute函数经常用来去掉文本之间的空格:=substitute(A1," ","")
6.trim 去除单元格前后的空格
7.len文本字符串中的字符数
- 关联匹配类函数:
8个函数:LOOKUP/VLOOKUP/INDEX/MATCH/ROW/COLUMN/OFFSET/HYPERLINK
- 逻辑运算函数:false/true
- 计算统计类函数:
12个函数:SUM/SUMPRODUCT/COUNT/MAX/MIN/RANK/RAND BETWEEN/
AVERAGE/QUARTILE/STDEV/SUBTOTAL/INT/ROUND
QUARTILE:四分位数 QUARTILE($C$2:$C$11,0)求最小值、=QUARTILE($C$2:$C$11,4)求最大值,=QUARTILE($C$2:$C$11,2)为中位数
- 时间序列函数
8个函数:Year/Month/Weekday/Weeknum/Day/Date/Now/Today
案例:
给各区域店铺进行综合评分,部分数据如下:
- 对脏数据进行数据清洗,异常值和缺失值进行处理
- 最为关键的是不同维度如何给定系数:点评反应的是店铺热度,一定程度上会影响可以下单,但需要对数据LOG处理,人均价格是降权同时也需要log处理
- 最后算出来的值进行归一化(X-min)/(max-min)处理
归一化:把有量纲的表达式变为无量纲表达式的方法,把数据映射到0~1范围内之内处理,把需要处理的数据经过处理后限制在你需要的范围之内,归一化有统一,同一,合一的意思。
二.SQL数据库
1.数据库:
- 数据库是数据存储的集合,表是数据结构化的信息。
- 列存储表中的组织信息,行存储表中的记录信息
- 主键是表中的唯一标示,主键不具备业务意义
注:(1)表的主键不做强制要求,但建议设立
(2)主键值必须唯一
(3)每一行必须有一个主键,不可为空
(4)主键值不可被修改
(5)主键值被删除后不可重用
(6)表A的主键可以作为表B的字段,此时不受约束
- 数据类型:文本(char)/int(整数)/ float (小数点)/date(日期)/ timestamp(精确到秒时间)
2.SQL函数
- LOCATE:找出字符在字符串中的位置 =LOCATE("k",A1,1) k-要查找的字符串;A1被查找的字符串;1-开始位置
- LEFT 与LOCATE结合:LEFT从文本函数的第一个字符开始取值=LEFT(A1,LOCATE("k",A1)-1)
- RIGHT 与LOCATE结合:RIGHT从文本函数的第一个字符开始取值=LEFT(RIGHT(salary,Length(salary)-Locate('-',salary))-1)
- CASE WHEN THEN : 数据
SelectCASE WHEN (bottom+top)/2<=10 THEN '0-10',WHEN (bottom+top)/2<=20 THEN '10-20',WHEN (bottom+top)/2<=30 THEN '20-30'ELSE '30+'END
3.SQL练习
- 统计不同月份的下单人数
- 统计用户三月份的回购率和复购率(回购率一段时间与下一段时间对比;复购率是一段时间内客户购买次数)
复购率:
Select count(ct),count(if(ct>1,1,null)) from (
Select uerserID,COUNT(userID) as ct from data.orderinfo
WHERE ispaid="已支付"
and month(paidtime)=3
group by userID) t回购率:
- 统计男女用户消费频次是否有差异
- 统计多次消费的用户,第一次和最后一次消费间隔是多少?
- 统计不同年龄段,用户的消费金额是否有差异?
sql截去最后一位_数据技能篇(EXCEL,SQL,Python)相关推荐
- sql截去最后一位_sql 取最后一条记录
展开全部 SQL Server 查询最后一条记录有两种方法,一种是使用TOP命令e68a8462616964757a686964616f31333433616165,一种是使用LIMIT命令,具体方法 ...
- sql截去最后一位_SQL截取最后一个由字符分隔的字符串
SQL如果一个字符串由某个字符分隔,例如:"火锅>中餐>极品美食"."10*20*300",怎么得到字符最后一个字符串("极品美食&quo ...
- sql截去最后一位_SqlServer从左边 最后 中间截取字符串
SqlServer从左边 最后 中间截取字符串(摘录)2009-06-01 15:04 已知: 字段A='F:\photo\Winter Leaves.jpg' 要求:分段截取每段字符[字段A不能为T ...
- 爬虫找工作要掌握什么_数据分析师要掌握SQL到什么程度?
是新朋友吗?记得先点蓝字关注我哦- 今日课程菜单 Java全栈开发 | Web前端+H5 大数据开发 | 数据分析 人工智能+Python | 人工智能+物联网 很多人入门学习数据分析,往往第一时间 ...
- hive编程指南电子版_第三篇|Spark SQL编程指南
在<第二篇|Spark Core编程指南>一文中,对Spark的核心模块进行了讲解.本文将讨论Spark的另外一个重要模块--Spark SQL,Spark SQL是在Shark的基础之上 ...
- sql limit不接具体数字_这21个写SQL的好习惯,你要养成呀
前言 每一个好习惯都是一笔财富,本文分SQL后悔药, SQL性能优化,SQL规范优雅三个方向,分享写SQL的21个好习惯,谢谢阅读,加油哈~ 公众号:「捡田螺的小男孩」 1. 写完SQL先explai ...
- spark-sql建表语句限制_第三篇|Spark SQL编程指南
在<第二篇|Spark Core编程指南>一文中,对Spark的核心模块进行了讲解.本文将讨论Spark的另外一个重要模块--Spark SQL,Spark SQL是在Shark的基础之上 ...
- hive编程指南_第三篇|Spark SQL编程指南
在<第二篇|Spark Core编程指南>一文中,对Spark的核心模块进行了讲解.本文将讨论Spark的另外一个重要模块--Spark SQL,Spark SQL是在Shark的基础之上 ...
- sql python excel_数据技能篇(EXCEL,SQL,Python)
一.为什么要学习Excel 1.Excel的学习路径:Excel首先是一个好用的工具(不因为你会Python而成为数据分析师,而是能用任何工具来解决问题) 应用场景:Excel,SQL,业务(敏捷,快 ...
最新文章
- AI in 美团:吃喝玩乐背后的黑科技
- containerd — 容器引擎
- python安装教程32位-python为什么要装32位的
- MATLAB从入门到精通-Matlab R2020b新功能 | 子标题和标题/标签对齐功能!
- JavaScript中的对象与函数(一)
- Mybatis + Mysql 插入数据时中文乱码问题
- java新闻爬虫_java实现简单的爬虫之今日头条
- 向量时钟Vector Clock in Riak
- TRUNCATE TABLE和PURGE_TABLE的区别
- [Oracle][Corruption]究竟哪些检查影响到 V$DATABASE_BLOCK_CORRUPTION
- Java 哪些事最困扰你?
- git 常用操作,撤销修改
- Linux中对两文件处理
- linux 常见开机故障解决办法
- 教你React Native使用fetch实现图片上传
- php中使用curl
- OpenCv特征匹配
- python树莓派_树莓派python
- 06.complement 方法
- 你想要的宏基因组-微生物组知识全在这(2020.7)