干货 | 50题带你入门Python数据分析(下)
25
显示列唯一值
df[''].unique() ⚠️这里显示具体的唯一值
26
显示列唯一值个数
df[''].nunique() ⚠️这里显示的是唯一值个数
27
返回列最大/小值的索引
df[''].idxmax()
df[''].idxmin()
28
返回列前几个大/小的元素值
df[''].nlargest(这里指定几个)
df[''].nsmallest(这里指定几个)
29
列的值进行截断
df[''].clip(min,max)
#这里将小于min的值变成min,max同理
30
列的值进行替换
df[''].replace("旧的","新的")
df.replace('列':""旧的","新的")
31
利用索引进行排序
df.set_index('列')
32
Pandas画折线图
df.plot(x='', y='')
plt.show()
33
Pandas画条形图
df.plot(x='', y='',kind='bar')
plt.show()
34
Pandas画水平条形图
df.plot(x='', y=['',''],kind='barh')
plt.show()
35
Pandas画散点图
df.plot(x='', y='',kind='scatter')
plt.show()
36
Pandas画饼图
df.index=[] #重新定义显示的索引
df.plot(x='', y='',kind='pie',legend=False) #设置不显示图例
plt.show()
37
Pandas画箱型图
df.plot(y='',kind='box') #箱型图非常有利于看数据分布
plt.show()
38
Pandas画直方图
df.plot(y='',kind='hist')
plt.show()
39
Pandas画多个图在同一张画布
df.plot(kind='',y=['',''],subplots=True, #多子图并存layout = (1,2), #子图排列一行二列title='',figsize(10,5))
plt.show()
40
业务指标:计算月均消费次数
这里我们以朝阳医院销售数据集为例:
月均消费次数=总消费次数 / 月份数
总消费次数:同一天内,同一个人发生的所有消费算作一次消费。这里我们根据列名(销售时间,社区卡号)结合,如果这两个列值同时相同,只保留1条,将重复的数据删除
月份数:数据已经按照销售时间进行排序,只需将最后的数据与第一条数据相减就可换算出月份数
#总消费次数计算
kpDf = salesDf.drop_duplicates(subset=['销售时间','社保卡号'])
total = kpDf.shape[0]
print('总消费次数为:',total)#月份数计算
startDay = salesDf.loc[0,'销售时间']
print('开始日期:',startDay)
endDay = salesDf.loc[salesDf.shape[0]-1,'销售时间']
print('结束日期:',endDay)
monthCount = (endDay - startDay).days//30
print('月份数:',monthCount)#业务指标:月均消费次数=总消费次数 / 月份数
kpi1 = total / monthCount
print('业务指标1:月均消费次数=',kpi1)
41
业务指标:计算月均消费金额
月均消费金额 = 总消费金额 / 月份数
totalMoney = salesDf['实收金额'].sum()
kpi2 = totalMoney / monthCount
print('业务指标2:月平均消费金额=',kpi2)
42
业务指标:计算客单价
客单价=总消费金额 / 总消费次数
kpi3 = kpi2 / kpi1
print('业务指标3:客单价=',kpi3)
下面介绍有趣且实用的分析模型
43
RFM模型
首先介绍一下什么是RFM模型:RFM模型是以用户的实际购买行为数据,将用户群体进行分类,其中
R(Recency):表示客户最近一次购买的时间距离现在有多远
F(Frequency):表示用用户在定义时间段内购买产品或服务的次数
M(Monetary):表示用户在定义时间段内购买产品或服务的金额 然后再更具R、F、M指标进行客户的细致分类:包括重要价值客户、重要发展客户、重要保持客户、重要挽留客户、一般价值客户、一般发展客户、一般保持客户、一般挽留客户等八类用户。
再根据模型提出以下问题:1、谁是你最好的客户 2、有哪些客户在流逝的边缘 3、有哪些客户能转化能为公司创造更多的价值 4、你必须保留哪些客户 5、谁是你的忠实客户 6、哪些客户有最大的转化率和可能性
可以查看我的这篇文章:
实战 | 航空公司客户价值分析-LRFCM模型
44
AARRR模型
AARRR是Acquisition、Activation、Retention、Revenue、Refer,这个五个单词的缩写,分别对应用户生命周期中的5个重要环节。
45
SWOT分析
SWOT(企业战略分析方法)指SWOT分析法。SWOT分析,即基于内外部竞争环境和竞争条件下的态势分析,就是将与研究对象密切相关的各种主要内部优势、劣势百和外部的机会和威胁等。
可以查看我的这篇文章:
产品报告|利用SWOT模型分析趣头条APP
46
STAR法则
STAR法则,即为Situation Target Action Result的缩写,具体含义是:
Situation: 事情是在什么情况下发生
Target 你是如何明确你的目标的
Action: 针对这样的情况分析,你采用了什么行动方式
Result: 结果怎样,在这样的情况下你学习到了什么
简而言之,STAR法则,就是一种讲述自己故事的方式,或者说,是一个清晰、条理的作文模板。不管是什么,合理熟练运用此法则,可以轻松的对面试官描述事物的逻辑方式,表现出自己分析阐述问题的清晰性、条理性和逻辑性。
47
HMW分析法
HMW是什么?
How Might We = 我们可以如何 = 有什么办法
找方向:HMW = 解决这个问题的方向,打开思考的困局
拓展思路:把一个小问题大幅拓展,把问题想透
头脑风暴:暂时不需要考虑具体的方案,让头脑风暴更高效
创新点:让每个吐槽都可能被变成创新点
HMW什么时候用?
头脑风暴前:解决头脑风暴效率的问题
分析用户反馈:在碰到用户反馈,马上用HMW分析
和领导PK:用HMW对付领导是一个好办法
48
六顶思考帽
推荐阅读:我听过关于“六顶思考帽”最通俗易懂的解释
49
紧急重要四象限
这对于我们平时数据分析或者安排工作是都很有帮助:
50
复利思维模型
从下面两组公式你看出了什么?
不管做什么工作,什么身份,只要你每天坚持比别人多做一点点,人生的积累将会大不同。而如果你每天都懈怠一点点,你有的也几乎会全部被剥夺。奥利给????
今天就是这些,接下来我们一起通过案例去探讨那些有趣的分析模型,敬请期待吧!欢迎在看转发,感谢您的支持❤️
???? 干货 | 50题带你入门Python数据分析(上)
(下)
我就知道你“在看”
干货 | 50题带你入门Python数据分析(下)相关推荐
- 快速入门 Python 数据分析实用指南
Python 现如今已成为数据分析和数据科学使用上的标准语言和标准平台之一.那么作为一个新手小白,该如何快速入门 Python 数据分析呢? 下面根据数据分析的一般工作流程,梳理了相关知识技能以及学习 ...
- 介绍一本零基础入门Python数据分析的书
大家好,我是 Lemon. 有不少读者在询问如何入门Python.如何入门Python数据分析,之前跟大家分享了两本零基础入门Python的书籍:<Python编程从入门到实践> 和< ...
- 十三、写了两年多Python文章的我,带你走进Python数据分析
@Author : By Runsen @Date : 2020/5/13 作者介绍:Runsen目前大三下学期,专业化学工程与工艺,大学沉迷日语,Python, Java和一系列数据分析软件.导致翘 ...
- 用几个最简单的例子带你入门 Python 爬虫
作者 | ZackSock 来源 | 新建文件夹X(ID:ZackSock) 头图 | CSDN下载自视觉中国 前言 爬虫一直是Python的一大应用场景,差不多每门语言都可以写爬虫,但是程序员们却独 ...
- 带大家读python数据分析一书(三)
带大家读python数据分析一书(三) 写在开头 今天写博客的时候才发现CSDN里面的博客模板改版了更新了一些,好像更亲和html多一些了?连换行都要用上br了,不过无所谓这不是重点,对于我开说只 ...
- 图解爬虫,用几个最简单的例子带你入门Python爬虫
一.前言 爬虫一直是Python的一大应用场景,差不多每门语言都可以写爬虫,但是程序员们却独爱Python.之所以偏爱Python就是因为她简洁的语法,我们使用Python可以很简单的写出一个爬虫程序 ...
- 推荐6本入门Python数据分析公认的必看经典教材
在当下这个数据驱动的时代,毫不夸张的说各行各业的商业决策和运营管理都离不开数据分析,因此数据分析已经成为当前每个人的必备技能和加分项.对于许多初学者来讲,想要入门Python数据分析常常不知道从何下手 ...
- 年薪百万的阿里P9 Python专家快速带你入门Python
年薪百万的阿里P9 Python专家快速带你入门Python 本文的目的是尽可能地用简洁的语言介绍 Python 编程语言,以帮助初学者能够快速入门Python.下面,让我们开始吧 什么是 Pytho ...
- 7个实战案例、24个学习视频、12G干货资料...今天带你免费入门Python数据分析!...
相信许多做数据的都有这样的经历: 你花了大半天整合了一张数据表,却因为其他部门的错误,导致表格结构全错了!于是你又要吭哧吭哧重新来过... 每次数据都重复洗一遍,还这么慢,要是有一劳永逸的方法就好了. ...
最新文章
- 我是如何设计 Upload 上传组件的
- error aborting mysql,mysql错误1067,mysql1067错误aborting
- python 会增加内存吗,在Python中增加内存限制?
- cuDNN version incompatibility: PyTorch was compiled against 7005 but linked against 6021 问题解决...
- php自定义函数数学计算,ThinkPHP自定义函数解决模板标签加减运算的方法
- VTK:隐式二次元用法实战
- java常见的时间处理工具类
- (JAVA)超大整数运算
- 巨杉mysql支持临时表_sql server用变量动态命名临时表表名
- java解析excel文件处理数字成像_Java处理Excel工具,POI解析,使用InputStream读取文件...
- 力扣206,反转链表(JavaScript)
- 1088 三人行 (20分)
- TSYS2.0对动态碎片的一点理解
- code review的一些思考
- 信息系统监理师考试知识点整理
- 如何修改文件格式(win11)
- html语言中标记h1代表什么意思,html中h1是什么意思
- Android 实现 遮罩动画效果
- 程序员如何快速了解和掌握一门新技术
- fail2ban 的使用
热门文章
- 使用小觅相机录制指定话题的数据集
- C实现最后一个枪毙谁
- pytorch_lesson16.2 架构对学习/鲁棒性的影响(VGG16复现+感受野+平移不变性)+架构对参数量的影响(1*1卷积核+分组卷积与深度分离卷积+NiN网络复现)
- VK1621/VK1622/VK1623/VK1625有什么稳定的LCD液晶显示驱动芯片支持多种封装,提供专业工程服务
- 我是如何转型走上计算机视觉OpenCV开发之路的
- 企业想自己发的文章成为爆文?教你几招助你品牌推广
- 研发组织中的“长尾类”问题如何看待和消除?
- 查阅中文字符的Unicode编码
- 快播现场拒签处罚告知书 2.6亿并非最终罚单
- 侧扫声呐的应用_适用于多模块android应用的声纳