python 频数统计_日常答疑:Python实现分类频数统计
原标题:日常答疑:Python实现分类频数统计
点击上图,查看教学大纲
问题
群友提问:求每组数据中每个元素重复的个数,用什么函数?
严小样儿:安排!
咋一看,我觉得他问的我很懵B~于是,和他要了份数据,瞬间清楚了很多!
所以,需求就是求手机号前7位重复个数,安排!
安排一、预览数据
df = pd.read_excel( r'C:/Users/Administrator/Desktop/新建 Microsoft Excel 工作表(3).xlsx')
print(df.head,end = 'nn')
df.info
预览数据发现,数据格式不正确,需要先进行格式转换,以及防止隐私泄露,我们用一定的方法进行脱敏处理。
df= df.iloc[:,: 3].astype(str)
print(df.head,end = 'nn')
df. info
# 方法一
df[ '手机号'] = df[ '手机号'].str.split( '.',expand = True)[ 0]
df[ '手机号'] = df[ '手机号'].apply(lambda x:x[: -3]+ '***')
# 方法二
df[ '手机号前7位'] = df[ '手机号前7位'].str.replace( '.0', '')
df.tail
二、删除无效值
idx= df[df[ '手机号']== '***'].index
df.drop(idx,inplace = True)
df.head
接下来,进行统计手机号前7位重复个数。
n= df[ '手机号前7位'].value_counts
df[ '手机号前7位重复个数'] = df[ '手机号前7位'].map(n)
df.tail
当我满心欢喜地告诉他答案时候,他说不对啊!!!不同ID下,要分别统计,也就是说要看每一个ID下手机号前7位重复个数。于是,接着修改。
三、正确答案
# 化整为零
ID = df[ 'ID'].unique
result = []
fori in ID:
df1 = df[df[ 'ID']==i]. copy
n = df1[ '手机号前7位'].value_counts
df1[ '手机号前7位重复个数'] = df1[ '手机号前7位']. map(n)
result. append(df1)
r = pd.concat(result)
r.sample( 10)
这一次,他没有再说什么!!嘻嘻嘻,为我的机智点赞~
不过,我觉得这个方法也许不是太好吧。但是,有没有更好的方法呢?
欢迎大家和我交流一下,感谢~
更多精彩
点击上图查看教学大纲返回搜狐,查看更多
责任编辑:
python 频数统计_日常答疑:Python实现分类频数统计相关推荐
- python excel对比_日常使用————python对比两个excel表中的数据
现在有两个相同的数据集的结构,把80年和2000年两个文件夹,文件名是一样的,但文件数据是不一致的80年xls格式存储,2000年使用xlrd读取数据存储在xlsx格式,使用openpyxl读取数据, ...
- oracle 查重复_日常答疑|MySQL删除重复数据踩过得坑
问题 群友提问:MySQL这样删除重复数据为啥不成功呢? 严小样儿:安排! 咋一看,大家都说where子句里面应该使用极值函数,加个max就对了,这么简单! # 大家想象中这样写是对的,其实仍然是错的 ...
- mysql 删除重复数据_日常答疑|MySQL删除重复数据踩过得坑
问题 群友提问:MySQL这样删除重复数据为啥不成功呢? 严小样儿:安排! 咋一看,大家都说where子句里面应该使用极值函数,加个max就对了,这么简单! # 大家想象中这样写是对的,其实仍然是错的 ...
- python优化网站_[练习] 用PYTHON来优化网站中的图片
我到公司以来,第一次加班,哇,加一晚上加一上午,现在还没下班的迹象,555,困. 对于网站中的一些关键的页面,多重缓存.静态化.程序代码优化--之外,为了提高用户打开页面的速度,图片是必须要优化的. ...
- python数据结构编程_写给Python编程高手之 数据结构
python视频教程栏目介绍Python编程需要注意的关键点. 如何在列表,字典,集合中根据条件筛选数据 案例:如何在下列列表data中筛选出大于0的数data = [1, -1, 2, 3, 4, ...
- python编写函数_如何用Python编写自己喜欢的R函数
python编写函数 数据科学和机器学习的伟大现代斗争之一是" Python vs. R". 毫无疑问,近年来两者都已经取得了巨大的发展,成为数据科学,预测分析和机器学习的顶级编程 ...
- 网易图灵学院python公开课_图灵学院 Python全系列教程全栈工程师 python视频教程下载...
大家怎么说? 老师很好,我认为,若想学好python,应该多练.多想.多看.学习资料不能仅限于老师给定的这些内容,这些毕竟是入门资料 老师讲的真不错,对于我们这种小白来说 也比较容易懂,虽然有些时候自 ...
- python提取句子_科学网—Python提取句子 - 吕波的博文
将一段话中的句子分离出来不是一件容易的事.因为句子的开头和结尾并不是很规则,而且句子内部会出现句号.这使得通过单一的正则表达式分离句子是不可能的.有时你能成功,但大多数时候你会出错.这里我们用nltk ...
- 文科生自学python要多久_怎么自学python,大概要多久?
都让开!本人文科生,自学Python 2年半,作为一个曾经完全0基础,啥都不懂纯靠自学学会python的文科生,有一些不成熟的小建议可以分享一下. 首先不要觉着编程难,只要你认识26个英文字母,有一点 ...
最新文章
- hexo部署在Github-Page流程
- JS 加强篇!推荐 10 个好用的 TypeScript 的开源项目 YYDS !
- 28个经过重新设计的著名博客案例
- 通讯录通过id找邮箱和手机
- 整合Swagger接口文档
- 智能门锁主要有哪些优势,具体是怎么分类的?
- 基于SSM实现的超市管理系统
- Alictf2014 Writeup
- MySQL查询不同年份母亲节_不同国家的母亲节发展故事
- MarkDownPad2实用教程及MarkDown常用语法
- Android各种模拟器使用笔记
- ASBR(自治系统边界路由器)
- CSDN阅读全文自动展开插件,安排上!
- Linux的pcie模拟网卡,Qemu虚拟机pci设备透传——网卡
- 挣五千花一万,大气者成大器
- jquery、js去除浏览器(ff、ie)缓存问题
- 排序算法图解(四):希尔排序
- Yii1.1应用升级到Yii2.0的一些注意点
- 网站上面无法显示woff、svg格式字体
- Android JNI开发