原标题:日常答疑:Python实现分类频数统计

点击上图,查看教学大纲

问题

群友提问:求每组数据中每个元素重复的个数,用什么函数?

严小样儿:安排!

咋一看,我觉得他问的我很懵B~于是,和他要了份数据,瞬间清楚了很多!

所以,需求就是求手机号前7位重复个数,安排!

安排一、预览数据

df = pd.read_excel( r'C:/Users/Administrator/Desktop/新建 Microsoft Excel 工作表(3).xlsx')

print(df.head,end = 'nn')

df.info

预览数据发现,数据格式不正确,需要先进行格式转换,以及防止隐私泄露,我们用一定的方法进行脱敏处理。

df= df.iloc[:,: 3].astype(str)

print(df.head,end = 'nn')

df. info

# 方法一

df[ '手机号'] = df[ '手机号'].str.split( '.',expand = True)[ 0]

df[ '手机号'] = df[ '手机号'].apply(lambda x:x[: -3]+ '***')

# 方法二

df[ '手机号前7位'] = df[ '手机号前7位'].str.replace( '.0', '')

df.tail

二、删除无效值

idx= df[df[ '手机号']== '***'].index

df.drop(idx,inplace = True)

df.head

接下来,进行统计手机号前7位重复个数。

n= df[ '手机号前7位'].value_counts

df[ '手机号前7位重复个数'] = df[ '手机号前7位'].map(n)

df.tail

当我满心欢喜地告诉他答案时候,他说不对啊!!!不同ID下,要分别统计,也就是说要看每一个ID下手机号前7位重复个数。于是,接着修改。

三、正确答案

# 化整为零

ID = df[ 'ID'].unique

result = []

fori in ID:

df1 = df[df[ 'ID']==i]. copy

n = df1[ '手机号前7位'].value_counts

df1[ '手机号前7位重复个数'] = df1[ '手机号前7位']. map(n)

result. append(df1)

r = pd.concat(result)

r.sample( 10)

这一次,他没有再说什么!!嘻嘻嘻,为我的机智点赞~

不过,我觉得这个方法也许不是太好吧。但是,有没有更好的方法呢?

欢迎大家和我交流一下,感谢~

更多精彩

点击上图查看教学大纲返回搜狐,查看更多

责任编辑:

python 频数统计_日常答疑:Python实现分类频数统计相关推荐

  1. python excel对比_日常使用————python对比两个excel表中的数据

    现在有两个相同的数据集的结构,把80年和2000年两个文件夹,文件名是一样的,但文件数据是不一致的80年xls格式存储,2000年使用xlrd读取数据存储在xlsx格式,使用openpyxl读取数据, ...

  2. oracle 查重复_日常答疑|MySQL删除重复数据踩过得坑

    问题 群友提问:MySQL这样删除重复数据为啥不成功呢? 严小样儿:安排! 咋一看,大家都说where子句里面应该使用极值函数,加个max就对了,这么简单! # 大家想象中这样写是对的,其实仍然是错的 ...

  3. mysql 删除重复数据_日常答疑|MySQL删除重复数据踩过得坑

    问题 群友提问:MySQL这样删除重复数据为啥不成功呢? 严小样儿:安排! 咋一看,大家都说where子句里面应该使用极值函数,加个max就对了,这么简单! # 大家想象中这样写是对的,其实仍然是错的 ...

  4. python优化网站_[练习] 用PYTHON来优化网站中的图片

    我到公司以来,第一次加班,哇,加一晚上加一上午,现在还没下班的迹象,555,困. 对于网站中的一些关键的页面,多重缓存.静态化.程序代码优化--之外,为了提高用户打开页面的速度,图片是必须要优化的. ...

  5. python数据结构编程_写给Python编程高手之 数据结构

    python视频教程栏目介绍Python编程需要注意的关键点. 如何在列表,字典,集合中根据条件筛选数据 案例:如何在下列列表data中筛选出大于0的数data = [1, -1, 2, 3, 4, ...

  6. python编写函数_如何用Python编写自己喜欢的R函数

    python编写函数 数据科学和机器学习的伟大现代斗争之一是" Python vs. R". 毫无疑问,近年来两者都已经取得了巨大的发展,成为数据科学,预测分析和机器学习的顶级编程 ...

  7. 网易图灵学院python公开课_图灵学院 Python全系列教程全栈工程师 python视频教程下载...

    大家怎么说? 老师很好,我认为,若想学好python,应该多练.多想.多看.学习资料不能仅限于老师给定的这些内容,这些毕竟是入门资料 老师讲的真不错,对于我们这种小白来说 也比较容易懂,虽然有些时候自 ...

  8. python提取句子_科学网—Python提取句子 - 吕波的博文

    将一段话中的句子分离出来不是一件容易的事.因为句子的开头和结尾并不是很规则,而且句子内部会出现句号.这使得通过单一的正则表达式分离句子是不可能的.有时你能成功,但大多数时候你会出错.这里我们用nltk ...

  9. 文科生自学python要多久_怎么自学python,大概要多久?

    都让开!本人文科生,自学Python 2年半,作为一个曾经完全0基础,啥都不懂纯靠自学学会python的文科生,有一些不成熟的小建议可以分享一下. 首先不要觉着编程难,只要你认识26个英文字母,有一点 ...

最新文章

  1. hexo部署在Github-Page流程
  2. JS 加强篇!推荐 10 个好用的 TypeScript 的开源项目 YYDS !
  3. 28个经过重新设计的著名博客案例
  4. 通讯录通过id找邮箱和手机
  5. 整合Swagger接口文档
  6. 智能门锁主要有哪些优势,具体是怎么分类的?
  7. 基于SSM实现的超市管理系统
  8. Alictf2014 Writeup
  9. MySQL查询不同年份母亲节_不同国家的母亲节发展故事
  10. MarkDownPad2实用教程及MarkDown常用语法
  11. Android各种模拟器使用笔记
  12. ASBR(自治系统边界路由器)
  13. CSDN阅读全文自动展开插件,安排上!
  14. Linux的pcie模拟网卡,Qemu虚拟机pci设备透传——网卡
  15. 挣五千花一万,大气者成大器
  16. jquery、js去除浏览器(ff、ie)缓存问题
  17. 排序算法图解(四):希尔排序
  18. Yii1.1应用升级到Yii2.0的一些注意点
  19. 网站上面无法显示woff、svg格式字体
  20. Android JNI开发

热门文章

  1. 汽车精准用油,您真的了解吗?
  2. Python爬虫实战使用scrapy与selenium来爬取数据
  3. matlab极坐标画椭圆,matlab怎么画极坐标
  4. Excel生成随机32、36位ID
  5. 木瓜移动每日资讯0518:滴滴在哈推出打车服务
  6. 时域和频域的简单理解
  7. 元宇宙的“42条共识” ,全网阅读量超1000万!
  8. 上拉加载更多其他方法
  9. js实现粒子特效,particles.js的使用
  10. Python的wheel文件安装