python中计算DataFrame,Series的数据频率
任何关于算法、编程、AI行业知识或博客内容的问题,可以随时扫码关注公众号「图灵的猫」,加入”学习小组“,沙雕博主在线答疑~此外,公众号内还有更多AI、算法、编程和大数据知识分享,以及免费的SSR节点和学习资料。其他平台(知乎/B站)也是同名「图灵的猫」,不要迷路哦~
在pandas里面常用用value_counts确认数据出现的频率。
- Series 情况下
- import numpy as np
- import pandas as pd
- from pandas import DataFrame
- from pandas import Series
- ss = Series(['Tokyo', 'Nagoya', 'Nagoya', 'Osaka', 'Tokyo', 'Tokyo'])
- ss.value_counts() #value_counts 直接用来计算series里面相同数据出现的频率
- Tokyo 3
- Nagoya 2
- Osaka 1
- dtype: int64
- DataFrame 情况下
- import numpy as np
- import pandas as pd
- from pandas import DataFrame
- from pandas import Series
- df=DataFrame({'a':['Tokyo','Osaka','Nagoya','Osaka','Tokyo','Tokyo'],'b':['Osaka','Osaka','Osaka','Tokyo','Tokyo','Tokyo']}) #DataFrame用来输入两列数据,同时value_counts将每列中相同的数据频率计算出来
- print(df)
- a b
- 0 Tokyo Osaka
- 1 Osaka Osaka
- 2 Nagoya Osaka
- 3 Osaka Tokyo
- 4 Tokyo Tokyo
- 5 Tokyo Tokyo
- df.apply(pd.value_counts)
- a b
- Nagoya 1 NaN #在b列中meiynagoya,因此是用NaN 表示。
- Osaka 2 3.0
- Tokyo 3 3.0
参考:
python中计算DataFrame,Series的数据频率相关推荐
- pandas计算dataframe两列数据值相等的行号、取出DataFrame中两列值相等的行号
pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号 目录 pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号
- pandas使用unique函数计算dataframe单个数据列中的独特值、或者计算dataframe多个数据列的独特值(get unique values of column or columns)
pandas使用unique函数计算dataframe单个数据列中的独特值.或者计算dataframe多个数据列的独特值(get unique values of column or columns) ...
- 怎么把竖列中的数相加python_关于python中pandas.DataFrame对行与列求和及添加新行与列示例代码...
pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这篇文章主要给大家介绍了关于python中pandas.DataFrame对行与列求和及添加新 ...
- series 合并pandas_在python中pandas的series合并方法
如下所示: In [3]: import pandas as pd In [4]: a = pd.Series([1,2,3]) In [5]: b = pd.Series([2,3,4]) In [ ...
- python应用中调用spark_在python中使用pyspark读写Hive数据操作
1.读Hive表数据 pyspark读取hive数据非常简单,因为它有专门的接口来读取,完全不需要像hbase那样,需要做很多配置,pyspark提供的操作hive的接口,使得程序可以直接使用SQL语 ...
- python的out模式_如何用python中的DataFrame列的模式替换NA值?
我对Python(和本网站)完全陌生,目前正试图用它们的模式替换特定数据帧列中的NA值.我试过了各种不起作用的方法.请帮我看看我做错了什么:如何用python中的DataFrame列的模式替换NA值? ...
- Python中通过索引名称提取数据loc()函数Python中通过行和列下标提取数据iloc()函数
[小白从小学Python.C.Java] [Python全国计算机等级考试] [Python数据分析考试必会题] ● 标题与摘要 Python中通过索引名称提取数据 loc()函数 Python中通过 ...
- 【科学文献计量】CSSCI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库
CSSCI数据采集,转化为python中的DataFrame格式,并存放到MySQL数据库 1 CSSCI数据采集 2 数据加载到python中并进行DataFrame类型转化 3 将DataFram ...
- 如何在 Python 中计算 MAPE
平均绝对百分比误差 (MAPE) 通常用于衡量模型的预测准确性.计算如下: MAPE = (1/n) * Σ(|实际 - 预测| / |实际|) * 100 在哪里: Σ – 表示"总和&q ...
- 在python中使用json格式存储数据
在python中使用json格式存储数据 代码如下: import jsonlist1 = [{'A': [1, 2, 3, 4, 5, 6], 'B': [3, 4, 5, 6, 7]},{'C': ...
最新文章
- Python设计模式-装饰器模式
- 并发编程11-测试并发程序
- 更新源列表及设置方法
- LC77 Combinations
- 方法论、方法论——程序员的阿喀琉斯之踵
- Mybatis的xml文件中$ 与 #的区别
- 探讨PHP页面跳转几种实现技巧
- grove 套件_如何通过使用Andy Grove的High Leverage Activities加快发展?
- C和C++实务精选丛书
- 穷人穷在哪,富人为何富?
- php如何去除字符串中的空格,php如何去除字符串中的空格
- c语言逐行存储到txt,c语言逐行读取txt文件数据
- Nooploop空循环 TOFSense激光测距传感器 模块 红外测距测高
- 用C为密集运算函数加速
- 实际应用Supervisor部署Flask项目
- TypeError: decoding str is not supported
- ORAN专题系列-21:主要的玩家(设备商)以及他们各自的态度、擅长领域
- 简单精干之 MyBatis-Plus
- 10 款优雅的 Go 语言开发工具
- 阿里云 oss多文件上传