统计123出现次数_如何使用 count 统计词条出现次数?
如何获取数据最多的3个分类?如何使用count统计词条出现次数?今天番茄加速跟大家讲一下。
如何快速拿到数据最多的 3 个分类?
读入数据:
df = pd.read_csv("IMDB-Movie-Data.csv")
df
1000 行数据,genre 取值的频次统计如下:
vc = df["genre"].value_counts()
vc
打印结果:
Action,Adventure,Sci-Fi 50
Drama 48
Comedy,Drama,Romance 35
Comedy 32
Drama,Romance 31
..
Adventure,Comedy,Fantasy 1
Biography,History,Thriller 1
Action,Horror 1
Mystery,Thriller,Western 1
Animation,Fantasy 1
Name: genre, Length: 207, dtype: int64
筛选出 top3 的 index:
top_genre = vc[0:3].index
print(top_genre)
打印结果:
Index(['Action,Adventure,Sci-Fi', 'Drama',
'Comedy,Drama,Romance'], dtype='object')
使用得到的 top3 的 index ,结合 isin,选择出相应的 df
df_top = df[df["genre"].isin(top_genre)]
df_top
结果:
如何使用 count 统计词条出现次数?
读入 IMDB-Movie-Data 数据集,1000行数据:
df = pd.read_csv("../input/imdb-data/IMDB-Movie-Data.csv")
df['Title']
打印 Title 列:
0 Guardians of the Galaxy
1 Prometheus
2 Split
3 Sing
4 Suicide Squad
...
995 Secret in Their Eyes
996 Hostel: Part II
997 Step Up 2: The Streets
998 Search Party
999 Nine Lives
Name: Title, Length: 1000, dtype: object
标题是由几个单词组成,用空格分隔。
df["words_count"] = df["Title"].str.count(" ") + 1
df[["Title","words_count"]]
统计123出现次数_如何使用 count 统计词条出现次数?相关推荐
- redis统计用户日活量_玩转Redis-HyperLogLog统计微博日活月活
<玩转Redis>系列文章主要讲述Redis的基础及中高级应用.本文是<玩转Redis>系列第[9]篇,最新系列文章请前往公众号"zxiaofan"查看,或 ...
- java 记录微信转发次数_微信分享朋友圈记录分享次数统计实现
业余时间研究微信的接口方法.记录下微信分享朋友圈记录分享次数统计实现:1.引入JS文件 2.通过config接口注入权限验证配置 3.通过ready接口处理成功验证 4.通过error接口处理失败验证 ...
- java统计每个单词单词出现的次数_(java)统计若干段英文中的单词数量,并统计每个单词出现的次数按降序排序。...
注1(1)注2 !!!!! 10 import java.io.BufferedReader; import java.io.IOException; import java.io.InputStre ...
- python判断字符串出现的次数_【如何判断python字符串出现次数?这几种方法你一定要学会】- 环球网校...
[摘要]python应用阶段是实际的工作经验,现在如何判断python字符串出现次数?这几种方法你一定要学会,小编建议大家可以试着理解这些内容,也许对您的python学习有帮助,毕竟实践出真知,所以你 ...
- python描述性统计离散型变量_数据的描述性统计(Python3 实现)
众数(Mode) 众数是统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个).简单来说就是指一组数据中出现次数最多的数据值. import collecti ...
- python统计csv行数_对Python 多线程统计所有csv文件的行数方法详解
如下所示: #统计某文件夹下的所有csv文件的行数(多线程) import threading import csv import os class MyThreadLine(threading.Th ...
- java gc 次数_浅谈如何减少GC的次数
GC会stop the world.会暂停程序的执行,带来延迟的代价.所以在开发中,我们不希望GC的次数过多. 本文将讨论如何在开发中改善各种细节,从而减少GC的次数. (1)对象不用时最好显式置为 ...
- 字符串查找字符出现次数_查找字符串作为子序列出现的次数
字符串查找字符出现次数 Description: 描述: It's a popular interview question based of dynamic programming which ha ...
- java词频统计简单带代码_简单的词频统计代码实现(PDF格式)
周末抽空帮同学论文写了一段统计词频的代码,做个简单总结.出于职业病,代码使用Springboot+Maven搭建,面向抽象编程,并通过web请求控制执行. 依赖配置 org.springframewo ...
最新文章
- tm1650中文资料_TM1616,TM1650,TM1651 SOP16原厂直销,技术支持
- flask教程之创建第一个flask应用
- initializeBean()方法为容器产生的Bean 实例对象添加BeanPostProcessor 后置处理器
- JavaScript之常见算法排序
- C++之关于初始化列表(Initialization List)的一个补充示例
- 云服务器的带宽是如何计算的?
- 第一节:分布式文件系统(DFS,Distributed File System)
- 三角函数和差公式的推导
- win10 关闭139 135 445端口 (危险端口关闭)
- 基于双向流固耦合的Fluent dynamic mesh 学习笔记
- java公众号第三方开发平台_微信开放平台之公众号第三方平台开发及全网发布验证...
- 方舟正版服务器连接超时,方舟连接超时解决方案是什么
- 广州大学计算机学院谢冬青杀人案,广州大学6.29故意杀人案细节披露:谢冬青因怀疑被举报而杀人...
- 闵梓轩大佬のnoip模拟题D1 总结 2017/10/26
- faker造假数据的使用
- 我的世界手机版javaui材质包_我的世界:史蒂夫都有皮肤,存档也想换新装,这4种材质包很适合...
- 上海疫情后一个前端的面试心路历程
- 如何从八字中看“从医”之人
- 华为的云计算转型:逼出来的开放
- Linux 系统注册系统服务流程
热门文章
- C/C++内存分配方式与存储区
- 解决TIME_WAIT过多造成的问题
- ATL服务器:用 Visual C++创建的高性能的Web应用程序和XML Web 服务
- 类型转换操作符:static_cast, dynamic_cast, const_cast, reinterpret_cast.
- python关闭csv文件_使用Python编辑csv文件时跳过标题
- producer send源码_Kafka源码深度剖析系列(七)——Producer核心流程初探
- python gc内存_禁用 Python GC,Instagram 性能提升10%
- 协方差矩阵的概念,算法以及自己的一些理解
- 从对话框中传递参数到视图类
- Excel-怎样实现行列转置