如何获取数据最多的3个分类?如何使用count统计词条出现次数?今天番茄加速跟大家讲一下。

  如何快速拿到数据最多的 3 个分类?

  读入数据:

  df = pd.read_csv("IMDB-Movie-Data.csv")

  df

  1000 行数据,genre 取值的频次统计如下:

  vc = df["genre"].value_counts()

  vc

  打印结果:

  Action,Adventure,Sci-Fi 50

  Drama 48

  Comedy,Drama,Romance 35

  Comedy 32

  Drama,Romance 31

  ..

  Adventure,Comedy,Fantasy 1

  Biography,History,Thriller 1

  Action,Horror 1

  Mystery,Thriller,Western 1

  Animation,Fantasy 1

  Name: genre, Length: 207, dtype: int64

  筛选出 top3 的 index:

  top_genre = vc[0:3].index

  print(top_genre)

  打印结果:

  Index(['Action,Adventure,Sci-Fi', 'Drama',

  'Comedy,Drama,Romance'], dtype='object')

  使用得到的 top3 的 index ,结合 isin,选择出相应的 df

  df_top = df[df["genre"].isin(top_genre)]

  df_top

  结果:

  如何使用 count 统计词条出现次数?

  读入 IMDB-Movie-Data 数据集,1000行数据:

  df = pd.read_csv("../input/imdb-data/IMDB-Movie-Data.csv")

  df['Title']

  打印 Title 列:

  0 Guardians of the Galaxy

  1 Prometheus

  2 Split

  3 Sing

  4 Suicide Squad

  ...

  995 Secret in Their Eyes

  996 Hostel: Part II

  997 Step Up 2: The Streets

  998 Search Party

  999 Nine Lives

  Name: Title, Length: 1000, dtype: object

  标题是由几个单词组成,用空格分隔。

  df["words_count"] = df["Title"].str.count(" ") + 1

  df[["Title","words_count"]]

统计123出现次数_如何使用 count 统计词条出现次数?相关推荐

  1. redis统计用户日活量_玩转Redis-HyperLogLog统计微博日活月活

    <玩转Redis>系列文章主要讲述Redis的基础及中高级应用.本文是<玩转Redis>系列第[9]篇,最新系列文章请前往公众号"zxiaofan"查看,或 ...

  2. java 记录微信转发次数_微信分享朋友圈记录分享次数统计实现

    业余时间研究微信的接口方法.记录下微信分享朋友圈记录分享次数统计实现:1.引入JS文件 2.通过config接口注入权限验证配置 3.通过ready接口处理成功验证 4.通过error接口处理失败验证 ...

  3. java统计每个单词单词出现的次数_(java)统计若干段英文中的单词数量,并统计每个单词出现的次数按降序排序。...

    注1(1)注2 !!!!! 10 import java.io.BufferedReader; import java.io.IOException; import java.io.InputStre ...

  4. python判断字符串出现的次数_【如何判断python字符串出现次数?这几种方法你一定要学会】- 环球网校...

    [摘要]python应用阶段是实际的工作经验,现在如何判断python字符串出现次数?这几种方法你一定要学会,小编建议大家可以试着理解这些内容,也许对您的python学习有帮助,毕竟实践出真知,所以你 ...

  5. python描述性统计离散型变量_数据的描述性统计(Python3 实现)

    众数(Mode) 众数是统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个).简单来说就是指一组数据中出现次数最多的数据值. import collecti ...

  6. python统计csv行数_对Python 多线程统计所有csv文件的行数方法详解

    如下所示: #统计某文件夹下的所有csv文件的行数(多线程) import threading import csv import os class MyThreadLine(threading.Th ...

  7. java gc 次数_浅谈如何减少GC的次数

    GC会stop the world.会暂停程序的执行,带来延迟的代价.所以在开发中,我们不希望GC的次数过多. 本文将讨论如何在开发中改善各种细节,从而减少GC的次数. (1)对象不用时最好显式置为 ...

  8. 字符串查找字符出现次数_查找字符串作为子序列出现的次数

    字符串查找字符出现次数 Description: 描述: It's a popular interview question based of dynamic programming which ha ...

  9. java词频统计简单带代码_简单的词频统计代码实现(PDF格式)

    周末抽空帮同学论文写了一段统计词频的代码,做个简单总结.出于职业病,代码使用Springboot+Maven搭建,面向抽象编程,并通过web请求控制执行. 依赖配置 org.springframewo ...

最新文章

  1. tm1650中文资料_TM1616,TM1650,TM1651 SOP16原厂直销,技术支持
  2. flask教程之创建第一个flask应用
  3. initializeBean()方法为容器产生的Bean 实例对象添加BeanPostProcessor 后置处理器
  4. JavaScript之常见算法排序
  5. C++之关于初始化列表(Initialization List)的一个补充示例
  6. 云服务器的带宽是如何计算的?
  7. 第一节:分布式文件系统(DFS,Distributed File System)
  8. 三角函数和差公式的推导
  9. win10 关闭139 135 445端口 (危险端口关闭)
  10. 基于双向流固耦合的Fluent dynamic mesh 学习笔记
  11. java公众号第三方开发平台_微信开放平台之公众号第三方平台开发及全网发布验证...
  12. 方舟正版服务器连接超时,方舟连接超时解决方案是什么
  13. 广州大学计算机学院谢冬青杀人案,广州大学6.29故意杀人案细节披露:谢冬青因怀疑被举报而杀人...
  14. 闵梓轩大佬のnoip模拟题D1 总结 2017/10/26
  15. faker造假数据的使用
  16. 我的世界手机版javaui材质包_我的世界:史蒂夫都有皮肤,存档也想换新装,这4种材质包很适合...
  17. 上海疫情后一个前端的面试心路历程
  18. 如何从八字中看“从医”之人
  19. 华为的云计算转型:逼出来的开放
  20. Linux 系统注册系统服务流程

热门文章

  1. C/C++内存分配方式与存储区
  2. 解决TIME_WAIT过多造成的问题
  3. ATL服务器:用 Visual C++创建的高性能的Web应用程序和XML Web 服务
  4. 类型转换操作符:static_cast, dynamic_cast, const_cast, reinterpret_cast.
  5. python关闭csv文件_使用Python编辑csv文件时跳过标题
  6. producer send源码_Kafka源码深度剖析系列(七)——Producer核心流程初探
  7. python gc内存_禁用 Python GC,Instagram 性能提升10%
  8. 协方差矩阵的概念,算法以及自己的一些理解
  9. 从对话框中传递参数到视图类
  10. Excel-怎样实现行列转置