1.情境描述:用于电影分类,一个电影可以属于好几类。 按类型统计片子数。

2.实现步骤:读文件->统计分类->全0数组(行,列)->赋值为1->各列求和

3.知识点: 3.1嵌套 [ [ ],[ ],[ ],[ ] ] 读值

3.2 全0数组 创建N*M数组

3.3对应项赋值为1

知识点: 1.list 嵌套 [ [ ],[ ],[ ],[ ] ] 读值

l= [[a,b,c]

[a,f,x]

[x,b,m]

[a,f,c]

[y,b,c]]

list(set([i for j in temp_list for i in j ]))

2. 全0数组 创建N*M数组

1.创建一个4*3的数组

np.array(np.arange(12)).reshape(4, 3)

"""

输出

[ 0 1 2]

[ 3 4 5]

[ 6 7 8]

[ 9 10 11]

"""

2.创建一个4*3的全零数组

zeros(shape, dtype=float, order='C')

np.zeros((4, 3))

"""

输出

[ 0. 0. 0.]

[ 0. 0. 0.]

[ 0. 0. 0.]

[ 0. 0. 0.]

"""

3.对应项赋值为1

#zeros_df.loc[0,["SCI-FI","musical"]]=1

for i in range(df.shape[0]):

zeros_df.loc[i,temp_list[i]]=1

流程代码:

"""

1.得到所有的分类 genre_list=[]

temp_genre_list=df["Genre"].str.split(",").tolist()

或者 tolist() to_dict() 类型数据

genre_list=[]

for i in temp_genre_list:

genre_list.extend(i)

genre_list=list(set(genre_list)) ->去重

2.构造一个全0数组

zeros_genre=pd.DataFrame(np.zeros(shape=(df.shape[0],len(genre_list)),dtype=int),colums=genre_list)

3.出现分类的地方设为1

for i in range(df.shape[0]):

genres=df["Genre"][i]

zeros_genre.loc[i,genres.split(",")]=1

"""

def fun():

#1.读取文件

filePath="./data/movie.csv"

df=pd.read_csv(filePath)

#2.统计分类的列表

temp_list=df["Genre"].str.split(",").tolist()

genre_list=list(set([i for j in temp_list for i in j ]))

#3.构造全为0的数组 行条数 列 种类

zeros_df=pd.DataFrame(np.zeros((df.shape(0),len(genre_list))),columns=genre_list)

#4.赋值为1 zeros_df.loc[0,["SCI-FI","musical"]]=1

for i in range(df.shape[0]):

zeros_df.loc[i,temp_list[i]]=1

#5.统计每个分类的电影的数量和

genre_count=zeros_df.sum(axis=0)

print(genre_count)

#6.排序

genre_count=genre_count.sort_value()

python计算各类型电影的评分_python(15)-pandas-多类型统计-电影分类问题相关推荐

  1. python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例

    功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...

  2. python计算各类型电影的评分_【Python数据科学实战项目】之 基于MovieLens的影评趋势分析|详解...

    原标题:[Python数据科学实战项目]之 基于MovieLens的影评趋势分析|详解 注:图片源于https://movielens.org/ 1. 项目任务 1.1 数据来源 本项目使用Group ...

  3. python电影数据分析报告_Python数据分析实战:TMDB电影数据可视化

    一.数据预处理 本文将以项目实战的形式,对 TMDB电影数据进行数据分析与可视化实战,所使用的数据来源于 Kaggle,文末提供数据的下载方式. import json import pandas a ...

  4. python计算两个矩形的重叠_python计算两个矩形框重合百分比的实例

    python计算两个矩形框重合百分比的实例 如下所示: def mat_inter(box1,box2): # 判断两个矩形是否相交 # box=(xA,yA,xB,yB) x01, y01, x02 ...

  5. 在python中布尔类型的值包括_Python中布尔类型

    我们已经了解了Python支持布尔类型的数据,布尔类型只有True和False两种值,但是布尔类型有以下几种运算: 与运算:只有两个布尔值都为 True 时,计算结果才为 True. True and ...

  6. python计算给定的日期的星期_Python计算给定日期的周内的某一天

    先理一下思路: 1.weekday会根据某个日期返回0到6的一个数字来表示星期几对吧,0==星期一 我们来列一个表:[0,1,2,3,4,5,6] 2.知道了星期几之后,你可以计算出那一周相对于这个0 ...

  7. python计算回文数的方法_Python计算回文数的方法

    本文实例讲述了Python计算回文数的方法.分享给大家供大家参考.具体如下: 这里检查数字是不是回文数,用196算法生成一个数字的回文数 num = 905; def is_Palindrome(nu ...

  8. Pandas案例(统计电影分类情况-重要)

    #统计电影分类,每一个类别有多少部电影 #思路:创建一个全0数组,以类别为列名,遍历每条数据,是此类别,则这一行的列值赋值为1 import pandas as pd import matplotli ...

  9. python爬取电影评分_Python爬取豆瓣高分电影前250名

    import requests import pymysql import time import re import xlwt from lxml import etree headers = {' ...

最新文章

  1. oracle hyperion招聘,Hyperion Planning功能顾问
  2. 消息队列rabitMq
  3. SAP CRM Fiori Opportunity应用功能一览
  4. 首次公开!人教版1-9年级绝密编写:被重点中小学永久收录的数学教案和试题...
  5. [转载]流行视频格式讲解
  6. 【Java】synchronized关键字笔记
  7. MySQLwin7安装过程
  8. ERP已经凉凉?低代码平台真能成为下个风口吗?
  9. pythonscrapy爬虫_使用Python3和Scrapy进行网站图片爬虫自动下载
  10. [译]使用YUI 3开发Web应用的诀窍
  11. sqlserver2012下载地址
  12. 刷新bios后电脑死机了怎么办
  13. aspectsof的意思_aspect of是什么意思
  14. 超简单的3步搭建静态网站(Franklin.jl)
  15. 违停现场执法的人性化解决之道
  16. 9_python笔记-函数
  17. upload.aspx
  18. 关于VMware虚拟机萌新使用教程
  19. 查询MySQL数据库中所有表的结构
  20. ERP项目实施| 准备工作、建议和注意事项

热门文章

  1. php输出后以密文显示,加密解密,_求大神帮看一下,如何根据下面的程序,把明文生成密文谢谢,加密解密 - phpStudy...
  2. 目标检测二十年:最全解读
  3. ad 导gerbera过孔层_嘉立创在线下单技术指导-AD输出Gerber文件步骤 - 嘉立创PCB业务推广网站...
  4. 尚硅谷在线教育项目P132修改pom.xml等文件后依然报错not found
  5. 求由一种特殊递推关系决定的数列通项
  6. 如何构建编译gopacket包的测试用例?(gopacket抓取数据包、类似于tcpdump、Wireshark)
  7. [RK3399][Android8.1/9]双屏异显
  8. 戴尔r720服务器增加内存,Dell R720/R730服务器内存插法
  9. 通过VCP(VMware Certified Professional)认证
  10. (逃)引用自--西祠胡同