python计算各类型电影的评分_python(15)-pandas-多类型统计-电影分类问题

1.情境描述：用于电影分类，一个电影可以属于好几类。按类型统计片子数。

2.实现步骤：读文件->统计分类->全0数组(行，列)->赋值为1->各列求和

3.知识点： 3.1嵌套 [ [ ],[ ],[ ],[ ] ] 读值

3.2 全0数组创建N*M数组

3.3对应项赋值为1

知识点： 1.list 嵌套 [ [ ],[ ],[ ],[ ] ] 读值

l= [[a,b,c]

[a,f,x]

[x,b,m]

[a,f,c]

[y,b,c]]

list(set([i for j in temp_list for i in j ]))

2. 全0数组创建N*M数组

1.创建一个4*3的数组

np.array(np.arange(12)).reshape(4, 3)

"""

输出

[ 0 1 2]

[ 3 4 5]

[ 6 7 8]

[ 9 10 11]

"""

2.创建一个4*3的全零数组

zeros(shape, dtype=float, order='C')

np.zeros((4, 3))

"""

输出

[ 0. 0. 0.]

"""

3.对应项赋值为1

#zeros_df.loc[0,["SCI-FI","musical"]]=1

for i in range(df.shape[0]):

zeros_df.loc[i,temp_list[i]]=1

流程代码：

"""

1.得到所有的分类 genre_list=[]

temp_genre_list=df["Genre"].str.split(",").tolist()

或者 tolist() to_dict() 类型数据

genre_list=[]

for i in temp_genre_list:

genre_list.extend(i)

genre_list=list(set(genre_list)) ->去重

2.构造一个全0数组

zeros_genre=pd.DataFrame(np.zeros(shape=(df.shape[0],len(genre_list)),dtype=int),colums=genre_list)

3.出现分类的地方设为1

for i in range(df.shape[0]):

genres=df["Genre"][i]

zeros_genre.loc[i,genres.split(",")]=1

"""

def fun():

#1.读取文件

filePath="./data/movie.csv"

df=pd.read_csv(filePath)

#2.统计分类的列表

temp_list=df["Genre"].str.split(",").tolist()

genre_list=list(set([i for j in temp_list for i in j ]))

#3.构造全为0的数组行条数列种类

zeros_df=pd.DataFrame(np.zeros((df.shape(0),len(genre_list))),columns=genre_list)

#4.赋值为1 zeros_df.loc[0,["SCI-FI","musical"]]=1

for i in range(df.shape[0]):

zeros_df.loc[i,temp_list[i]]=1

#5.统计每个分类的电影的数量和

genre_count=zeros_df.sum(axis=0)

print(genre_count)

#6.排序

genre_count=genre_count.sort_value()

python计算各类型电影的评分_python(15)-pandas-多类型统计-电影分类问题相关推荐

python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例
功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...
python计算各类型电影的评分_【Python数据科学实战项目】之基于MovieLens的影评趋势分析|详解...
原标题:[Python数据科学实战项目]之基于MovieLens的影评趋势分析|详解注:图片源于https://movielens.org/ 1. 项目任务 1.1 数据来源本项目使用Group ...
python电影数据分析报告_Python数据分析实战：TMDB电影数据可视化
一.数据预处理本文将以项目实战的形式,对 TMDB电影数据进行数据分析与可视化实战,所使用的数据来源于 Kaggle,文末提供数据的下载方式. import json import pandas a ...
python计算两个矩形的重叠_python计算两个矩形框重合百分比的实例
python计算两个矩形框重合百分比的实例如下所示: def mat_inter(box1,box2): # 判断两个矩形是否相交 # box=(xA,yA,xB,yB) x01, y01, x02 ...
在python中布尔类型的值包括_Python中布尔类型
我们已经了解了Python支持布尔类型的数据,布尔类型只有True和False两种值,但是布尔类型有以下几种运算: 与运算:只有两个布尔值都为 True 时,计算结果才为 True. True and ...
python计算给定的日期的星期_Python计算给定日期的周内的某一天
先理一下思路: 1.weekday会根据某个日期返回0到6的一个数字来表示星期几对吧,0==星期一我们来列一个表:[0,1,2,3,4,5,6] 2.知道了星期几之后,你可以计算出那一周相对于这个0 ...
python计算回文数的方法_Python计算回文数的方法
本文实例讲述了Python计算回文数的方法.分享给大家供大家参考.具体如下: 这里检查数字是不是回文数,用196算法生成一个数字的回文数 num = 905; def is_Palindrome(nu ...
Pandas案例(统计电影分类情况-重要)
#统计电影分类,每一个类别有多少部电影 #思路:创建一个全0数组,以类别为列名,遍历每条数据,是此类别,则这一行的列值赋值为1 import pandas as pd import matplotli ...
python爬取电影评分_Python爬取豆瓣高分电影前250名
import requests import pymysql import time import re import xlwt from lxml import etree headers = {' ...

python计算各类型电影的评分_python(15)-pandas-多类型统计-电影分类问题

python计算各类型电影的评分_python(15)-pandas-多类型统计-电影分类问题相关推荐

最新文章

热门文章