基于pandas的男女电影评价差异分析
看了南京大学的《用python玩转数据视频》,Python强大。代码做了些注释。慢慢逐渐深入。
https://scipy.org/
import pandas as pd
import numpy as np# Download url: https://files.grouplens.org/datasets/movielens/ml-100k.zip# 读取文件
unames = ['user id', 'age', 'gender', 'occupation', 'zip code']
users = pd.read_csv('ml-100k/u.user', sep = '|', names = unames) # 读取文件read_csv,sep指定分隔符
rnames = ['user id', 'item id', 'rating', 'timestamp']
ratings = pd.read_csv('ml-100k/u.data', sep = '\t', names = rnames)# 数据筛选
users_df = users.loc[:, ['user id', 'gender']] # loc进行数据选取
ratings_df = ratings.loc[:, ['user id', 'rating']]
rating_df = pd.merge(users_df, ratings_df) # 合并# Way 1 - groupby() 计算标准差
result = rating_df.groupby('gender').rating.apply(pd.Series.std)
print(result)
# Way 1 - pivot_table() 透视表 动态排列,分类汇总,可以实现groupby功能 index是索引
result = pd.pivot_table(rating_df, index = ['gender'], values = 'rating', aggfunc = pd.Series.std)
print(result)# Way 2 - groupby() 据user id,gender计算男女标准差
df_temp = rating_df.groupby(['user id', 'gender']).apply(np.mean)
result = df_temp.groupby('gender').rating.apply(pd.Series.std)
print(result)
# Way 2 - pivot_table()
gender_table = pd.pivot_table(rating_df, index = ['gender', 'user id'], values = 'rating')
Female_df = gender_table.query("gender == ['F']") # 获取女性的数据
Male_df = gender_table.query("gender == ['M']") # 获取男性的数据
Female_std = pd.Series.std(Female_df)
Male_std = pd.Series.std(Male_df) # 计算标准差
print('Gender', '\nF\t%.6f' % Female_std, '\nM\t%.6f' % Male_std) # 输出
基于pandas的男女电影评价差异分析相关推荐
- 男女电影评分差异分析编程
计算MovieLens 100k数据集中男性女性用户评分的标准差并输出. 数据集下载http://files.grouplens.org/datasets/movielens/ml-100k.zip ...
- python 计算男女电影标准差 coursera男女电影评分差异分析编程
最近学习AI的强有力工具Python. 看到南京大学 的 用python玩转数据视频,有一个计算标准差的作业,现分享如下 import pandas as pd # 导入评分数据 ratingData ...
- 基于pandas的电影评分差异分析
基于pandas的电影评分差异分析 实验内容 数据来源 详细步骤 import pandas as pd import numpy as npunames = ['user id','age','ge ...
- 基于ssm影视论坛系统java web jsp电影评价影评系统源码和文档
开发环境: jdk 8 intellij idea tomcat 8.5.40 mysql 5.7 所用技术: Spring+SpringMVC+MyBatis layui jsp 演示视频: 基于s ...
- ML之K-means:基于K-means算法利用电影数据集实现对top 100 电影进行文档分类
ML之K-means:基于K-means算法利用电影数据集实现对top 100 电影进行文档分类 目录 输出结果 实现代码 输出结果 先看文档分类后的结果,一共得到五类电影: 实现代码 # -*- c ...
- ML之H-Clusters:基于H-Clusters算法利用电影数据集实现对top 100电影进行文档分类
ML之H-Clusters:基于H-Clusters算法利用电影数据集实现对top 100电影进行文档分类 目录 输出结果 实现代码 输出结果 先看输出结果 实现代码 # -*- coding: ut ...
- 1.3 基于协同过滤的电影推荐案例
1.3 案例–基于协同过滤的电影推荐 学习目标 应用基于用户的协同过滤实现电影评分预测 应用基于物品的协同过滤实现电影评分预测 1 User-Based CF 预测电影评分 数据集下载 下载地址:Mo ...
- 基于协同过滤的电影推荐
日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 1.4 案例--基于协同过滤的电影推荐 学习目标 应用基于用户 ...
- 基于深度学习的大脑性别差异分析
点击上方蓝字关注我们 基于深度学习的大脑性别差异分析 温景熙, 于胡飞, 辛江, 唐艳 中南大学计算机学院,湖南 长沙 410083 摘要:深度学习被广泛应用于大脑的相关研究中.通过构建深度学习模型对 ...
最新文章
- 火狐不支持event.keyCode,用jquery中的event.which轻松解决。
- 100道JS构造函数面试题
- 黑洞照片背后的女人:她的算法让数据“拼”成了照片
- 【kafka】Kafka ConsumerOffsetChecker 命令失效问题解决 卡死
- 玩转Koa之核心原理分析
- 使用客户端工具SecureCRT连接linux
- C++ 取模、求余运算
- 网络分层和Http协议原理
- ZOJ 1789 The Suspects(经典并查集)
- 【原创开源应用第2期】基于RL-USB和RL-FlashFS的完整NAND解决方案,稳定好用,可放心用于产品批量
- 角度转度分秒lisp函数_自改小程序,提示错误,运行另一个lisp后就不会出错,求帮忙!...
- Laya 【U3D场景的 .ls场景】 【Laya.URL.basePath远程加载】 【加载分包】,【进度条】
- 线性代数 —— 线性组合与线性表出,线性相关与线性无关
- 使用Python计算日期对应的周
- layer遮罩层 简单的遮罩层
- 如何基于SSM设计实现一个学生学籍管理系统
- 低学历转行3D建模有前途吗,游戏3D建模怎么样?
- ubuntu版本Linux系统中安装jira
- Java Web应用开发——作业一
- 百合数c语言360问答,关于百合花的资料