计算MovieLens 100k数据集中男性女性用户评分的标准差并输出。

数据集下载http://files.grouplens.org/datasets/movielens/ml-100k.zip

其中u.data 表示100k条评分记录,每一列的数值含义是:

user id | item id | rating | timestamp

u.user表示用户的信息,每一列的数值含义是:

user id | age | gender | occupation | zip code

u.item文件表示电影的相关信息,每一列的数值含义是:

movie id | movie title | release date | video release date |IMDb URL |
unknown | Action | Adventure | Animation | Children’s | Comedy | Crime
| Documentary | Drama | Fantasy |Film-Noir | Horror | Musical |
Mystery | Romance | Sci-Fi |Thriller | War | Western |

可能会用到的相关函数:

pandas.read_table(filepath_or_buffer, sep=’\t’, names=None)

pandas.pivot_table(data, values=None, columns=None, aggfunc=‘mean’)

pandas.merge(left, right, how=‘inner’)

更详尽的API文档请参考http://pandas.pydata.org/pandas-docs/stable/。

输出结果:

Gender

M *

F *

结论:标准差高的评分差异大

注意:先分别计算每个人电影评分的平均分再按性别求标准差

请将男女评分(保留2位小数)组合后放到一个txt文件中通过网络提交,例如:如果两者评分的标准差分别是

男:0.32

女:0.35

则提交:

3235

import pandas as pdwith open(r'C:\Users\USER\Desktop\用Python玩转数据\4.1 Python基本数据统计\ml-100k\u.data', 'r') as f:data = pd.read_table(f, header=None)data.columns = ['user id','item id','rating','timestamp']with open(r'C:\Users\USER\Desktop\用Python玩转数据\4.1 Python基本数据统计\ml-100k\u.user', 'r') as f:user = pd.read_table(f, header=None)list = []for i in range(len(user.values)):names = user.values[i][0].split('|')list.append(names)user = pd.DataFrame(list)user.columns =['user id', 'age', 'gender', 'occupation', 'ip code']user['user id'] = pd.to_numeric(user['user id'], errors='coerce')avgrating = pd.pivot_table(data, values='rating', index = 'user id', aggfunc='mean')
new = pd.merge(avgrating, user, how='inner', on = 'user id')
std = pd.pivot_table(new, values='rating', index = 'gender', aggfunc='std')
print(std)

男女电影评分差异分析编程相关推荐

  1. python 计算男女电影标准差 coursera男女电影评分差异分析编程

    最近学习AI的强有力工具Python. 看到南京大学 的 用python玩转数据视频,有一个计算标准差的作业,现分享如下 import pandas as pd # 导入评分数据 ratingData ...

  2. 基于pandas的电影评分差异分析

    基于pandas的电影评分差异分析 实验内容 数据来源 详细步骤 import pandas as pd import numpy as npunames = ['user id','age','ge ...

  3. python数据挖掘电影评分分析_Pyhon数据分析项目——男女电影评分差异比较

    <用 Python 玩转数据>数据分析项目 一.程序功能 基于 MovieLens 100k 数据集中男性女性对电影的评分来判断男性还是女性电影 评分的差异性更大. 二.数据来源 数据集下 ...

  4. 基于pandas的男女电影评价差异分析

    看了南京大学的<用python玩转数据视频>,Python强大.代码做了些注释.慢慢逐渐深入. https://scipy.org/ import pandas as pd import ...

  5. 基于R语言构建的电影评分预测模型

    电影评分系统是一种常见的推荐系统.现在使用R语言基于协同过滤算法来构建一个电影评分预测模型. 一,前提准备         1.R语言包:ggplot2包(绘图),recommenderlab包,re ...

  6. 利用python进行数据分析_第二章_案例2_movielens_电影评分分析

    自己尝试了一下数据分析,和书里的方法不完全一样.标*的为比较好的方法. ================================================ MovieLens电影评分数据 ...

  7. 大数据Spark电影评分数据分析

    目录 1 数据 ETL 2 使用 SQL 分析 3 使用 DSL 分析 4 保存结果数据 5 案例完整代码 6 Shuffle 分区数目问题 1 数据 ETL 使用电影评分数据进行数据分析,分别使用D ...

  8. Python 电影评分分析

    关注微信号:小程在线 关注CSDN博客:程志伟的博客 import numpy as np import pandas as pd import matplotlib.pyplot as plt %m ...

  9. 电影评分数据集的分析

    目录 数据集的获得 使用工具 项目流程 数据集的获得 进入该网址:https://grouplens.org/datasets/movielens/ 找到如下part: 点击ml-100k.zip进行 ...

最新文章

  1. Gartner发布2020年数据与分析领域的十大技术趋势
  2. 【后缀数组】【poj2774】【 Long Long Message】
  3. web worker技术-js新线程
  4. 【测试点分析】1081 检查密码 (15分)
  5. anacoda2如何连接使用mysql_Anaconda 安装 Python 库(MySQLdb)的方法-(转)
  6. java 点击改变_java 单击按钮改变背景颜色
  7. 翻译 - 【Dojo Tutorials】Getting Started with dojox/app
  8. 查看你所使用计算机的网卡信息,查看网卡信息命令
  9. 前端 javascript 变量
  10. Graphviz 绘制流程图
  11. vue-cli3使用vue-router 使用动态路由,在刷新页面时报错
  12. Web 端的测试 Selenium 用法必备
  13. Java判断质数/素数的三种方法
  14. win10 LTSC无损升级 win11专业版 记录
  15. 线性代数之 矩阵的迹
  16. 2022年系统架构设计师考试大纲
  17. 包姓女孩清秀文雅的名字
  18. Android系统 小米/三星/索尼 应用启动图标未读消息数(BadgeNumber)动态提醒
  19. [WinForm]Windows程序(非网页) #2 -- 跨平台的 ADO.NET程序(简单入门)
  20. [BZOJ 4598][Sdoi2016]模式字符串

热门文章

  1. 2021前端学习路线
  2. 树莓派系统的安装教程
  3. 23种设计模式个人总结之C#版
  4. Python: 砍竹子(栈)
  5. 人与人的悲欢并不相通,我只觉得O泡吵闹
  6. 【接口协议】基于 FPGA 的 HMDI 彩条显示实验
  7. C++ 遇到的 error C2146, C2065 报错信息的解决
  8. 工程项目物流市场现状及未来发展趋势
  9. Guacamole桌面虚拟化介绍和安装使用
  10. vrtk 使用教程(一)