看了南京大学的《用python玩转数据视频》,Python强大。代码做了些注释。慢慢逐渐深入。

https://scipy.org/

import pandas as pd
import numpy as np# Download url: https://files.grouplens.org/datasets/movielens/ml-100k.zip# 读取文件
unames = ['user id', 'age', 'gender', 'occupation', 'zip code']
users = pd.read_csv('ml-100k/u.user', sep = '|', names = unames) # 读取文件read_csv,sep指定分隔符
rnames = ['user id', 'item id', 'rating', 'timestamp']
ratings = pd.read_csv('ml-100k/u.data', sep = '\t', names = rnames)# 数据筛选
users_df = users.loc[:, ['user id', 'gender']] # loc进行数据选取
ratings_df = ratings.loc[:, ['user id', 'rating']]
rating_df = pd.merge(users_df, ratings_df) # 合并# Way 1 - groupby() 计算标准差
result = rating_df.groupby('gender').rating.apply(pd.Series.std)
print(result)
# Way 1 - pivot_table() 透视表 动态排列,分类汇总,可以实现groupby功能 index是索引
result = pd.pivot_table(rating_df, index = ['gender'], values = 'rating', aggfunc = pd.Series.std)
print(result)# Way 2 - groupby() 据user id,gender计算男女标准差
df_temp = rating_df.groupby(['user id', 'gender']).apply(np.mean)
result = df_temp.groupby('gender').rating.apply(pd.Series.std)
print(result)
# Way 2 - pivot_table()
gender_table = pd.pivot_table(rating_df, index = ['gender', 'user id'], values = 'rating')
Female_df = gender_table.query("gender == ['F']") # 获取女性的数据
Male_df = gender_table.query("gender == ['M']") # 获取男性的数据
Female_std = pd.Series.std(Female_df)
Male_std = pd.Series.std(Male_df) # 计算标准差
print('Gender', '\nF\t%.6f' % Female_std, '\nM\t%.6f' % Male_std) # 输出

基于pandas的男女电影评价差异分析相关推荐

  1. 男女电影评分差异分析编程

    计算MovieLens 100k数据集中男性女性用户评分的标准差并输出. 数据集下载http://files.grouplens.org/datasets/movielens/ml-100k.zip ...

  2. python 计算男女电影标准差 coursera男女电影评分差异分析编程

    最近学习AI的强有力工具Python. 看到南京大学 的 用python玩转数据视频,有一个计算标准差的作业,现分享如下 import pandas as pd # 导入评分数据 ratingData ...

  3. 基于pandas的电影评分差异分析

    基于pandas的电影评分差异分析 实验内容 数据来源 详细步骤 import pandas as pd import numpy as npunames = ['user id','age','ge ...

  4. 基于ssm影视论坛系统java web jsp电影评价影评系统源码和文档

    开发环境: jdk 8 intellij idea tomcat 8.5.40 mysql 5.7 所用技术: Spring+SpringMVC+MyBatis layui jsp 演示视频: 基于s ...

  5. ML之K-means:基于K-means算法利用电影数据集实现对top 100 电影进行文档分类

    ML之K-means:基于K-means算法利用电影数据集实现对top 100 电影进行文档分类 目录 输出结果 实现代码 输出结果 先看文档分类后的结果,一共得到五类电影: 实现代码 # -*- c ...

  6. ML之H-Clusters:基于H-Clusters算法利用电影数据集实现对top 100电影进行文档分类

    ML之H-Clusters:基于H-Clusters算法利用电影数据集实现对top 100电影进行文档分类 目录 输出结果 实现代码 输出结果 先看输出结果 实现代码 # -*- coding: ut ...

  7. 1.3 基于协同过滤的电影推荐案例

    1.3 案例–基于协同过滤的电影推荐 学习目标 应用基于用户的协同过滤实现电影评分预测 应用基于物品的协同过滤实现电影评分预测 1 User-Based CF 预测电影评分 数据集下载 下载地址:Mo ...

  8. 基于协同过滤的电影推荐

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 1.4 案例--基于协同过滤的电影推荐 学习目标 应用基于用户 ...

  9. 基于深度学习的大脑性别差异分析

    点击上方蓝字关注我们 基于深度学习的大脑性别差异分析 温景熙, 于胡飞, 辛江, 唐艳 中南大学计算机学院,湖南 长沙 410083 摘要:深度学习被广泛应用于大脑的相关研究中.通过构建深度学习模型对 ...

最新文章

  1. 火狐不支持event.keyCode,用jquery中的event.which轻松解决。
  2. 100道JS构造函数面试题
  3. 黑洞照片背后的女人:她的算法让数据“拼”成了照片
  4. 【kafka】Kafka ConsumerOffsetChecker 命令失效问题解决 卡死
  5. 玩转Koa之核心原理分析
  6. 使用客户端工具SecureCRT连接linux
  7. C++ 取模、求余运算
  8. 网络分层和Http协议原理
  9. ZOJ 1789 The Suspects(经典并查集)
  10. 【原创开源应用第2期】基于RL-USB和RL-FlashFS的完整NAND解决方案,稳定好用,可放心用于产品批量
  11. 角度转度分秒lisp函数_自改小程序,提示错误,运行另一个lisp后就不会出错,求帮忙!...
  12. Laya 【U3D场景的 .ls场景】 【Laya.URL.basePath远程加载】 【加载分包】,【进度条】
  13. 线性代数 —— 线性组合与线性表出,线性相关与线性无关
  14. 使用Python计算日期对应的周
  15. layer遮罩层 简单的遮罩层
  16. 如何基于SSM设计实现一个学生学籍管理系统
  17. 低学历转行3D建模有前途吗,游戏3D建模怎么样?
  18. ubuntu版本Linux系统中安装jira
  19. Java Web应用开发——作业一
  20. 百合数c语言360问答,关于百合花的资料

热门文章

  1. websphere 安装时数据源测试遇到的问题。
  2. c语言 10 -n次方,【零基础搞定C语言——10】
  3. 安卓图片手势缩放-源码
  4. 最小生成树——kruskal算法和prim算法
  5. Android之使用HttpURLConnection进行网络编程
  6. Kaldi学习手记(三): Kaldi 的I/O机制
  7. 网桥如何把信号传给服务器,无线网桥有怎样的传输方式
  8. 又一知名云盘翻车:“免费不限量”变收费,用户被骗 5 年!
  9. 总结关于找工作的20条经验
  10. 朋友圈微信额度测算,请谨慎点击!