本文以Movielens 1M数据集为例,利用Python,对电影的各项数据进行分析,分析对于不同的性别的电影评分,以及性别差异对评分的差异

加载python库以及数据:

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

pd.options.display.max_rows = 10

unames = ['user_id', 'gender', 'age', 'occupation', 'zip']

users = pd.read_table('datasets/movielens/users.dat', sep='::',

header=None, names=unames)

rnames = ['user_id', 'movie_id', 'rating', 'timestamp']

ratings = pd.read_table('datasets/movielens/ratings.dat', sep='::',

header=None, names=rnames)

mnames = ['movie_id', 'title', 'genres']

movies = pd.read_table('datasets/movielens/movies.dat', sep='::',

header=None, names=mnames)

验证数据加载工作是否一切顺利:

按性别计算每部电影的平均得分:

mean_ratings = data.pivot_table('rating', index='title',

columns='gender', aggfunc='mean')

mean_ratings[:5]

ratings_by_title = data.groupby('title').size()

ratings_by_title

data['title'].value_counts()

ratings_by_title[:10]

active_titles = ratings_by_title.index[ratings_by_title >= 250]

active_titles

mean_ratings = mean_ratings.loc[active_titles]

mean_ratings

计算得分分歧:

mean_ratings = mean_ratings.rename(index={'Seven Samurai (The Magnificent Seven) (Shichinin no samurai) (1954)':

'Seven Samurai (Shichinin no samurai) (1954)'})

top_female_ratings = mean_ratings.sort_values(by='F', ascending=False)

top_female_ratings[:10]

mean_ratings['diff'] = mean_ratings['M'] - mean_ratings['F']

sorted_by_diff = mean_ratings.sort_values(by='diff')

sorted_by_diff[:10]

sorted_by_diff[::-1][:10]

欢迎大家微信交流:long715830

如何用python完成评分功能呢_利用python基于电影评分数据进行相关推荐

  1. python实现背景抠除_利用Python代码实现一键抠背景功能

    这篇文章主要给大家介绍了关于如何利用Python代码实现一键抠背景的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧 前 ...

  2. python制作心形照片墙_利用python生成照片墙的示例代码

    PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了.其官方主页为:PIL. PIL历 ...

  3. python用渐变色画圆_利用python控制Autocad:pyautocad方式

    发现pyautocad模块:可以用python控制autocad的包.今天把文档中的重点内容摘录出来,以后绘图.计算大工程量.或者识别施工图的时候时候也许可以用到. 一.连接cad pyautocad ...

  4. python硬件编程智能家居_利用 Python 的力量,实现 Tableau 与智能家居系统集成

    导语 你有想过将智能家居和 Tableau 结合么?Tableau 爱好者 Ann Jackson 就在自己家中,尝试实现将智能家居系统与 Tableau 仪表板集成在一起.根据灯光颜色非常" ...

  5. python beautifulsoup抓取网页内容_利用Python和Beautiful Soup抓取网页内容

    利用Python和Beautiful Soup抓取网页内容 Posted on 2012-08-09 00:08 SamWei 阅读(381) 评论(1) 编辑 收藏 Python 3中提供了url打 ...

  6. python输入数组并计算_利用Python进行数据分析——Numpy基础:数组和矢量计算

    利用Python进行数据分析--Numpy基础:数组和矢量计算 ndarry,一个具有矢量运算和复杂广播能力快速节省空间的多维数组 对整组数据进行快速运算的标准数学函数,无需for-loop 用于读写 ...

  7. python连接linux堡垒机_利用Python Paramiko开发linux堡垒机

    1.Paramiko模块下的demo.py程序 前面利用Python中的Paramiko模块可以进行SSH的连接,以及用来传送文件(SFTP),但是无论是哪一种方式,连接都是短暂的,并非是长连的,即一 ...

  8. python 翻译库本地库_利用python爬取并翻译GEO数据库

    原标题:利用python爬取并翻译GEO数据库 GEO数据库是NCBI创建并维护的基因表达数据库,始于2000年,收录了世界各国研究机构提交的高通量基因表达数据,现芯片集数据量高达12万以上.想要从这 ...

  9. python实现英文新闻摘要自动提取_利用Python实现摘要自动提取,完美瘦身只需一行代码...

    原标题:利用Python实现摘要自动提取,完美瘦身只需一行代码 今天给大家推荐一个也可以用于关键字提取的算法TextRank,但主要实现的功能是快速从长篇新闻中抽取精准摘要. 前言介绍 TextRan ...

最新文章

  1. uva 10256 The Great Divide (Convex Hull, Simple)
  2. Go 读取 yaml 文件并解析
  3. Selenium之Android使用学习
  4. Java用户账号和密码登录
  5. Mybatis学习笔记18 - 缓存
  6. 图像、帧、片、NALU(firstime)
  7. C++学习之路 | PTA乙级—— 1071 小赌怡情 (15 分)(精简)
  8. 跟着锅子一步步学习32位汇编(1)---第一个汇编程序
  9. python二级题库(百分之九十原题) 刷题软件推荐 第二套
  10. 偏最小二乘法(PLS)Python代码
  11. 易基因|干货:m6A RNA甲基化MeRIP-seq测序分析实验全流程解析
  12. ElementUI表格表头对角线的绘制
  13. 解决Xstream中解析报文出现Cannot parse date的异常问题
  14. JS 获取指定日期所在(周或月)第一天和最后一天
  15. 编程语言介绍以及特点
  16. python拆分pdf文件
  17. BW项目随手记:SAP 采购单位和基本计量单位转换关系
  18. Amazon Redshift ML现已正式推出——使用SQL创建机器学习模型并通过您的数据进行预测
  19. 利用MATLAB模糊控制器实现对水位高度调节SIMULINK仿真(隶属度7分级)
  20. 最短路径的模板-摘自宫水三叶

热门文章

  1. 谷粒商城之商品服务-平台属性-属性组管理
  2. 利用官方工具重装电脑Windows10系统(含下载链接)(亲测有效)
  3. [DT框架使用教程01]如何在DT框架中创建插件
  4. 阿里云安装Mysql报错
  5. c语言红外解码程序,[转载]红外遥控和C语言51红外遥控解码程序设计实例
  6. 质量意识培训 故事之3
  7. matlab text黑体,MATLAB论文利用MATLAB研究黑体辐射规律.doc
  8. python笔记--列表、集合和字典推导式
  9. android 开源 脚手架,baseFrame
  10. javascript英语单词音节拆分_英语音节知识