如何用python完成评分功能呢_利用python基于电影评分数据进行
本文以Movielens 1M数据集为例,利用Python,对电影的各项数据进行分析,分析对于不同的性别的电影评分,以及性别差异对评分的差异
加载python库以及数据:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
pd.options.display.max_rows = 10
unames = ['user_id', 'gender', 'age', 'occupation', 'zip']
users = pd.read_table('datasets/movielens/users.dat', sep='::',
header=None, names=unames)
rnames = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table('datasets/movielens/ratings.dat', sep='::',
header=None, names=rnames)
mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('datasets/movielens/movies.dat', sep='::',
header=None, names=mnames)
验证数据加载工作是否一切顺利:
按性别计算每部电影的平均得分:
mean_ratings = data.pivot_table('rating', index='title',
columns='gender', aggfunc='mean')
mean_ratings[:5]
ratings_by_title = data.groupby('title').size()
ratings_by_title
data['title'].value_counts()
ratings_by_title[:10]
active_titles = ratings_by_title.index[ratings_by_title >= 250]
active_titles
mean_ratings = mean_ratings.loc[active_titles]
mean_ratings
计算得分分歧:
mean_ratings = mean_ratings.rename(index={'Seven Samurai (The Magnificent Seven) (Shichinin no samurai) (1954)':
'Seven Samurai (Shichinin no samurai) (1954)'})
top_female_ratings = mean_ratings.sort_values(by='F', ascending=False)
top_female_ratings[:10]
mean_ratings['diff'] = mean_ratings['M'] - mean_ratings['F']
sorted_by_diff = mean_ratings.sort_values(by='diff')
sorted_by_diff[:10]
sorted_by_diff[::-1][:10]
欢迎大家微信交流:long715830
如何用python完成评分功能呢_利用python基于电影评分数据进行相关推荐
- python实现背景抠除_利用Python代码实现一键抠背景功能
这篇文章主要给大家介绍了关于如何利用Python代码实现一键抠背景的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧 前 ...
- python制作心形照片墙_利用python生成照片墙的示例代码
PIL(Python Image Library)是python的第三方图像处理库,但是由于其强大的功能与众多的使用人数,几乎已经被认为是python官方图像处理库了.其官方主页为:PIL. PIL历 ...
- python用渐变色画圆_利用python控制Autocad:pyautocad方式
发现pyautocad模块:可以用python控制autocad的包.今天把文档中的重点内容摘录出来,以后绘图.计算大工程量.或者识别施工图的时候时候也许可以用到. 一.连接cad pyautocad ...
- python硬件编程智能家居_利用 Python 的力量,实现 Tableau 与智能家居系统集成
导语 你有想过将智能家居和 Tableau 结合么?Tableau 爱好者 Ann Jackson 就在自己家中,尝试实现将智能家居系统与 Tableau 仪表板集成在一起.根据灯光颜色非常" ...
- python beautifulsoup抓取网页内容_利用Python和Beautiful Soup抓取网页内容
利用Python和Beautiful Soup抓取网页内容 Posted on 2012-08-09 00:08 SamWei 阅读(381) 评论(1) 编辑 收藏 Python 3中提供了url打 ...
- python输入数组并计算_利用Python进行数据分析——Numpy基础:数组和矢量计算
利用Python进行数据分析--Numpy基础:数组和矢量计算 ndarry,一个具有矢量运算和复杂广播能力快速节省空间的多维数组 对整组数据进行快速运算的标准数学函数,无需for-loop 用于读写 ...
- python连接linux堡垒机_利用Python Paramiko开发linux堡垒机
1.Paramiko模块下的demo.py程序 前面利用Python中的Paramiko模块可以进行SSH的连接,以及用来传送文件(SFTP),但是无论是哪一种方式,连接都是短暂的,并非是长连的,即一 ...
- python 翻译库本地库_利用python爬取并翻译GEO数据库
原标题:利用python爬取并翻译GEO数据库 GEO数据库是NCBI创建并维护的基因表达数据库,始于2000年,收录了世界各国研究机构提交的高通量基因表达数据,现芯片集数据量高达12万以上.想要从这 ...
- python实现英文新闻摘要自动提取_利用Python实现摘要自动提取,完美瘦身只需一行代码...
原标题:利用Python实现摘要自动提取,完美瘦身只需一行代码 今天给大家推荐一个也可以用于关键字提取的算法TextRank,但主要实现的功能是快速从长篇新闻中抽取精准摘要. 前言介绍 TextRan ...
最新文章
- uva 10256 The Great Divide (Convex Hull, Simple)
- Go 读取 yaml 文件并解析
- Selenium之Android使用学习
- Java用户账号和密码登录
- Mybatis学习笔记18 - 缓存
- 图像、帧、片、NALU(firstime)
- C++学习之路 | PTA乙级—— 1071 小赌怡情 (15 分)(精简)
- 跟着锅子一步步学习32位汇编(1)---第一个汇编程序
- python二级题库(百分之九十原题) 刷题软件推荐 第二套
- 偏最小二乘法(PLS)Python代码
- 易基因|干货:m6A RNA甲基化MeRIP-seq测序分析实验全流程解析
- ElementUI表格表头对角线的绘制
- 解决Xstream中解析报文出现Cannot parse date的异常问题
- JS 获取指定日期所在(周或月)第一天和最后一天
- 编程语言介绍以及特点
- python拆分pdf文件
- BW项目随手记:SAP 采购单位和基本计量单位转换关系
- Amazon Redshift ML现已正式推出——使用SQL创建机器学习模型并通过您的数据进行预测
- 利用MATLAB模糊控制器实现对水位高度调节SIMULINK仿真(隶属度7分级)
- 最短路径的模板-摘自宫水三叶
热门文章
- 谷粒商城之商品服务-平台属性-属性组管理
- 利用官方工具重装电脑Windows10系统(含下载链接)(亲测有效)
- [DT框架使用教程01]如何在DT框架中创建插件
- 阿里云安装Mysql报错
- c语言红外解码程序,[转载]红外遥控和C语言51红外遥控解码程序设计实例
- 质量意识培训 故事之3
- matlab text黑体,MATLAB论文利用MATLAB研究黑体辐射规律.doc
- python笔记--列表、集合和字典推导式
- android 开源 脚手架,baseFrame
- javascript英语单词音节拆分_英语音节知识