movielens电影数据分析
电影数据分析
下载数据
https://grouplens.org/datasets/movielens/
之前一直都不太理解绝对路径和相对路径:
今天才有点明白,大概就是就说,你写了一段代码你要发给别人,然后你就打了个包,你代码里面那就不能用绝对路径,要不别人打不开。
数据读取
import pandas as pd
unames = ('user_id','gender','age','occupation','zip')
users = pd.read_table(r'C:\Users\Administrator\Desktop\ml-1m\users.dat',sep='::',header=None,names=unames)
print(len(users))
rating_names = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table(r'C:\Users\Administrator\Desktop\ml-1m\ratings.dat', sep='::', header=None, names=rating_names, engine='python')
print(len(ratings))
movie_names = ['movie_id', 'title', 'genres']
movies = pd.read_table(r'C:\Users\Administrator\Desktop\ml-1m\movies.dat', sep='::', header=None, names=movie_names, engine='python')
print(len(movies))
数据合并
3个文件里的数据分别有:
users.head(5)
ratings.head(5)
movies.head(5)
合并三个表格的数据
data = pd.merge(pd.merge(users,ratings),movies)#合并三个表格
data.head(10)#输出合并后表格前10行
查看同一用户对不同电影的评分
data[data.user_id==1]#用户序列是1的用户的所有评分
按性别查看电影平均评分
#看每一部电影不同性别的平均得分
ratings_by_gender = data.pivot_table(values='rating',index='title',columns='gender',aggfunc='mean')
ratings_by_gender.head(10)
按性别查看评分相差最大的电影
#男女意见相差最大的评分的电影
ratings_by_gender['diff'] = ratings_by_gender.F - ratings_by_gender.M#先搞出评分相差
ratings_by_gender.head(10)
ratings_by_gender.sort_values(by='diff',ascending='True').head(10)#评分相差按降序排列
获取评分最多的电影
#获取评分最多的电影
ratings_by_title = data.groupby('title').size()
ratings_by_title.head(10)
获取评论量前10的电影
ratings_by_title.sort_values(ascending=False).head(10)#评论量前十的电影
好的电影
top_ratings = ratings_by_movie_title[ratings_by_movie_title > 1000]
top_10_ratings = top_ratings.sort_values(ascending=False).head(10)
hot_movies = ratings_by_title[ratings_by_title > 1000]
hot_movies_rating = mean_ratings[hot_movies.index]
top_10_good_movies = hot_movies_rating.sort_values.(ascending=False).head(10)
movielens电影数据分析相关推荐
- 机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析
电影数据分析 准备工作 从网站 grouplens.org/datasets/movielens 下载 MovieLens 1M Dataset 数据. 数据说明 参阅数据介绍文件 README.tx ...
- 【机器学习-数据科学】第三节:数据分析实例 分析MovieLens电影数据
数据分析实例 分析MovieLens电影数据 导入数据 数据合并 按性别查看各个电影的平均评分 活跃电影排行榜 电影投票数据 grouplens.org/datasets/movielens 把文件放 ...
- python电影数据分析的代码_python-small-examples
Kaggle电影数据分析实战 本项目基于Kaggle电影影评数据集,通过这个系列,你将学到如何进行数据探索性分析(EDA),学会使用数据分析利器pandas,会用绘图包pyecharts,以及EDA时 ...
- 大数据项目开发案例_大数据分析技术——项目案例1(猫眼电影数据分析上)...
壹 猫眼Top100电影数据分析概述 从这一节开始,我们就综合利用已学到的一些分析技术来尝试做一些比较复杂的实际数据分析项目.在这些实际的项目案例中,我们将会看到一个完整的数据分析流程:数据清理--数 ...
- Rotten Tomatoes 电影数据分析
"烂番茄"电影数据分析 "烂番茄"电影数据分析 背景 数据采集及处理 数据可视化 得出结论 背景 一千个读者眼中有一千个哈姆雷特, 看电影也是一种艺术鉴赏活动, ...
- Tableau制作全球电影数据分析/全球超市利润混合地图
数据集,课程,作业文件打包放在github上 https://github.com/JCATHoney/tableau 作业5: 1.创建产地电影数量与评分(以此命名)的符号地图,处理未知位置信息,以 ...
- 豆瓣电影数据分析--Tableau
数据说明:原始数据为1888年-2016年上映电影数据,由于年份跨度较大且部分年份数据缺失,故抽取1990年-2015年电影数据分析. 第一部分:整体上映电影数分析 仪表盘: 感觉这个排版有点挤,显示 ...
- python基于爬虫技术的海量电影数据分析源码,数据处理分析可视化,GUI界面展示
基于爬虫技术的海量电影数据分析 介绍 一个基于爬虫技术的海量电影数据分析系统 系统架构 本系统主要分为四个部分,分别为后端爬虫抓取.数据处理分析可视化.GUI界面展示.启动运行,分别对应getData ...
- python猫眼电影分析_用Python 爬取猫眼电影数据分析《无名之辈》
前言 作者: 罗昭成 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 http://note.youdao.com/noteshare?id=3054cce4add8a909e7 ...
- 电影数据分析练习——ppt报告
电影数据分析练习
最新文章
- Kaggle金牌拿Offer有多简单?
- wangEditor - 轻量级web富文本编辑器(可带图片上传)
- 求高精度幂(java)
- 使用Docker中的mysql
- WPF,Silverlight与XAML读书笔记第八 - WPF新概念之三路由事件
- 新一代的编译工具 SWC,97年小哥写的~
- html如何查看文档,查看文档
- [Err] 1231 - Variable 'sql_mode' can't be set to the value of 'NULL
- android获取程序名称,Android获取应用程序名称(ApplicationName)示例
- C# 模拟Form提交
- python调用cmd执行命令_python怎么运行cmd命令
- 【基础】创建react脚手架
- 攻防世界 ics-05
- 联想电脑关闭HotKey (热键模式),使用快捷功能时才需按Fn
- ug998逻辑思维导图
- 开启子进程的两种方法
- 32x32Booth乘法器
- Web地图服务发布及运维方案
- 生命游戏和随机数之间某种不可言说的秘密
- 论文笔记----Selective Transfer Learning for EEG-Based Drowsiness Detection
热门文章
- android反编译修改教程,Android逆向反编译代码注入
- HttpModule 与 Globle.asax
- 我对SegNet的理解
- 对线性系统用matlab进行仿真,基于线性系统稳定性分析及MATLAB仿真与应用[1]
- 巫师3储物箱在哪_巫师三孤岩宝箱在哪 | 手游网游页游攻略大全
- 步进电机驱动器怎么设置细分
- 大专大一计算机应用基础期末考试题,计算机基础大一考试题及答案
- hackintosh黑苹果_如何构建用于编码的Hackintosh
- 一个学习代码的好网站
- matlab fft2 fftshift,matlab fft fftshift