Pandas数据处理项目----好莱坞评分数据分析
一、数据加载
数据源及代码:https://pan.baidu.com/s/1bSqZWOcqeJTkMFz7BLtTvA
提取码:kf8r
视频地址:网易云课堂
引包:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
数据加载
movie_path = 'movies.dat'
user_path = 'users.dat'
rating_path = 'ratings.dat'movie_data = pd.read_csv(movie_path,sep="::",names=['movie_id','movie_name','movie_type'],header=None,engine="python")
user_date = pd.read_csv(user_path,sep="::",header=None,engine="python",names=["user_id","gender","age","occupation","zip_code"])
rating_data = pd.read_csv(rating_path,sep="::",header=None,names=["user_id","movie_id","rating","timestamp"],engine='python')
查看数据
二、数据预处理
数据合并
三、数据分析
1.平均分排名
2.不同性别对电影的平均评分
3.不同性别争议最大电影
可视化
4.评分次数最多热门的电影
5.不同年龄段争议最大的电影
Pandas数据处理项目----好莱坞评分数据分析相关推荐
- python numpy和pandas数据处理_python中添加数据分析工具numpy和pandas
python中添加数据分析工具numpy和pandas 最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网 ...
- 大数据Spark电影评分数据分析
目录 1 数据 ETL 2 使用 SQL 分析 3 使用 DSL 分析 4 保存结果数据 5 案例完整代码 6 Shuffle 分区数目问题 1 数据 ETL 使用电影评分数据进行数据分析,分别使用D ...
- pandas数据处理120题
1.DataFrame基本操作 import numpy as np import pandas as pd import matplotlib.pyplot as plt 1.将下面的字典创建为Da ...
- 12 个 Pandas 数据处理高频操作
作者 | 老表 来源 | 简说Python 今天给大家分享几个自己近期常用的Pandas数据处理技巧,主打实用,所以你肯定能用的着,建议扫一遍,然后收藏起来,下次要用的时候再查查看即可. 简单说说 总 ...
- pandas数据处理 代码_使用Pandas方法链接提高代码可读性
pandas数据处理 代码 We have been talking about using the Pandas pipe function to improve code readability. ...
- Rust vs Pandas 数据处理
文章目录 介绍 1.读取和即时数据 2.过滤 3.分组 4.Mutation 5. Merge 结论 原文连接: https://rustmagazine.github.io/rust_magazin ...
- 视频教程-微信小程序项目-豆瓣评分-微信开发
微信小程序项目-豆瓣评分 北京八维研修学院技术工程师,5年大型项目实战开发经验,3年授课经验. 孟宪杰 ¥68.00 立即订阅 扫码下载「CSDN程序员学院APP」,1000+技术好课免费看 APP订 ...
- 大数据实战-callLog项目(通话记录数据分析)之数据生产
文章目录 前言 生成基础数据 Maven依赖 姓名-手机号列表 时间维度表 自动随机生成 生成时间戳 生成一定范围内的long数据 代码 调用演示 获得随机的时间戳 代码 调用示例 生成一行记录 打包 ...
- pandas玩转Excel及数据分析(一) 概述
一. pandas简介 1. 什么是pandas pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型 ...
最新文章
- MySQL数据库开发常见问题及几点优化!
- 北大95后「AI萝莉」回来了,一次中8篇顶会论文的她,现在达摩院开源7大NLP模型...
- 通过学历造假获得面试机会,并成功拿到 Offer,这样的操作你认可吗?
- debian 开发版 移植_迅雷X Linux版(Debian系通用)
- 混合图 (Standard IO)
- Pattern-No.07 设计模式之单例模式
- 弹出窗口里面的子页面控制父页面的解决办法
- php fast cgi nginx,通过fast-cgi连接php-fpm和nginx之间的连接是持久的(保持活动)连接吗?...
- SPOJ GSS2 Can you answer these queries II (线段树离线) - xgtao -
- zabbix编译安装
- smarty模板引擎
- 五子棋c语言算杀算法,c语言 五子棋危险判断 求大神解释啊
- linux把一个文件拷贝到另一个目录,linux把某个文件拷贝到不同的目录下面
- 雷云云服务器文件夹,配置文件云存储 雷蛇Synapse2.0_雷蛇鼠标_键鼠评测-中关村在线...
- NumberOptional:一个字符串转数字的工具
- 【知识】SpringBoot项目结构目录
- 自定义View-仿QQ运动步数进度效果(完整代码)
- 新加坡以人为本的交通设计理念与交通组织视野
- 服务器只读团体字信息,服务器团体名配置
- python中------decode解码出现的0xca问题解决方法
热门文章
- springboot+mybatis-plus+vue完成微信支付(前后端分离)
- 作为产品经理,我对发展趋势有三个判断!
- 计算机基础教学评价ppt,教学PPT课件:教学PPT的设计原理和评价标准
- Git基础(三)--常见错误及解决方案
- 小米电视盒服务器维护,告别小白!小米电视/盒子不为人知的设置技巧
- Linux设备模型——设备驱动模型和sysfs文件系统解读笔记
- B. Combinatorics Homework(抽屉原理)
- 【详解+推导!!】PPO 近端策略优化
- facebook语言_如何在Facebook上更改语言设置
- java对txt文件操作_Java读取txt文件信息并操作。