一、数据加载

数据源及代码:https://pan.baidu.com/s/1bSqZWOcqeJTkMFz7BLtTvA
提取码:kf8r
视频地址:网易云课堂

引包:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

数据加载

movie_path = 'movies.dat'
user_path = 'users.dat'
rating_path = 'ratings.dat'movie_data = pd.read_csv(movie_path,sep="::",names=['movie_id','movie_name','movie_type'],header=None,engine="python")
user_date = pd.read_csv(user_path,sep="::",header=None,engine="python",names=["user_id","gender","age","occupation","zip_code"])
rating_data = pd.read_csv(rating_path,sep="::",header=None,names=["user_id","movie_id","rating","timestamp"],engine='python')

查看数据

二、数据预处理

数据合并


三、数据分析

1.平均分排名

2.不同性别对电影的平均评分


3.不同性别争议最大电影


可视化

4.评分次数最多热门的电影

5.不同年龄段争议最大的电影


Pandas数据处理项目----好莱坞评分数据分析相关推荐

  1. python numpy和pandas数据处理_python中添加数据分析工具numpy和pandas

    python中添加数据分析工具numpy和pandas 最近要对一系列数据做同比比较,需要用到numpy和pandas来计算,不过使用python安装numpy和pandas因为linux环境没有外网 ...

  2. 大数据Spark电影评分数据分析

    目录 1 数据 ETL 2 使用 SQL 分析 3 使用 DSL 分析 4 保存结果数据 5 案例完整代码 6 Shuffle 分区数目问题 1 数据 ETL 使用电影评分数据进行数据分析,分别使用D ...

  3. pandas数据处理120题

    1.DataFrame基本操作 import numpy as np import pandas as pd import matplotlib.pyplot as plt 1.将下面的字典创建为Da ...

  4. 12 个 Pandas 数据处理高频操作

    作者 | 老表 来源 | 简说Python 今天给大家分享几个自己近期常用的Pandas数据处理技巧,主打实用,所以你肯定能用的着,建议扫一遍,然后收藏起来,下次要用的时候再查查看即可. 简单说说 总 ...

  5. pandas数据处理 代码_使用Pandas方法链接提高代码可读性

    pandas数据处理 代码 We have been talking about using the Pandas pipe function to improve code readability. ...

  6. Rust vs Pandas 数据处理

    文章目录 介绍 1.读取和即时数据 2.过滤 3.分组 4.Mutation 5. Merge 结论 原文连接: https://rustmagazine.github.io/rust_magazin ...

  7. 视频教程-微信小程序项目-豆瓣评分-微信开发

    微信小程序项目-豆瓣评分 北京八维研修学院技术工程师,5年大型项目实战开发经验,3年授课经验. 孟宪杰 ¥68.00 立即订阅 扫码下载「CSDN程序员学院APP」,1000+技术好课免费看 APP订 ...

  8. 大数据实战-callLog项目(通话记录数据分析)之数据生产

    文章目录 前言 生成基础数据 Maven依赖 姓名-手机号列表 时间维度表 自动随机生成 生成时间戳 生成一定范围内的long数据 代码 调用演示 获得随机的时间戳 代码 调用示例 生成一行记录 打包 ...

  9. pandas玩转Excel及数据分析(一) 概述

    一. pandas简介 1. 什么是pandas pandas 是基于NumPy 的一种工具,该工具是为解决数据分析任务而创建的. Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型 ...

最新文章

  1. MySQL数据库开发常见问题及几点优化!
  2. 北大95后「AI萝莉」回来了,一次中8篇顶会论文的她,现在达摩院开源7大NLP模型...
  3. 通过学历造假获得面试机会,并成功拿到 Offer,这样的操作你认可吗?
  4. debian 开发版 移植_迅雷X Linux版(Debian系通用)
  5. 混合图 (Standard IO)
  6. Pattern-No.07 设计模式之单例模式
  7. 弹出窗口里面的子页面控制父页面的解决办法
  8. php fast cgi nginx,通过fast-cgi连接php-fpm和nginx之间的连接是持久的(保持活动)连接吗?...
  9. SPOJ GSS2 Can you answer these queries II (线段树离线) - xgtao -
  10. zabbix编译安装
  11. smarty模板引擎
  12. 五子棋c语言算杀算法,c语言 五子棋危险判断 求大神解释啊
  13. linux把一个文件拷贝到另一个目录,linux把某个文件拷贝到不同的目录下面
  14. 雷云云服务器文件夹,配置文件云存储 雷蛇Synapse2.0_雷蛇鼠标_键鼠评测-中关村在线...
  15. NumberOptional:一个字符串转数字的工具
  16. 【知识】SpringBoot项目结构目录
  17. 自定义View-仿QQ运动步数进度效果(完整代码)
  18. 新加坡以人为本的交通设计理念与交通组织视野
  19. 服务器只读团体字信息,服务器团体名配置
  20. python中------decode解码出现的0xca问题解决方法

热门文章

  1. springboot+mybatis-plus+vue完成微信支付(前后端分离)
  2. 作为产品经理,我对发展趋势有三个判断!
  3. 计算机基础教学评价ppt,教学PPT课件:教学PPT的设计原理和评价标准
  4. Git基础(三)--常见错误及解决方案
  5. 小米电视盒服务器维护,告别小白!小米电视/盒子不为人知的设置技巧
  6. Linux设备模型——设备驱动模型和sysfs文件系统解读笔记
  7. B. Combinatorics Homework(抽屉原理)
  8. 【详解+推导!!】PPO 近端策略优化
  9. facebook语言_如何在Facebook上更改语言设置
  10. java对txt文件操作_Java读取txt文件信息并操作。