数据分析案例 |【01】电影数据分析
文章目录
- 一、准备数据
- 二、数据分析小题目
- 三、开始分析问题
- 四、完整代码
一、准备数据
电影数据 提取码:nxi7
二、数据分析小题目
- 获取评分的平均分
- 获取导演数量
- 呈现Rating、Runtime的分布情况
- 对电影进行分类统计genre
三、开始分析问题
首先使用
pandas
中的read_csv
读取表格中的数据。
data = pd.read_csv('./IMDB-Movie-Data.csv')data.head(20)
- 获取评分中的平均分
可知,
rating
这个一列就是评分的数据,题中要求评分的平均分。
"""一、获取评分的平均分result ==> 6.72
"""
score = data['Rating'].mean() // 在这里直接取出这个列的值,在通过mean求均值即可。print(round(score, 2)) // 使用round函数对结果保留两位小数
- 获取导演数量
可直接读取导演这一列数据,但需要考虑一点不同电影的导演可能是同一个。所有最后要在对导演进行去重操作。在
numpy
中可直接.unique()
即可去重。
"""二、获取导演数量1、取出所有的列2、需要去重result ==> 644"""
data['Director'].unique().shape[0]
- 呈现Rating、Runtime的分布情况
"""三、呈现Rating、Runtime的分布情况1、取出数据2、将数据进行分割成20组来确定x轴刻度
"""
plt.figure(figsize=(20, 8), dpi=80) # 创建画布
temp = data['Rating'].values # 取值
plt.hist(temp, bins=20) # 绘制图像
x = np.linspace(temp.min(), temp.max(), 21) # 在最大值和最小值中切片取出21个值plt.xticks(x) # 加入x轴坐标plt.grid() # 加入网格
plt.show()
- 对电影进行分类统计genre
"""四、对电影进行分类统计genre1、将改列取出,并取出所有的类别进行去重,获取类别2、重新创建一个建表以类别为列索引3、对改表进行赋值操作4、在进行求和排序
"""
temp_list = [i.split(',') for i in data["Genre"]] # 将每一部电影的类型都切割成数组
columns = set([j for i in temp_list for j in i]) # 取出所有类型,并去重zero_df = pd.DataFrame(np.zeros([data.shape[0], len(columns)]), columns=columns, dtype="int64") # 重新构建为0的数组for i in range(data.shape[0]): zero_df.loc[i, temp_list[i]] = 1 # 遍历每一部电影的类型x = zero_df.sum().sort_values()# 求和排序
x_list = range(len(index)) # x轴个数
index = x.index # x轴标签plt.figure(figsize=(20, 8), dpi=80) # 设置画布rects = plt.bar(x_list,x, width=0.5) # 配置标签
plt.xticks(x_list, index, rotation=45, fontsize=20)
plt.yticks(range(min(x),max(x),50), fontsize=20)# 设置每个条行的值
for rect in rects:height = rect.get_height() plt.text(rect.get_x() + rect.get_width() / 2, height+1, str(height), ha='center',fontsize=20)plt.show()
本次是一个小习题,在初步学习了
pandas
、numpy
、matplotlib
的同学们可以练习一下这道题,来提升一下自己对这几个模块的掌握程度。图形绘制在练习完上面的,可以自己在使用一下其他绘制方法,绘制成其他图形看看效果如何,来提升自己的能力。数据分析案例 |【01】电影数据分析相关推荐
- 数据分析案例之电影推荐
前言 通过案例来学习数据分析的思路和练习相应分析工具,往往最有效的.本文用julia来进行全流程的探索和分析,以期达到既掌握分析思路,又练习了这一新兴的数据科学利器.同时,个性化推荐是个太大的topi ...
- Python数据分析案例17——电影人气预测(特征工程构建)
案例背景 本次案例是中国人民大学"人工智能与机器学习(2022年秋季)"课程的课堂竞赛. 比赛是根据有关电影的各种信息来预测电影的受欢迎程度,包括演员.工作人员.情节关键字.预算. ...
- 【案例】电影数据分析
文章目录 数据集 数据加载 数据探索和清洗 评分最多电影 评分最高 分析评分人数中最多的百部电影 评分与年龄关系 数据集 数据集包含3个csv文件,文件中包含电影名字,发行时间,评分用户信息,评分等信 ...
- 数据分析案例--01 城市餐饮店铺选址分析
城市餐饮店铺选址分析 数据下载链接: 链接:https://pan.baidu.com/s/1l2-EEMhK0-n8gFPLuOHb1g 提取码:7olt 要求: 1.从三个维度"口味&q ...
- 数据分析案例-四川省旅游景点数据分析
数据集介绍 数据为四川省的各旅游景点信息,特征有景点名称.星级.城市.票价.销量.热度6个维度,部分数据如下: 加载数据 首先要导入本次项目用到的第三方包和数据 import pandas as pd ...
- 数据分析案例3 海量数据分析---根据Ip地址计算归属地的需求
给定的access.log是电信运营商的用户上网数据,第一个字段是时间,第二个字段是ip地址, 第三更字段是访问的网站,其他字段可以忽略不计. ip.txt是ip地址和归属地的规则数据,里面的数据是根 ...
- 来自Bitly的USA.gov数据,数据分析案例
数据分析案例01 xiaoyao 1.USA.gov Data from Bitly–来自Bitly的USA.gov数据 数据背景:2011年,URL缩短服务Bitly跟美国政府⽹站USA.gov合作 ...
- 月均数据_药品销售数据分析案例
今天用python去做一个简单的药品销售数据分析案例 一.数据分析的目的 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 本篇 ...
- Rotten Tomatoes 电影数据分析
"烂番茄"电影数据分析 "烂番茄"电影数据分析 背景 数据采集及处理 数据可视化 得出结论 背景 一千个读者眼中有一千个哈姆雷特, 看电影也是一种艺术鉴赏活动, ...
- 大数据项目开发案例_大数据分析技术——项目案例1(猫眼电影数据分析上)...
壹 猫眼Top100电影数据分析概述 从这一节开始,我们就综合利用已学到的一些分析技术来尝试做一些比较复杂的实际数据分析项目.在这些实际的项目案例中,我们将会看到一个完整的数据分析流程:数据清理--数 ...
最新文章
- Centos7-Mysql 5.6 多主一从 解决方案详细配置
- 狮山路将装上“智慧大脑”
- C语言简单题-求整数段和
- My Lead route attach and detach issue
- 什么是SNAT、DNAT?
- 刘汝佳训练指南——数论专题知识点总结:
- python调用函数怎么表示_Python---7函数(调用定义函数)
- 超过响应缓冲区限制_Nginx如何限制并发连接数和连接请求数?
- Linux系统故障处理案例(一)【转】
- 【学习框架】jeeSite 【maven项目】导入后转成web项目 【转载加原创】
- 鼠标不受控制一直向右移动的解决办法
- 微信小程序如何测试?
- LSB信息隐藏的卡方分析
- SpringCloud 单Eureka简单例子consumer-provider
- 游建慧:大山铺镇侧卧恐龙身畔的烟火人间骇伦
- yii2自动更新时间
- 生鲜电商有哪些盈利模式?
- 算法练习-鸡兔同笼问题
- 1tb等于多少g 1TB和500G有什么区别
- springboot整合tk-mybatis框架搭建
热门文章