Pandas数据分析实战案例之青春有你2(获取人物名称与头像)
Pandas数据分析实战案例之青春有你2
看前须知:如果有需要借鉴的地方的话,可以把 导出数据 和 下载图片 的地址改掉。除此以外,可能定义函数的时候里面的 获取资料地址有误 ,会显示404,在文章末尾处会附上相应解决方法。
任务:
- 获取参加鹅厂比赛小姐姐的姓名
- 获取小姐姐们的头像图片
代码如下:
1. 导入所需库
# 导入库
import pandas as pd
import requests
import json
2. 接下来是定义从爱奇艺平台获取信息的一个函数:
def get_aqiyi_infos():"""获取资料地址:http://www.iqiyi.com/h5act/generalVotePlat.html?activityId=373"""# 获取urlurl = "https://vote.iqiyi.com/vote-api/r/getMergeVoteInfo?voteIds=0896558730010825&sourceId=1&uid=&sign=7461535834340ff3861fc4e1bf73cbaf"# 添加headersheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}# 发起请求response = requests.get(url, headers=headers)# 解析请求--解析成字典json_data = json.loads(response.text)# 提取选手信息——使用字典索引的方式player_infos = json_data['data']['0896558730010825']['childs'][0]['options']# 提取信息——利用for循环rank_num = []names = []images = []for i, j in enumerate(player_infos):rank_num.append(i+1)names.append(j.get('text'))# images.append(j.get('picURL'))images.append(j.get('picUrl'))# 保存信息df = pd.DataFrame({'rank_num': rank_num,'names': names,'images': images})return df
获取请求头 和 获取url 的方法在文末位置。
3. 接下来可以下运行一下函数:
# 运行函数
df = get_aqiyi_infos()
4. 导出数据
# 导出数据
df.to_csv('E:/学习文件/Python数据分析/爱奇艺选手信息.csv', index=False)
5. 下载图片
# 下载图片
for name, image in zip(df['names'], df['images']):#请求图片urlheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}r = requests.get(image, headers=headers)# 创建新的图片f = open('E:/学习文件/Python数据分析/青春有你2photo/{}.png'.format(name), 'wb')# 写入图片内容f.write(r.content)# 关闭f.close()
发现问题:
1. 在存档的文件中并没有图片信息
2. 运行后报错
MissingSchema: Invalid URL 'None': No schema supplied. Perhaps you meant http://None?
解决问题:
这个其实也是由于自己的粗忽大意造成的
- 首先,出错的位置如下图所示
- 我们要提取的地方如下图所示
- 总结应该是picUrl,而不是picURL。
获取资料地址方法
- 在浏览器搜索爱奇艺,进入官方平台后,搜索青春有你2可以进入如下页面,注意右下角的二维码
- 将二维码图片另存为随便位置即可
- 在浏览器上输入网址http://cli.im/deqr
- 将保存的二维码图片拖入即可生成网址静态码
请求头获取方法
- 打开网页——开发者工具——右键检查——导航栏处点击Network——CTRL+R进行刷新
- 一般是点击XHR,按照下图找到请求头
url获取方法
与上述获取请求头的方法一致,如下图所示
Pandas数据分析实战案例之青春有你2(获取人物名称与头像)相关推荐
- Pandas数据分析实战01--Abalone Data Set(鲍鱼数据集)
Pandas数据分析实战01 1. 数据描述 2. 数据读取 3. 数据呈现 4. 数据分析 打算从基础开始学习数据分析,给自己一个整理内容和学习消化的时间,所以,这也将成为我的学习笔记. 1. 数据 ...
- python朋友圈点赞统计_Python数据分析实战案例:统计分析微信朋友圈数据(附实操视频)...
原标题:Python数据分析实战案例:统计分析微信朋友圈数据(附实操视频) 本文内容将通过一个具体实例讲解将朋友圈数据导出为JSON文件的方法,并介绍使用Python统计分析JSON数据的过程. 注: ...
- pandas数据分析实战之apply函数应用
使用apply函数与字符匹配进行数据分析 1.apply函数使用 2.字符串匹配 3.数据分析实战 1.apply函数使用 DataFrame.apply(self, func, axis=0, ra ...
- Pandas数据分析28——案例-销售额同期比分析、爬取各国新冠死亡人数等
参考书目:<深入浅出Pandas:利用Python进行数据处理与分析> pandas里面各个模块基本都展示得差不多了,后面就是使用pandas进行数据分析的案例.由于pandas的处理都是 ...
- 20 个 Pandas 数据实战案例,干货多多
作者 | 俊欣 来源 | 关于数据分析与可视化 今天我们讲一下pandas当中的数据过滤内容,小编之前也写过也一篇相类似的文章,但是是基于文本数据的过滤,大家有兴趣也可以去查阅一下. 下面小编会给出大 ...
- python数据分析实战案例-Python数据分析案例实战
原标题:Python数据分析案例实战 至今我们网站已经开设了多个数据分析系列的课程,大部分都是基于算法思路来开展的,课程中着重点在于算法的讲授.软件的使用,案例只是辅助学习.然而很多学员反映,希望可以 ...
- 数据分析实战案例:手把手教你用 Python 分析千万级淘宝数据
1.项目背景与分析说明 1)项目背景 网购已经成为人们生活不可或缺的一部分,本次项目基于淘宝app平台数据,通过相关指标对用户行为进行分析,从而探索用户相关行为模式. 2)数据和字段说明 本文使用的数 ...
- Python 数据分析实战案例:基于电商销售数据的 RFM 模型构建
目录 1.背景 2.分析目标 3.数据准备 4.数据清洗 4.1 查看是否含有缺失值 4.2 查看是否有异常值 4.3 数据整理 5.具体目标分析 5.1 分析每年销售额的增长率 5.2 各个地区分店 ...
- Python 数据分析实战案例:京东用户行为分析
1.项目背景 项目对京东电商运营数据集进行指标分析以了解用户购物行为特征,为运营决策提供支持建议.本文采用了MySQL和Python两种代码进行指标计算以适应不同的数据分析开发环境. 2.数据集介绍 ...
最新文章
- android读取excel数据库,Android 读取Excel数据并保存在本地数据库
- arm linux下编译库System.Net.Primitives.dll和System.Xml.XmlSerializer.dll
- Centos7下关闭带验证的MongoDB
- c# winform 应用编程代码总结 5
- 用示例说明BitMap索引的效率要优于B-Tree索引
- java中sql之count_按SQL Server中的count()子句分组
- Spark面对OOM问题的解决方法及优化总结
- linux 进程0 写时复制,linux 写时复制 COW 过程梳理
- sql 语句高级用法常用合集
- 计算机二级考风考纪主题班会,计算机二级C语言上机题库及答案(100套).doc
- 华为U8150(IDEOS)手机USB驱动安装
- webpack打包提示: The following entrypoint(s) combined asset size exceeds the recommended limit
- CVPR2021——SurFree:一个快速的无代替模型的黑盒攻击
- 将压缩包变成图片的小技巧
- 极具挑战性的工作:升级模式库从CQ2002到CQ7
- arduino液晶显示屏与温湿度传感器连接
- ECC(椭圆曲线密码编码学)简介
- 下载到的电子书格式是epub,这种格式如何打开?
- ADI推出最新全面的无线传感器开发套件
- 《信息安全保障》一第3章 信息安全管理基础
热门文章
- android:gravity=“bottom|center_horizontal“的妙用
- Arduino Uno R3开发(1)——据说通过蜂鸣器可以播放《鸡你太美》?
- 离奇的std::map、std::set崩溃
- 2021-10-03:室友自学c语言的第五天--单向链表
- Word中插入图片不清晰、分辨率较低的问题解决方案(VISIO\MATLAB)
- visio导出高质量图片
- C语言的seekg函数,c++ fstream中seekg()和seekp()的用法
- 词袋BOW与CBOW的区别
- 不为悦人,只为悦己,用python画出属于自己的小屋
- LSTM(长短记忆网络)