python爬取vnd.openxmlformats-officedocument.spreadsheetml.sheet类型数据
这种数据类型是xlsx的数据格式,爬取此种类型的数据的时候,我们直接f12看到的返回数据是乱码的,如图,
要想获得这种数据,有两种方式,一是保存文件到xlsx文件里面,二是通过BytesIO可以直接得到
第一种:爬取的时候,requests里面添加参数stream=True,获得流式数据。得到的数据可以直接写入xlsx文件,打开文件可以看见
第二种:获取的数据通过BytesIO转换一下,再通过pandas打印或者保存起来,直接使用,例子如下:
import requests
import io
import pandas
json_data = ""
response = requests.post("url", json=json_data, stream=True)
res = pandas.read_excel(io.BytesIO(response.content))
python爬取vnd.openxmlformats-officedocument.spreadsheetml.sheet类型数据相关推荐
- python爬百度翻译-Python爬取百度翻译(利用json提取数据)
本篇文章给大家带来的内容是关于Python爬取百度翻译(利用json提取数据),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 工具:Python 3.6.5.PyCharm开发工具. ...
- 4ye含泪用python爬取了自己的公众号粉丝数据
4ye含泪用python爬取了自己的公众号粉丝数据 小伙伴们好呀,最近本来是在捣鼓Gateway的知识点的,结果被一件事情搞得心不在焉 哈哈哈哈,结果不得不先鸽下~ 搞完这件事情再继续哦!! ε=ε= ...
- 利用Python爬取《囧妈》豆瓣短评数据,并进行snownlp情感分析
利用Python爬取<囧妈>豆瓣短评数据,并进行snownlp情感分析 一.电影评论爬取 今年的贺岁片<囧妈>上映前后,在豆瓣评论上就有不少网友发表了自己的观点,到底是好评的声 ...
- 表哥用Python爬取数千条淘宝商品数据后,发现淘宝这些潜规则!
本文记录了笔者用 Python 爬取淘宝某商品的全过程,并对商品数据进行了挖掘与分析,最终得出结论. 项目内容 本案例选择商品类目:沙发. 数量:共 100 页 4400 个商品. 筛选条件:天猫. ...
- Python爬取影评并进行情感分析和数据可视化
Python爬取影评并进行情感分析和数据可视化 文章目录 Python爬取影评并进行情感分析和数据可视化 一.引言 二.使用requests+BeautifulSoup进行影评的爬取 1.分析界面元素 ...
- 刚刚用python爬取一千个微信朋友圈数据,他们的秘密原来这么多。
当下我们饮食起居基本上依靠微信,但微信不单单是1个即时通信软件,更像是仿真模拟的日常生活世界.你所处的微信朋友圈是咋样,慢慢地你的思想也会变的咋样.近几日在学习 itchat,并且写了1个网络爬虫,扒 ...
- python 怎么爬桌软件数据_如何利用Python爬取并分析红岭创投的数据?
第一步:爬取数据 通过 selenium + Firefox 的无头模式将需要的数据爬取出来,代码实现不在赘述,详细步骤可查看我的上一篇图文(如何利用Python爬取网易新闻), 由于 seleniu ...
- Python爬取《隐秘的角落》弹幕数据,实现简单可视化(附源码)
工具使用 开发环境: win10.python3.6 开发工具: pycharm 相关模块 : requests,stylecloud 思路分析 1.爬虫获取数据 爱奇艺的弹幕数据是以 .z 形式的压 ...
- 使用python爬取天气信息(包括历史天气数据)
使用Python爬虫获取城市天气信息(包括历史天气数据) 使用python爬取历史天气数据 文章目录 使用Python爬虫获取城市天气信息(包括历史天气数据) 一.准备工作 二.完整代码 更新 一.准 ...
- 用python爬取高考网历年高考分数线将数据放入MySQL并绘制图表
用python爬取高考网历年高考分数线 # 导入爬虫的库 import requests from lxml import etree # 导入画图库 from pyecharts.charts im ...
最新文章
- cartographer 配置过程
- 小鹏,该兑现PPT了
- 成功解决AttributeError: ‘Series‘ object has no attribute ‘name’
- Microsoft.CSharp.CSharpCodeProvider
- VTK:行军案用法实战
- 鸿蒙系统是安卓还是苹果,小雷问答丨鸿蒙系统到底和苹果安卓有什么区别?
- 【转载】从Docker容器漏洞谈Docker安全
- 更灵活、有个性的卷积——可变形卷积(Deformable Conv)
- 日程表|第8届高等学校计算机程序设计课程论坛
- python动态图形_利用matplotlib实现根据实时数据动态更新图形
- vue2.0项目部署到服务器_阿里云服务器搭建及项目部署过程---小白篇
- 大工18春《c和c语言程序设计》,东大21春《高级语言程序设计基础》在线平时作业1题目及答案...
- Java从入门到精通(一)
- 移动,电信,中行软开,微软,百度等企业工作纯技术性分析
- SpringCloud教程汇总
- linux rpm与deb 区别,rpm与deb的区别
- CS5218 DP转HDMI 4K30HZ转换方案
- Spring 4.x 源码系列4-创建bean实例
- 电子书籍制作工具软件大全
- 基于Web的文件管理系统,支持Office、WPS预览/编辑、在线解压缩、文件分享、文件加密、远程存储、远程文件推送、秒传、断点
热门文章
- 产品生命周期理论(转载)
- ios测试续航软件,6款iPhone测试iOS续航:耗电反而更严重了?
- U盘启动安装linux服务器(附带ULtraISO工具下载地址和注册码)
- 当PN结加正向电压时,空间电荷区为何会变窄
- 帮我用python编写每小时在新浪财经网获取股票小时数据的程序
- 安装php环境显示端口被占用,【亲测】启动PHPstudy提醒80、3306端口被占用的2种解决办法_全百科网...
- 教你用Python监控进程的CPU使用率
- cloudcompar中道路边线半自动提取思路
- 关于Java正则表达式中转义符“\\”的使用
- VsCode中使用jupyter,matplotlib不显示图像的问题