python抓取script VAR变量
因工作需要对一个脚本里的var变量进行提取,看了很多教程,安装了一堆的库lxml、bs4、json,后来发现都没有用,最基本的re和requests就够了,先上var所在script 内容
<script>var MyMarhq = '';clearInterval(MyMarhq);$('.tbl-body tbody').empty();$('.tbl-header tbody').empty();var str = '';var Items = [{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001128","cbrmc":"贾*","count":3},{"cbbm":"部门","cbbmbm":"502","cbrbm":"360001560","cbrmc":"张*","count":1},{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001068","cbrmc":"赵*","count":5},{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001121","cbrmc":"王*","count":1},{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001564","cbrmc":"逄*","count":3}];var Items_ = 0
需要提取 var Items 后面的内容,想了很多办法,都不好用,最后用正则表达式搞定。
import re
import requests
url = 'your url'#var 所在网页resp = requests.get(url)text = resp.text# print(text)cbrbms = re.findall(r""".+?cbrbm":"(.+?)" .+?cbrmc":"(.+?)"""", text, re.VERBOSE | re.DOTALL)# '.+?'意思是任意一串字符,cbrbm和后面的符号表示用于识别的关键字,()表示要提取的内容,()后的双引号表示提取结束的标识, re.VERBOSE | re.DOTALL什么意思我也不太懂,但是一个不能少,少了就提取不出来。
效果就是提取了,cbrbm(人员编码)和cbrmc(人员名称),取回来是list类型。
python抓取script VAR变量相关推荐
- blob的真实地址怎么获得_使用Python抓取m3u8加密视频 续:获得index.m3u8 地址
之前写<使用Python抓取m3u8加密视频>笔记的原因,是自己有几个视频想保存,但对于m3u8, .ts 文件拼接不熟悉,就尝试写个脚本练手. 今天看了回复,有同学想知道如何从视频网站上 ...
- Python 抓取数据并可视化
Python 抓取数据并数据可视化 前言 一.数据抓取篇 1.简单的构建反爬措施 2.解析数据 3.完整代码 二.数据可视化篇 1.数据可视化库选用 2.案例实战 (1).柱状图Bar (2).地图M ...
- python 爬取加密视频_使用Python抓取m3u8加密视频 续:获得index.m3u8 地址
之前写<使用Python抓取m3u8加密视频>笔记的原因,是自己有几个视频想保存,但对于m3u8, .ts 文件拼接不熟悉,就尝试写个脚本练手. 今天看了回复,有同学想知道如何从视频网站上 ...
- 真小白|一步步教你用Python抓取微信好友分析
前言 前段时间公司里有个同事发了张图片在群上,是他所有微信好友头像拼成的一张大图,我看着挺有意思,就想自己也搞一下,然后百度了下怎么抓取微信好友之类的--一搜全是用Python抓取的,之前就听说过Py ...
- 分析网易云歌曲评论分析加密的JS并且解密,并使用Python抓取歌曲评论
转载自分析网易云歌曲评论分析加密的JS并且解密,并使用Python抓取歌曲评论 - 『编程语言区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn 原文无法显 ...
- python数据分析实例:python抓取课工厂网站数据和分析
在线教育网站学习,是很多人利于闲余时间进行充电的一种选择.本篇文章利用python抓取在线教育网站课工场课程页面的数据,进行简要分析. 通过使用requests库对课工场课程列表页进行抓取. 通过Be ...
- Python 抓取动态网页表格信息
五一假期,研究了下Python抓取动态网页信息的相关操作,结合封面的参考书.网上教程编写出可以满足需求的代码.由于初涉python,过程中曲折很多,为了避免以后遇到问题找不到相关的信息创建本文. 准备 ...
- 用 Python 抓取阿里云盘资源
文 | 某某白米饭 来源:Python 技术「ID: pythonall」 前阵子阿里云盘大火,送了好多的容量空间.而且阿里云盘下载是不限速,这点比百度网盘好太多了.这两天看到一个第三方网站可以搜索阿 ...
- python抓取数据,pandas 处理并存储为excel
pandas书看了一段时间了,但是一直没有实践过,这周有空就来试试,先看网站: 总共有54页,每页50条数据,其实最简单的办法是:直接复制数据,然后粘贴到excel里面,只需要粘贴54次,也不算太复杂 ...
最新文章
- vs2015第二次装安装不能选择路径问题解决方法
- excel正在等待某个应用程序以完成对象链接与嵌入操作_看完这篇操作系统,和面试官扯皮就没问题了
- php循环遍历数组保存数据库,php数组循环遍历 - 与狼共舞红队的个人空间 - OSCHINA - 中文开源技术交流社区...
- 北极约200万个甲烷点被发现,人类的反思该提上日程了,因为只有一个地球
- Boost:双图和boost assign的测试程序
- Oracle with语句的用法
- CentOS6安装tomcat6
- 迷宫城堡(HDU-1269)
- 如何连接到远程SQL Server
- 离婚冷静期有用吗?全国哪个省份的情侣最想结婚?大数据告诉你
- 【8-22】java学习笔记04
- 剑指offer(1)
- 洛谷 P1025 数的划分
- Python3 色情图片识别
- 常见笔顺错误的字_易错汉字笔画顺序 你全都会吗?
- 小程序云开发实现上传图片功能
- Ionic之自定义icon大小
- 微信小程序 一键授权 给第三方平台代开发管理(一,创建第三方平台)
- 宝宝湿疹怎么办?宝宝湿疹怎么处理最好?
- CSS入门教程——HTML选择器
热门文章
- 魔性,用 Python 实现火爆全网的「蚂蚁呀嘿」视频特效!
- java设计模式_UML类图(上)
- tf.keras.layers.Layer自定义层
- 如何写一份详细的创业项目策划书
- ABP VNext学习日记4
- Flappy bird 小游戏的实现
- python爱心表白_python爱心表白 每天都是浪漫七夕!
- 《崔庆才Python3网络爬虫开发实战教程》学习笔记(3):抓取猫眼电影榜单TOP100电影,并存入Excel表格
- 从《9败1胜》了解王兴如何10年创业带领美团上市!
- 中国的生存法则变了,你再不懂就晚了