因工作需要对一个脚本里的var变量进行提取,看了很多教程,安装了一堆的库lxml、bs4、json,后来发现都没有用,最基本的re和requests就够了,先上var所在script 内容

<script>var MyMarhq = '';clearInterval(MyMarhq);$('.tbl-body tbody').empty();$('.tbl-header tbody').empty();var str = '';var Items = [{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001128","cbrmc":"贾*","count":3},{"cbbm":"部门","cbbmbm":"502","cbrbm":"360001560","cbrmc":"张*","count":1},{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001068","cbrmc":"赵*","count":5},{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001121","cbrmc":"王*","count":1},{"cbbm":"部门","cbbmbm":"109","cbrbm":"360001564","cbrmc":"逄*","count":3}];var Items_ = 0

需要提取 var Items 后面的内容,想了很多办法,都不好用,最后用正则表达式搞定。

import re
import requests
url = 'your url'#var 所在网页resp = requests.get(url)text = resp.text# print(text)cbrbms = re.findall(r""".+?cbrbm":"(.+?)"  .+?cbrmc":"(.+?)"""", text, re.VERBOSE | re.DOTALL)#  '.+?'意思是任意一串字符,cbrbm和后面的符号表示用于识别的关键字,()表示要提取的内容,()后的双引号表示提取结束的标识, re.VERBOSE | re.DOTALL什么意思我也不太懂,但是一个不能少,少了就提取不出来。

效果就是提取了,cbrbm(人员编码)和cbrmc(人员名称),取回来是list类型。

python抓取script VAR变量相关推荐

  1. blob的真实地址怎么获得_使用Python抓取m3u8加密视频 续:获得index.m3u8 地址

    之前写<使用Python抓取m3u8加密视频>笔记的原因,是自己有几个视频想保存,但对于m3u8, .ts 文件拼接不熟悉,就尝试写个脚本练手. 今天看了回复,有同学想知道如何从视频网站上 ...

  2. Python 抓取数据并可视化

    Python 抓取数据并数据可视化 前言 一.数据抓取篇 1.简单的构建反爬措施 2.解析数据 3.完整代码 二.数据可视化篇 1.数据可视化库选用 2.案例实战 (1).柱状图Bar (2).地图M ...

  3. python 爬取加密视频_使用Python抓取m3u8加密视频 续:获得index.m3u8 地址

    之前写<使用Python抓取m3u8加密视频>笔记的原因,是自己有几个视频想保存,但对于m3u8, .ts 文件拼接不熟悉,就尝试写个脚本练手. 今天看了回复,有同学想知道如何从视频网站上 ...

  4. 真小白|一步步教你用Python抓取微信好友分析

    前言 前段时间公司里有个同事发了张图片在群上,是他所有微信好友头像拼成的一张大图,我看着挺有意思,就想自己也搞一下,然后百度了下怎么抓取微信好友之类的--一搜全是用Python抓取的,之前就听说过Py ...

  5. 分析网易云歌曲评论分析加密的JS并且解密,并使用Python抓取歌曲评论

    转载自分析网易云歌曲评论分析加密的JS并且解密,并使用Python抓取歌曲评论 - 『编程语言区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn 原文无法显 ...

  6. python数据分析实例:python抓取课工厂网站数据和分析

    在线教育网站学习,是很多人利于闲余时间进行充电的一种选择.本篇文章利用python抓取在线教育网站课工场课程页面的数据,进行简要分析. 通过使用requests库对课工场课程列表页进行抓取. 通过Be ...

  7. Python 抓取动态网页表格信息

    五一假期,研究了下Python抓取动态网页信息的相关操作,结合封面的参考书.网上教程编写出可以满足需求的代码.由于初涉python,过程中曲折很多,为了避免以后遇到问题找不到相关的信息创建本文. 准备 ...

  8. 用 Python 抓取阿里云盘资源

    文 | 某某白米饭 来源:Python 技术「ID: pythonall」 前阵子阿里云盘大火,送了好多的容量空间.而且阿里云盘下载是不限速,这点比百度网盘好太多了.这两天看到一个第三方网站可以搜索阿 ...

  9. python抓取数据,pandas 处理并存储为excel

    pandas书看了一段时间了,但是一直没有实践过,这周有空就来试试,先看网站: 总共有54页,每页50条数据,其实最简单的办法是:直接复制数据,然后粘贴到excel里面,只需要粘贴54次,也不算太复杂 ...

最新文章

  1. vs2015第二次装安装不能选择路径问题解决方法
  2. excel正在等待某个应用程序以完成对象链接与嵌入操作_看完这篇操作系统,和面试官扯皮就没问题了
  3. php循环遍历数组保存数据库,php数组循环遍历 - 与狼共舞红队的个人空间 - OSCHINA - 中文开源技术交流社区...
  4. 北极约200万个甲烷点被发现,人类的反思该提上日程了,因为只有一个地球
  5. Boost:双图和boost assign的测试程序
  6. Oracle with语句的用法
  7. CentOS6安装tomcat6
  8. 迷宫城堡(HDU-1269)
  9. 如何连接到远程SQL Server
  10. 离婚冷静期有用吗?全国哪个省份的情侣最想结婚?大数据告诉你
  11. 【8-22】java学习笔记04
  12. 剑指offer(1)
  13. 洛谷 P1025 数的划分
  14. Python3 色情图片识别
  15. 常见笔顺错误的字_易错汉字笔画顺序 你全都会吗?
  16. 小程序云开发实现上传图片功能
  17. Ionic之自定义icon大小
  18. 微信小程序 一键授权 给第三方平台代开发管理(一,创建第三方平台)
  19. 宝宝湿疹怎么办?宝宝湿疹怎么处理最好?
  20. CSS入门教程——HTML选择器

热门文章

  1. 魔性,用 Python 实现火爆全网的「蚂蚁呀嘿」视频特效!
  2. java设计模式_UML类图(上)
  3. tf.keras.layers.Layer自定义层
  4. 如何写一份详细的创业项目策划书
  5. ABP VNext学习日记4
  6. Flappy bird 小游戏的实现
  7. python爱心表白_python爱心表白 每天都是浪漫七夕!
  8. 《崔庆才Python3网络爬虫开发实战教程》学习笔记(3):抓取猫眼电影榜单TOP100电影,并存入Excel表格
  9. 从《9败1胜》了解王兴如何10年创业带领美团上市!
  10. 中国的生存法则变了,你再不懂就晚了