python re re.compile search groupdict 正则多取值
python re re.compile search groupdict 正则多取值
import requests
import re
import json
url = "https://desk.zol.com.cn//bizhi/9109_111583_2.html"
resp = requests.get(url)
#1,提取详情页中的var deskPicArr 2,获取oriSize imgsrc 3,组合url 4,用url 下载
obj = re.compile(r"var deskPicArr.*?=(?P<deskPicArr>.*?);",re.S) #使用预加载正则表达式
result = obj.search(resp.text) #使用search提取出来的都为字符串,如果只取单个则可以用这个search,多个则可以用finditer,后面提取则可用groupdict
deskPic = result.group("deskPicArr") ##将匹配字段中的名称为deskPicArr名称的值取出,
deskPic = json.loads(deskPic) #将字符串转换成json格式
for i in deskPic["list"]: oriSize = i.get("oriSize")imgsrc = i.get("imgsrc")imgsrc = imgsrc.replace("##SIZE##",oriSize)filename = imgsrc.split("/")[-1]imgdownload = requests.get(imgsrc) #下载对应链接的数据with open(filename,mode="wb") as f:f.write(imgdownload.content)
python re re.compile search groupdict 正则多取值相关推荐
- Python openpyxl打开有公式的excel表取值错误的解决办法,Python openpyxl获取excel有公式的单元格的数值错误,Python操作excel(.xlsx)封装类
Python openpyxl打开有公式的表格,如果直接读取,会出现有公式的单元格为空或零的情况. 参见: https://blog.csdn.net/weixin_45903952/article/ ...
- python字典中的key和value的取值规则
字典是Python的另一种有序的可变数据结构,且可存储任意类型对象. 字典是一种键值对的数据容器,每个键值(key:value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号&q ...
- python数组两个冒号_python数组冒号取值操作
1.冒号的用法 1.1 一个冒号 a[i:j] 这里的i指起始位置,默认为0:j是终止位置,默认为len(a),在取出数组中的值时就会从数组下标i(包括)一直取到下标j(不包括j) 在一个冒号的情况下 ...
- python列表嵌套字典取值_Python基础语法:你不得不知的几种变量类型
(点击上方快速关注并设置为星标,一起学Python) 作者:kina_chen來源:简书 01. Python编码Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字, ...
- python 正则表达式 re.compile() 的使用
1 re.compile() 的解释: python 正则表达式 re.compile() 将正则表达式编译成一个Pattern规则对象,单独使用compile 没有意义,他生成的是一个规则,需要ma ...
- python 3.3.3 字面量,正则,反斜杠和原始字符串
两个不起眼但是比较重要的设定 Python str类型的字面量解释器 当反斜杠及其紧接字符无法构成一个具有特殊含义的序列('recognized escape sequences')时,Python选 ...
- python中match的六种用法,python 正则函数match()和search()用法示例
这篇文章主要为大家详细介绍了python 正则函数match()和search()用法示例,具有一定的参考价值,可以用来参考一下. 对python正则表达式函数match()和search()的区别详 ...
- python/keras中用Grid Search对神经网络超参数进行调参
原文:How to Grid Search Hyperparameters for Deep Learning Models in Python With Keras 作者:Jason Brownle ...
- 【整理】Python中的re.search和re.findall之间的区别和联系 + re.finall中带命名的组,不带命名的组,非捕获的组,没有分组四种类型之间的区别
之前自己曾被搞晕过很多次. 后来使用这些函数次数多了之后,终于比较清楚的弄懂了两者之间的区别和关系了. 尤其是一些细节方面的注意事项了. 在看下面的总结和代码之前,请先确保你对如下基本概念已经有所了解 ...
最新文章
- 关于Reapeter的总结
- 想当然是编程最大的坑,记更新删除过期cookie无效有感
- 产品经理经验谈:从产品经理、用户、产品的角度重新认知产品运营
- mysql 读取comment_Mysql 获取表的comment 字段
- Tomcat运行三种模式:http-bio|http-nio|http-apr介绍
- 信息学奥赛一本通(1175:除以13)
- EntityManager:seam新手必读(一)
- Spring Boot整合H2内存数据库配置及常见问题处理
- java测试网址_支付宝:电脑网站沙箱测试(Java)
- python获取程序运行路径
- 辽宁师范大学计算机学院查寝吗,辽宁师范大学宿舍怎么样 住宿条件好不好
- 你的支付授权失败。请核对你的信息并重试,或尝试其他支付方式。 解决方案
- 2019全球logo设计趋势
- 第五节:通信之WLAN(MAC地址)
- LINGO Error Code 122 和 237 出现原因及其解决方法
- mysql在mye_数据库映射出现重大问题
- 日语里面用言连体,连用,终止形分别是什么
- 爱死磕8月28日市场分析,涨停!两天已18个点!
- IIR滤波器极点分析--关于稳定度
- 小白如何选择一款好用的音乐编曲软件,看这里
热门文章
- 服务器c盘有个inetpub文件夹,老司机为你示范win10系统C盘inetpub文件夹删不掉的图文教程...
- iOS_隐藏系统音量(MPVolumeView初探)
- 阿里巴巴自动驾驶三维点云分割PointNet实现
- Java实现数组列项相加_数列的考查角度收集整理2[三轮总结]
- 华三交换机配置多个镜像口_H3c交换机配置端口镜像详情
- Android 网络请求、网络状态及各种权限判断
- 虚拟机服务器经典应用配置方案(二)
- 报错ImportError: cannot import name ‘webdriver‘ from partially initialized module ‘selenium‘ (most lik
- 论文投稿指南——中文核心期刊推荐(环境科学)
- 种植人参,土壤不好,怎么办?