python re re.compile search groupdict 正则多取值

import requests
import re
import json
url = "https://desk.zol.com.cn//bizhi/9109_111583_2.html"
resp = requests.get(url)
#1,提取详情页中的var deskPicArr  2,获取oriSize  imgsrc  3,组合url  4,用url 下载
obj = re.compile(r"var deskPicArr.*?=(?P<deskPicArr>.*?);",re.S)      #使用预加载正则表达式
result = obj.search(resp.text) #使用search提取出来的都为字符串,如果只取单个则可以用这个search,多个则可以用finditer,后面提取则可用groupdict
deskPic = result.group("deskPicArr")        ##将匹配字段中的名称为deskPicArr名称的值取出,
deskPic = json.loads(deskPic)               #将字符串转换成json格式
for i in deskPic["list"]:            oriSize = i.get("oriSize")imgsrc = i.get("imgsrc")imgsrc = imgsrc.replace("##SIZE##",oriSize)filename = imgsrc.split("/")[-1]imgdownload = requests.get(imgsrc)       #下载对应链接的数据with open(filename,mode="wb") as f:f.write(imgdownload.content)

python re re.compile search groupdict 正则多取值相关推荐

  1. Python openpyxl打开有公式的excel表取值错误的解决办法,Python openpyxl获取excel有公式的单元格的数值错误,Python操作excel(.xlsx)封装类

    Python openpyxl打开有公式的表格,如果直接读取,会出现有公式的单元格为空或零的情况. 参见: https://blog.csdn.net/weixin_45903952/article/ ...

  2. python字典中的key和value的取值规则

    字典是Python的另一种有序的可变数据结构,且可存储任意类型对象. 字典是一种键值对的数据容器,每个键值(key:value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号&q ...

  3. python数组两个冒号_python数组冒号取值操作

    1.冒号的用法 1.1 一个冒号 a[i:j] 这里的i指起始位置,默认为0:j是终止位置,默认为len(a),在取出数组中的值时就会从数组下标i(包括)一直取到下标j(不包括j) 在一个冒号的情况下 ...

  4. python列表嵌套字典取值_Python基础语法:你不得不知的几种变量类型

    (点击上方快速关注并设置为星标,一起学Python) 作者:kina_chen來源:简书 01. Python编码Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字, ...

  5. python 正则表达式 re.compile() 的使用

    1 re.compile() 的解释: python 正则表达式 re.compile() 将正则表达式编译成一个Pattern规则对象,单独使用compile 没有意义,他生成的是一个规则,需要ma ...

  6. python 3.3.3 字面量,正则,反斜杠和原始字符串

    两个不起眼但是比较重要的设定 Python str类型的字面量解释器 当反斜杠及其紧接字符无法构成一个具有特殊含义的序列('recognized escape sequences')时,Python选 ...

  7. python中match的六种用法,python 正则函数match()和search()用法示例

    这篇文章主要为大家详细介绍了python 正则函数match()和search()用法示例,具有一定的参考价值,可以用来参考一下. 对python正则表达式函数match()和search()的区别详 ...

  8. python/keras中用Grid Search对神经网络超参数进行调参

    原文:How to Grid Search Hyperparameters for Deep Learning Models in Python With Keras 作者:Jason Brownle ...

  9. 【整理】Python中的re.search和re.findall之间的区别和联系 + re.finall中带命名的组,不带命名的组,非捕获的组,没有分组四种类型之间的区别

    之前自己曾被搞晕过很多次. 后来使用这些函数次数多了之后,终于比较清楚的弄懂了两者之间的区别和关系了. 尤其是一些细节方面的注意事项了. 在看下面的总结和代码之前,请先确保你对如下基本概念已经有所了解 ...

最新文章

  1. 关于Reapeter的总结
  2. 想当然是编程最大的坑,记更新删除过期cookie无效有感
  3. 产品经理经验谈:从产品经理、用户、产品的角度重新认知产品运营
  4. mysql 读取comment_Mysql 获取表的comment 字段
  5. Tomcat运行三种模式:http-bio|http-nio|http-apr介绍
  6. 信息学奥赛一本通(1175:除以13)
  7. EntityManager:seam新手必读(一)
  8. Spring Boot整合H2内存数据库配置及常见问题处理
  9. java测试网址_支付宝:电脑网站沙箱测试(Java)
  10. python获取程序运行路径
  11. 辽宁师范大学计算机学院查寝吗,辽宁师范大学宿舍怎么样 住宿条件好不好
  12. 你的支付授权失败。请核对你的信息并重试,或尝试其他支付方式。 解决方案
  13. 2019全球logo设计趋势
  14. 第五节:通信之WLAN(MAC地址)
  15. LINGO Error Code 122 和 237 出现原因及其解决方法
  16. mysql在mye_数据库映射出现重大问题
  17. 日语里面用言连体,连用,终止形分别是什么
  18. 爱死磕8月28日市场分析,涨停!两天已18个点!
  19. IIR滤波器极点分析--关于稳定度
  20. 小白如何选择一款好用的音乐编曲软件,看这里

热门文章

  1. 服务器c盘有个inetpub文件夹,老司机为你示范win10系统C盘inetpub文件夹删不掉的图文教程...
  2. iOS_隐藏系统音量(MPVolumeView初探)
  3. 阿里巴巴自动驾驶三维点云分割PointNet实现
  4. Java实现数组列项相加_数列的考查角度收集整理2[三轮总结]
  5. 华三交换机配置多个镜像口_H3c交换机配置端口镜像详情
  6. Android 网络请求、网络状态及各种权限判断
  7. 虚拟机服务器经典应用配置方案(二)
  8. 报错ImportError: cannot import name ‘webdriver‘ from partially initialized module ‘selenium‘ (most lik
  9. 论文投稿指南——中文核心期刊推荐(环境科学)
  10. 种植人参,土壤不好,怎么办?