我使用beutifulsoup来提取文档中图像的地址。但是文档中的链接需要清理(特别是大多数图像都有类似的链接)/image.jpg&随机文本和我想要的信息https://www.webaddress.com/image.jpg&filetype=l”

为此,我目前使用以下代码:from bs4 import BeautifulSoup

c = '

'

soup = BeautifulSoup(c)

link = [x['src'] for x in soup.findAll('img')]

link = [link_temp.split('.jpg')[0] for link_temp in link]

full_images_links = ["https://www.webaddress.com" + linktemp + ".jpg&filetype=l" for linktemp in link]

这基本上是搜索所有以.jpg结尾的链接图像,删除其后面的内容(大量随机代码),然后以我能得到图像的方式格式化。在

当图像的扩展名为“.jpg”时,效果很好,但是当图像的扩展名为“.jpg”时就不行了

对于上述示例,第一个图像文件的期望输出工作正常,并给出:

^{pr2}$

但是第二个,代码显示为https://www.webaddress.com/url/urls.do?filename=SWC.JPG&filetype=h.jpg&filetype=l

因为它是根据大写的“.JPG”拆分的

我理想中寻找的东西,可以扩展到不同的格式(例如,可能会运行到.JPEG,.JPEG等)

python参数之间用什么分割_如何根据python的两个参数在美丽的汤中分割相关推荐

  1. python文件之间的相互调用_一行 Python 代码能实现什么丧心病狂的功能?

    python一直被病垢运行速度太慢,但是实际上python的执行效率并不慢,慢的是python用的解释器Cpython运行效率太差. "一行代码让python的运行速度提高100倍" ...

  2. python文件之间如何互相通信_不同的類和.py文件之間的python通信

    我試圖在我的程序中使用mvc-模型.我使用pubsub在我的文件之間進行通信.我想知道是否有另一種溝通方式,而不是使用pubsub?不同的類和.py文件之間的python通信 我的具體問題:我有2個文 ...

  3. python同花顺交易接口是什么_我用 Python 预测了股票价格

    大家好,我是朱小五 最近大家都很关注股票/基金嘛,本来我也打算写写相关的文章,结果发现我对它们的了解不比等待进场的大妈们强多少... 吭哧吭哧爬了一堆数据,结果却不知道如何处理,正好看到一本书里对股票 ...

  4. python 提示按任意键退出_详解Python实现按任意键继续/退出的功能 python请按任意键继续 什么意思...

    请问python中如何实现按任意键继续效果.嗯,请问哪里有中文的手册下载吗?还有,小编试了,pause命令编译时不认啊,. python请按任意键继续 什么意思 pause命令就是按任意键继续,你按需 ...

  5. python的名字来源于什么故事_从认识Python开始吧

    认识Python 编写Python程序的文件,称为Python的脚本或者程序 要求Python文件的后缀名为.py print()是一个打印函数,可以输出数字.字符串.或者其他的内容 函数就是为了实现 ...

  6. python set 排序_python set 排序_如何在Python中使用sorted()和sort()

    点击"蓝字"关注我们 ?"Python基础知识" 大卫·丰达科夫斯基  著 18财税3班 李潇潇    译 日期:2019年5月6日 一. 使用sorted() ...

  7. 用python处理excel数据做函数_如何使用python通过函数式编程完成excel中的数据处理及分析工作...

    Excel是数据分析中最常用的工具,本篇文章通过python与excel的功能对比介绍如何使用python通过函数式编程完成excel中的数据处理及分析工作.在Python中pandas库用于数据处理 ...

  8. 基于python的深度学习框架有_《用Python实现深度学习框架》上市

    朋友们,<用Python实现深度学习框架>已经由人民邮电出版社出版上市了.在这本书中,我们带领读者仅用Python+Numpy实现一个基于计算图的深度学习框架MatrixSlow.本书讲解 ...

  9. python怎么学比较有技巧_怎么学python学的快?学习技巧大分享

    为了提高模块加载的速度,每个模块都会在__pycache__文件夹中放置该模块的预编译模块,命名为module.version.pyc,version是模块的预编译版本编码,一般都包含Python的版 ...

最新文章

  1. 中国是恶意程序感染率最高的国家
  2. winform下通过webclient使用非流方式上传(post)数据和文件
  3. 特变电工新能源打造绿色数据中心:综合能效提升18%以上
  4. 图解VS2010打包全过程
  5. php smart模板,vaphp整合smart模板有关问题
  6. 没有实现类,MyBatis 的方法是怎么执行的?
  7. 回车 触发 提交事件
  8. oracle连接总结(内连接、外连接、自然连接,交叉连接,自连接)
  9. 4款最具影响力的自助式BI工具
  10. Centos 7.4版本升级内核3.10+ 到4+过程
  11. 力扣——合并K个排序链表
  12. 编程基本功:做自解释的测试文档
  13. Latex添加矢量图/将visio画图转换成矢量图
  14. 操作系统ucore lab1
  15. 网卡添加VLAN TAG
  16. 【Unity3D自学记录】Unity3D之KeyCode键值
  17. C#.NET面试题:一批编号为1-100全部开关朝上(开)的灯进行以下操作: 开关编号凡是1的倍数反方向拨一次开关;若该编号也是2的倍数反方向又拨一次开关;若该编号又是3的倍数反方向又拨一次开关……
  18. 一款让人耳目一新的事件驱动型RTOS
  19. uniapp uview 图片上传
  20. 【PyTorch】语言模型/Language model

热门文章

  1. 数据库操作(使用FMDB)
  2. jQuery 变量数字相加
  3. android动态设置错误页面,Android中替换WebView加载网页失败时的页面
  4. php+羊,PHP之羊生小羊的问题
  5. 放大器非线性失真研究装置设计报告_我校信息学院学子再次斩获大学生电子设计竞赛大奖...
  6. globalmapper如何选取图像上的点_20. 用于纹理合成和转移的图像缝合
  7. 个人知识管理系统 mysql_个人知识管理系统Version1.0开发记录(04)
  8. python+unittest+excel接口自动化_Python+requests+unittest+excel实现接口自动化测试框架
  9. python重命名文件pycharm_Python中批量修改变量名太费劲?Pycharm中使用重命名一次搞定...
  10. pHp封装成vue,vue.js生成条形码的方法