我们简单地爬取慕课网中免费课程下的第一页的图片,如想爬取多页图片,可以添加for循环自行实现

python版本:3.6.5

爬取网址:http://www.imooc.com/course/list

python源码:

#抓取慕课网的图片到本地
import re,urllib.requestrequest = urllib.request.urlopen('http://www.imooc.com/course/list')
buf=request.read().decode('utf-8')
#根据以下网页源码写出正则表达式
#src="//img3.mukewang.com/5aa77f4c0001f0a706000338-240-135.jpg"
listurl=re.findall('src="//img.+\.jpg',buf)
res=[]         #保存所有的图片地址
index=0            #对爬取的图片进行计数
for url in listurl:#构造图片地址 图片真实地址如下#"http://img3.mukewang.com/5aa77f4c0001f0a706000338-240-135.jpg"a=re.findall('//img.+\.jpg',url)a[0]='http:'+a[0]                        #a[0]保存图片真实地址print(str(index)+" : "+a[0])     #输出图片编号和网址res.append(a[0])                        #将图片地址添加进列表index=index+1
index=0
print(len(res))                                #输出图片总数,验证是否出错
for url in res:f=open("D:/img/"+str(index)+'.jpg','wb')request=urllib.request.urlopen(url)buf=request.read()f.write(buf)index=index+1
f.close()

运行并观察输出:可以发现并没错误

我们打开D:\img

惊奇的发现所有图片均被爬取到了本地

python爬虫爬取慕课网中的图片相关推荐

  1. python爬虫 爬取贝壳网中所有行政区内的二手房 将获取信息存于excle中--Excel文件 含分析

    -- coding: utf-8 -- """ Created on Sat Feb 29 19:13:37 2020 @author: acliu "&quo ...

  2. python爬虫爬取知网

    python爬虫爬取知网 话不多说,直接上代码! import requests import re import time import xlrd from xlrd import open_wor ...

  3. 在当当买了python怎么下载源代码-python爬虫爬取当当网

    [实例简介]python爬虫爬取当当网 [实例截图] [核心代码] ''' Function: 当当网图书爬虫 Author: Charles 微信公众号: Charles的皮卡丘 ''' impor ...

  4. python爬虫爬取当当网的商品信息

    python爬虫爬取当当网的商品信息 一.环境搭建 二.简介 三.当当网网页分析 1.分析网页的url规律 2.解析网页html页面 书籍商品html页面解析 其他商品html页面解析 四.代码实现 ...

  5. [python爬虫]爬取天气网全国所有县市的天气数据

    [python爬虫]爬取天气网全国所有县市的天气数据 访问URL 解析数据 保存数据 所要用到的库 import requests from lxml import etree import xlwt ...

  6. Python爬虫爬取东方财富网的股票信息

    简单的Python爬虫应用 目标:爬取东方财富网的股票信息 1.先找到要爬取的网页 2.第二步开始爬取信息 2.1 通过requests获取网页信息 2.2再通过BeautifulSoup解析: 2. ...

  7. python爬虫爬取东方财富网股票走势+一些信息

    一.目标 我们的目标是爬取东方财富网(https://www.eastmoney.com/)的股票信息 我的目标是爬取100张股票信息图片 经过实际测试我的爬取范围为000001-000110,000 ...

  8. [Python爬虫]爬取东方财富网公司公告需要注意的几个问题

    在上一篇文章中,以爬取东方财富网公司公告为例,介绍了如何爬取利用ajax加载的网页,以及如何模拟翻页.但是,在实际应用的过程中,发现了一些问题.接下来就来一一分析解决. 问题一.公告数量过多,后面的公 ...

  9. python爬虫-爬取当当网书籍信息存到Excel中

    文章目录 一.任务 二.分析 (一).单页面的信息分析 源代码分析 目标信息定位与分析 代码设计 (二).所有目标页面链接分析 目标链接分析 代码设计 三.注意要点 四.完整代码 五.参考 一.任务 ...

最新文章

  1. mysql顺序结构_MySQL学习之流程结构
  2. 创建3层的服务模板 (1)--- 概述
  3. php表格js特效,JavaScript表格隔行变色和Tab标签页特效示例【附jQuery版】
  4. idea查看一个类的所有子类_java new一个对象的过程中发生了什么
  5. SQL - waitfor delay/time(SQL中延迟时间的方法)
  6. iphone换机数据迁移_怎么一键换机?换新机迁移数据必看教程!
  7. Selenium2+python自动化18-加载Firefox配置
  8. 关于java加壳和代码混淆
  9. Flutter实战之GetX工具类封装-GetUtils
  10. 什么是SWFObject?
  11. 全屏模式fullscreen
  12. 服务器内存傲腾基本参数信息,单条512GB的傲腾内存你见过嘛?
  13. ZEMAX | 绘图分辨率结果对光线追迹的影响
  14. python千位分隔符_31 python中format方法:字段宽度、精度和千位分隔符 符号、对齐和用0填充...
  15. 【华人学者风采】聂飞平 西北工业大学
  16. Google Gmail十年回首
  17. 眼保健操(UPWND公益版)保护眼睛
  18. 电商跟微商的区别是什么呢
  19. 华为stk_Aloo计算机在哪里,华为STK-AL00是什么型号
  20. 小米 android12 签名问题 机型红米note11

热门文章

  1. python-Python 函数
  2. python学习手册-Python 重点知识整理(基于Python学习手册第四版)
  3. shell脚本求和_常用的Shell脚本
  4. 【Spring笔记】依赖注入
  5. 【java笔记】map集合
  6. 蓝桥杯2013c++真题:振兴中华
  7. 一个做得很好的电子产品测评类网站:Zealer
  8. linux实现标准设备输入输出,Linux的标准输入和输出
  9. jQuery 学习-样式篇(六):jQuery 获取和设置表单元素的值
  10. 浏览器管理oracle网址,浏览器用户界面 (Browser User Interface, BUI)