1、使用标准库urllib爬取“http://news.pdsu.edu.cn/info/1005/31269.htm”平顶山学院新闻网上的图片,要求:保存到F盘pic目录中,文件名称命名规则为“本人姓名”+ “_图片编号”,如姓名为张三的第一张图片命名为“张三_1.jpg”。

from re import findall
from urllib.request import urlopenurl = 'http://news.pdsu.edu.cn/info/1005/31269.htm'
with urlopen(url) as fp:content=fp.read().decode('utf-8')pattern = '<img width="500" src="(.+?)"'
#查找所有图片链接地址
result = findall(pattern, content)  #捕获分组
#逐个读取图片数据,并写入本地文件
path='f:/pic/'
name="烟雨"
for index, item in enumerate(result):picture = 'http://news.pdsu.edu.cn/' + itemwith urlopen(str(picture)) as fp:with open(path+name+'_'+str(index+1)+'.png','wb') as fp1: #这里因为是从1开始,这里注意下fp1.write(fp.read())

效果图如下:

2、采用scrapy爬虫框架,抓取平顶山学院新闻网(http://news.pdsu.edu.cn/)站上的内容,具体要求:抓取新闻栏目,将结果写入lm.txt。

cmd打开之后就别关了
scrapy startproject wsqwsq为项目名
cd wsq
scrapy genspider lm news.pdsu.edu.cnlm为爬虫名称,pdsu.edu.cn为爬取起始位置

分析:编写正确的正则表达式筛选信息
由关键信息:<h2 class="fl">媒体平院</h2>
筛选其正则表达式如下:soup.find_all('h2', class_='fl')
找到lm.py也就是上面创建的爬虫
编辑:将下面代码负责粘贴下
pip install beautifulsoup4
pip install scrapy
俩第三方库要安装下

# -*- coding: utf-8 -*-
import scrapy
from bs4 import BeautifulSoup
import re class LmmSpider(scrapy.Spider):name = 'lmm'allowed_domains = ['pdsu.cn']start_urls = ['http://news.pdsu.edu.cn/']def parse(self, response):html_doc=response.textsoup= BeautifulSoup(html_doc, 'html.parser')         re=soup.find_all('h2', class_='fl')content=''for lm in re:print(lm.text)content+=lm.text+'\n'with open('f:\\lm.txt', 'a+') as fp:fp.writelines(content)#保存路径可变

scrapy crawl lmlm为爬虫名称
效果图如下:

3、采用request爬虫模块,抓取平顶山学院网络教学平台上的Python语言及应用课程上的每一章标题(http://mooc1.chaoxing.com/course/206046270.html)。

cmd打开之后就别关了
scrapy startproject yyyy为项目名
cd yy
scrapy genspider beyond news.mooc1.chaoxing.com/course/206046270.htmlbeyond为爬虫名称,mooc1.chaoxing.com/course/206046270.html为爬取起始位置

分析:编写正确的正则表达式筛选信息
由关键信息:<div class="f16 chapterText">第一章 python概述</div>
筛选其正则表达式如下:soup.findAll('div',class_='f16 chapterText')
找到beyond.py也就是上面创建的爬虫
编辑:将下面代码负责粘贴下

# -*- coding: utf-8 -*-
import scrapy
import re
import requests
import bs4headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36'
}url='http://mooc1.chaoxing.com/course/206046270.html'
response = requests.get(url,headers=headers).text
soup = bs4.BeautifulSoup(response,'html.parser')
t=soup.findAll('div',class_='f16 chapterText')
for ml in t:print (ml.text)

效果图如下:

Python---实验九相关推荐

  1. python实验九答案_Python实验九

    安徽工程大学 python程序设计实验报告 班级:物流191       姓名:王悦   学号:3190505103       日期:2020.6.16       指导老师:修宇 [实验名称]实验 ...

  2. python实验九答案_Python程序设计实验报告(九)

    [实验任务] - 查阅资料进一步了解pip 安装命令的参数 运用相关命令查询本地计算机已经安装的包: - 网络查询资料,了解图像处理的相关第三方库 - 选择一种库,下载但不安装文件 - 安装.卸载.安 ...

  3. python 实验九 文件与异常

    1.新建一个文本文件yzy.txt,文件内容如下 慈母手中线,游子身上衣. 临行密密缝,意恐迟迟归. 谁言寸草心,报得三春晖. 编写程序输出该文件的内容,要求使用一次性读入整个文件内容和逐行读取文件内 ...

  4. Educoder:python实验九 二维列表

    1. 血压统计 xy=[] str1=input("") while(str1!="end"):xyxm=str1.split(",")xy ...

  5. 基于python的九轴惯性传感器的数据预处理代码-中值滤波实验

    ** 基于python的九轴惯性传感器的数据预处理代码-中值滤波实验 ** import random import numpy as np import pandas as pd import sc ...

  6. MOOS-ivp 实验九 分布式旅行商问题(1)

    MOOS-ivp 实验九 分布式旅行商问题(1) 提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加 例如:第一章 Python 机器学习入门之pandas的使用 提示:写完文章后,目录 ...

  7. 实验九 根据材料编程(改变字体颜色)

    编程:在屏幕中间分别显示 绿色.绿底红色.白底蓝色的字符串'welcome to masm!' 一个字符在屏幕上占用两个字节 低地址存放ASCII码,高地址存放字符的属性 偶数地址都是存放字符的ASC ...

  8. 云南大学计算机网络期中考试刘春花,实验九基于CRC编码的检错程序的实现.doc...

    实验九基于CRC编码的检错程序的实现.doc 云南大学软件学院实 验 报 告课程 计算机网络原理实验 任课教师 刘春花,刘宇 姓名 学号 专业 成绩 实验九.链路层实验基于 CRC 编码的检错程序的实 ...

  9. 计算机排版技能会操方案,实验九 Word的高级排版技巧.pdf

    <微机操作>实验九 课件 一.实验要求 通过本节学习,要求熟练掌握下列操作技能 (1) 能够适时适地插入页码.分页符.分节符: (2) 能够编辑相同页眉.页脚,也能建立不同节奇偶页不一样的 ...

  10. python实验报告代写_TensorFlow作业代写、代做Python程序语言作业、代写github课程作业、Python实验作业代写...

    TensorFlow作业代写.代做Python程序语言作业.代写github课程作业.Python实验作业代写 日期:2019-07-10 10:34 Python Practical Examine ...

最新文章

  1. 一起谈.NET技术,.Net Discovery系列之-深入理解平台机制与性能影响 (中)
  2. Android自定义旋钮效果,Android自定义悬浮按钮效果实现,带移动效果
  3. DC使用教程系列2-时钟的概念与环境接口面积约束脚本
  4. iOS:UIView的block函数实现转场动画---双视图
  5. ReactJs 第四章组件组件props
  6. spring+hibernate 下载
  7. java做校园一卡通技术_java写的简单校园卡管理系统
  8. 【STM32入门】STM32基础理论知识
  9. 拼图(九宫格,十六宫格)
  10. appium无法定位元素,TouchAction坐标定位工具
  11. C/C++动态申请空间方式
  12. 解决iPhone 浏览器上的圆角问题
  13. win7系统无法更新计算机配置,win7提示无法更新启动配置怎么办
  14. UWB定位,新一代的精确定位技术
  15. LeetCode题解:Balanced Binary Tree
  16. 吴恩达又双叒叕刷屏了_你准备入坑了吗?
  17. 攻防世界——robots
  18. Unity VideoPlayer组件在5.6版本的坑
  19. 数据结构-线性表(严书代码实现)
  20. iOS 仿QQ录音以及振幅动画实现

热门文章

  1. html5 loaded,How do you check if a HTML5 audio element is loaded?
  2. 题解 P3811 【【模板】乘法逆元】
  3. gopacket 在 windows 上面遇到的问题
  4. 卷积神经网络(CNN)与特殊的卷积
  5. c语言else匹配问题
  6. HTTP协议具体解释
  7. documentbodyscrollTop的值总为零的解决办法
  8. setTimeout里如果有$(this),$(this)指的是谁?
  9. 生成颜色代码的 Java程序
  10. java逆向_Java逆向基础之异常