以测试维基百科为例:

from urllib.request import urlopen
from bs4 import BeautifulSoup
import unittestclass TestWikipedia(unittest.TestCase):bsObj = Nonedef setUpClass():global bsObjurl = 'http://en.wikipedia.org/wiki/Monty_Python'bsObj = BeautifulSoup(urlopen(url))print('setting up the test')def test_titleTest(self):global bsObjpageTitle = bsObj.find("h1").get_text()self.assertEqual("Monty Python",pageTitle)print("tearing down the test")def test_contentExists(self):global bsObjcontent = bsObj.find("div",{"id":"mw-content-text"})self.assertIsNotNone(content)if __name__=='__main__':unittest.main()

写了两个测试,第一个测试页面标题是否为”Monty Python”,第二个测试页面是否有一个div节点id属性是”mw-content-text”
注意这个页面的内容值加载一次由全局对象bsObj共享给其他测试,这是通过unittest类的函数setUpClass来实现的,这个函数只在类的初始化阶段运行一次(与每个测试启动时都运行的setUp函数不同),更方便。
结果:

.setting up the test
tearing down the test
setting up the test..
tearing down the test----------------------------------------------------------------------
Ran 3 tests in 2.568sOK

注意:单双引号无所谓,用作字符,字符串,注意有转义的时候尽量避免混淆,转单引号则外面用双引号,反之亦然,三引号也可以用只是麻烦,另三引号可用作注释
关于引号的详细区别可参考:
http://blog.csdn.net/zyz511919766/article/details/22668077

python 用爬虫写网页测试相关推荐

  1. 如何用python做后端写网页-flask框架

    如何用python做后端写网页-flask框架 什么是Flask 安装flask模块 Hello World 更深一步:数据绑定 后端传入数据 从前端获取数据 数据库连接 screen 创建后台 查看 ...

  2. html文件怎么用Python做后端,利用python实现后端写网页(flask框架).pdf

    利利用用python实实现现后后端端写写网网页页 ((flask框框架架)) 如何用python做后端写网页-flask框架 什么是Flask安装flask模块Hello World更深一步:数据绑 ...

  3. python使用爬虫写一个自己的翻译器(带图像界面)

    python使用爬虫写一个自己的翻译器(带图像界面)   大家好,我叫亓官劼(qí guān jié ),在CSDN中记录学习的点滴历程,时光荏苒,未来可期,加油~博客地址为:亓官劼的博客,B站昵称为 ...

  4. 爬虫、网页测试 及 java servlet 测试框架等介绍

    scrapy 抓取网页并存入 mongodb的完整示例: https://github.com/rmax/scrapy-redis https://github.com/geekan/scrapy-e ...

  5. 小白学python(爬虫写着玩系列1)

    最近周末没啥事情,跟着bilbil大学里面的视频跟着敲,从爬虫到数据处理再到数据可视化,感觉把python前端的知识大概了解下吧(大佬勿喷).现在头大不行,一堆东西都只是浅尝辄止,感觉这样不太行,毕竟 ...

  6. Python轻量级爬虫教程-网页下载器

    爬虫简介: 抓取自己想要的的类别网页上的数据. 爬虫架构: 爬虫调度端 爬虫:URL管理器, 网页下载器,网页解析器 数据: 爬虫运行流程: URL管理器: 管理待抓取URL集合和已抓取URL集合: ...

  7. Python实训day04am【爬虫介绍、爬取网页测试、Python第三方库】

    Python实训-15天-博客汇总表 目录 1.文本文件编程题 2.爬虫(Scrapy) 2.1.安装第三方库 2.2.爬取网页测试 2.2.1.样例1 2.2.2.样例2 3.PyCharm导入第三 ...

  8. python 小说爬虫_从零开始写Python爬虫 --- 1.7 爬虫实践: 排行榜小说批量下载

    从零开始写Python爬虫 --- 1.7 爬虫实践: 排行榜小说批量下载Ehco 5 个月前 本来只是准备做一个爬起点小说名字的爬虫,后来想了一下,为啥不顺便把小说的内容也爬下来呢?于是我就写了这个 ...

  9. Python动态网页爬虫-----动态网页真实地址破解原理

    Python动态爬虫 1.目标网站 2.目标网站行为分析 3.目标文件依赖加载分析 4.静态网页分析 5.动态加载代码分析 6.万事俱备 7.只欠东风 7.1获取html代码 7.2获取mh_info ...

最新文章

  1. 挑战马斯克的Neuralink,另一家神秘的「脑机接口」公司已获投资
  2. 每日一皮:如何用一句话让领导和同事都尴尬至极?
  3. python web为什么不火-pythonweb为什么不火-问答-阿里云开发者社区-阿里云
  4. Java连接数据库(2)
  5. Web开发(一)·期末不挂之第一章·Web开发基础(不背就挂的基础知识)
  6. python批量清除一个列表中的某个内容,filter和lambda结合使用的方法
  7. 只需几步,U盘就能变“光驱”
  8. racte margin 居中 失效_上干货,微信用情侣签名她肯定很开心,微信个性签名居中隐藏技巧...
  9. chapter 15 运算符详解
  10. 阿里云边缘云ENS再升级,四大场景应用加速产业数字化落地
  11. 电机驱动板连线_伺服驱动器的工作原理和内部结构是什么?
  12. linux监控目录容量,利用ZABBIX监控某个目录大小
  13. python json.loads namespace_python json.loads兼容单引号数据的方法
  14. python defaultdict函数_Python中defaultdict与lambda表达式用法
  15. t–sql pl–sql_SQL存储过程–终极指南
  16. iOS 15Beta5版本更新变化,这些细节你发现了吗?
  17. mysql doesn t exist_Mysql的“Table 'mysql.servers' doesn't exist”的解决方法
  18. 剖析ARM中断控制器与GIC中断控制器
  19. 自主品牌车联网研究:高算力芯片推动车联网融合AI
  20. linux查看qq进程,Linux 进程初始堆栈内容查看

热门文章

  1. 单机版安装,伪分布式安装
  2. 保利威视平台:视频远程同步工具
  3. 为什么说阿里的“相信小的伟大”击中奥运会痛点
  4. C语言练习题,if-else的用法,体型判断:医务工作者经广泛的调查和统计分析,根据身高与体重因素给出了以下按“体指数”进行体型判断的方法
  5. iOS9适配 之 关于info.plist 第三方登录 添加URL Schemes白名单
  6. 论文研读 “Liar, Liar Pants on Fire”:A New Benchmark Dataset for Fake News Detection
  7. 内生性、自选择偏误、样本选择偏误
  8. 牛客网 精品课程 《直通BAT面试算法精讲课》 优惠码立减10元
  9. Vue中使用Datav 完成大屏基本布局
  10. ERP、SCM、CRM的区别和联系?