# -*- coding:utf-8 -*-
import re
str = "<option value=2018010401>2018级播音与主持艺术1班</option><option value=2018080601>2018级财务管理1班</option><option value=2018080602>2018级财务管理2班</option><option value=2018080603>2018级财务管理3班</option><option value=2018060701>2018级产品设计1班</option><option value=2018060702>2018级产品设计2班</option><option value=2018060401>2018级动画1班</option><option value=2018060402>2018级动画2班</option><option value=2018110801>2018级工程管理1班</option><option value=2018110301>2018级工程造价1班</option><option value=2018110401>2018级国际商务1班</option><option value=2018010201>2018级汉语言文学1班</option><option value=2018010202>2018级汉语言文学2班</option><option value=2018060901>2018级环境设计1班</option><option value=2018060902>2018级环境设计2班</option><option value=2018080201>2018级计算机科学与技术1班</option><option value=2018110501>2018级金融工程1班</option><option value=2018080501>2018级经济学1班</option><option value=2018110701>2018级汽车服务工程1班</option><option value=2018030301>2018级日语1班</option><option value=2018030302>2018级日语2班</option><option value=2018081101>2018级软件工程1班</option><option value=2018030401>2018级商务英语1班</option><option value=2018030402>2018级商务英语2班</option><option value=2018110101>2018级食品科学与工程1班</option><option value=2018110102>2018级食品科学与工程2班</option><option value=2018220101>2018级食品质量与安全1班</option><option value=2018220102>2018级食品质量与安全2班</option><option value=2018060801>2018级视觉传达设计1班</option><option value=2018060802>2018级视觉传达设计2班</option><option value=2018080101>2018级数学与应用数学1班</option><option value=2018080102>2018级数学与应用数学2班</option><option value=2018080103>2018级数学与应用数学3班</option><option value=2018081001>2018级网络工程1班</option><option value=2018010601>2018级网络与新媒体1班</option><option value=2018110601>2018级物流工程1班</option><option value=2018010101>2018级新闻学1班</option><option value=2018080401>2018级信息管理与信息系统1班</option><option value=2018080301>2018级信息与计算科学1班</option><option value=2018030501>2018级英语1班</option><option value=2018030502>2018级英语2班</option><option value=2018030503>2018级英语3班</option><option value=2018030504>2018级英语4班</option><option value=2019010401>2019级播音与主持艺术1班</option><option value=2019010402>2019级播音与主持艺术2班</option><option value=2019080601>2019级财务管理1班</option><option value=2019080602>2019级财务管理2班</option><option value=2019080603>2019级财务管理3班</option><option value=2019060701>2019级产品设计1班</option><option value=2019060702>2019级产品设计2班</option><option value=2019060401>2019级动画1班</option><option value=2019060402>2019级动画2班</option><option value=2019110801>2019级工程管理1班</option><option value=2019110301>2019级工程造价1班</option><option value=2019110401>2019级国际商务1班</option><option value=2019010201>2019级汉语言文学1班</option><option value=2019010202>2019级汉语言文学2班</option><option value=2019060901>2019级环境设计1班</option><option value=2019060902>2019级环境设计2班</option><option value=2019081201>2019级计算机科学与技术(嵌入式系统)1班</option><option value=2019110501>2019级金融工程1班</option><option value=2019080501>2019级经济学1班</option><option value=2019110701>2019级汽车服务工程1班</option><option value=2019030301>2019级日语1班</option><option value=2019030302>2019级日语2班</option><option value=2019081101>2019级软件工程1班</option><option value=2019030401>2019级商务英语1班</option><option value=2019030402>2019级商务英语2班</option><option value=2019110101>2019级食品科学与工程1班</option><option value=2019110102>2019级食品科学与工程2班</option><option value=2019220101>2019级食品质量与安全1班</option><option value=2019220102>2019级食品质量与安全2班</option><option value=2019060801>2019级视觉传达设计1班</option><option value=2019060802>2019级视觉传达设计2班</option><option value=2019060803>2019级视觉传达设计3班</option><option value=2019080101>2019级数学与应用数学1班</option><option value=2019080102>2019级数学与应用数学2班</option><option value=2019080103>2019级数学与应用数学3班</option><option value=2019081001>2019级网络工程1班</option><option value=2019010601>2019级网络与新媒体1班</option><option value=2019010602>2019级网络与新媒体2班</option><option value=2019110601>2019级物流工程1班</option><option value=2019010101>2019级新闻学1班</option><option value=2019080401>2019级信息管理与信息系统1班</option><option value=2019080302>2019级信息与计算科学1班</option><option value=2019030501>2019级英语1班</option><option value=2019030502>2019级英语2班</option><option value=2019030503>2019级英语3班</option><option value=2019030504>2019级英语4班</option><option value=2020010401>2020级播音与主持艺术1班</option><option value=2020010402>2020级播音与主持艺术2班</option><option value=2020080601>2020级财务管理1班</option><option value=2020080602>2020级财务管理2班</option><option value=2020060701>2020级产品设计1班</option><option value=2020060702>2020级产品设计2班</option><option value=2020060401>2020级动画1班</option><option value=2020060402>2020级动画2班</option><option value=2020110801>2020级工程管理1班</option><option value=2020110301>2020级工程造价1班</option><option value=2020110401>2020级国际商务1班</option><option value=2020010201>2020级汉语言文学1班</option><option value=2020010202>2020级汉语言文学2班</option><option value=2020060901>2020级环境设计1班</option><option value=2020060902>2020级环境设计2班</option><option value=2020080201>2020级计算机科学与技术1班</option><option value=2020110501>2020级金融工程1班</option><option value=2020080501>2020级经济学1班</option><option value=2020110701>2020级汽车服务工程1班</option><option value=2020030301>2020级日语1班</option><option value=2020030302>2020级日语2班</option><option value=2020081101>2020级软件工程1班</option><option value=2020030401>2020级商务英语1班</option><option value=2020030402>2020级商务英语2班</option><option value=2020110101>2020级食品科学与工程1班</option><option value=2020220101>2020级食品质量与安全1班</option><option value=2020060801>2020级视觉传达设计1班</option><option value=2020060802>2020级视觉传达设计2班</option><option value=2020080101>2020级数学与应用数学1班</option><option value=2020080102>2020级数学与应用数学2班</option><option value=2020080103>2020级数学与应用数学3班</option><option value=2020081001>2020级网络工程1班</option><option value=2020010601>2020级网络与新媒体1班</option><option value=2020110601>2020级物流工程1班</option><option value=2020010101>2020级新闻学1班</option><option value=2020080301>2020级信息与计算科学1班</option><option value=2020030501>2020级英语1班</option><option value=2020030502>2020级英语2班</option><option value=2020030503>2020级英语3班</option><option value=2020030504>2020级英语4班</option></select></td></tr></table>"
content = re.findall(r'<option.*?>(.*?)</option>', str)
result = '\n'.join(content)f=open("runoob.txt","w")
f.write(result)
print(content)

python正则获取网页标签里面的内容相关推荐

  1. python爬虫提取a标签_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释

    一.Tag(标签)对象 1.Tag对象与XML或HTML原生文档中的tag相同. from bs4 import BeautifulSoup soup = BeautifulSoup('Extreme ...

  2. python tag对象下有多个标签、属性_Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释...

    Apple iPhone 11 (A2223) 128GB 黑色 移动联通电信4G手机 双卡双待 4999元包邮 去购买 > 如何利用Python爬虫库BeautifulSoup获取对象(标签) ...

  3. python Chrome + selenium自动化测试与python爬虫获取网页数据

    一.使用Python+selenium+Chrome 报错: selenium.common.exceptions.SessionNotCreatedException: Message: sessi ...

  4. Python爬虫获取网页编码格式

    Python爬虫获取网页编码格式 网页编码格式是每个网页规定的本页面文字的编码方式,其中比较流行的是ascii, gbk, utf-8, iso等.观察许多网页的编码格式都是在meta标签的conte ...

  5. python怎么读文件里的某一行-Python如何获取文件指定行的内容

    linecache, 可以用它方便地获取某一文件某一行的内容.而且它也被 traceback 模块用来获取相关源码信息来展示. 用法很简单: >>> import linecache ...

  6. 去除a链接+java正则_JavaScript实现正则去除a标签并保留内容的方法【测试可用】...

    本文实例讲述了JavaScript实现正则去除a标签并保留内容的方法.分享给大家供大家参考,具体如下: 一.问题: 有如下HTML代码,要求用正则去除a标签,只留下内容 //www.jb51.net ...

  7. python 使用xpath获取网页标签内容

    获取指定html的标签内容 打开网页的开发者模式,得到路径标签,然后加上/text() 即可得到标签的文本内容//*[@id="sonsyuanwen"]/div[1]/h1 对于 ...

  8. Python正则匹配HTML,python正则匹配html标签_Python爬虫常用正则表达式及HTML网页标签分析总结...

    这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法.它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化测试爬 ...

  9. python正则匹配html标签_Python爬虫常用正则表达式及HTML网页标签分析总结

    这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法.它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化测试爬 ...

最新文章

  1. C++中的接口(抽象类)
  2. Bootstrap 简洁、直观、强悍、移动设备优先的前端开发框架,让web开发更迅速、简单。...
  3. springboot文字转语音(jacob)
  4. PHP 真正多线程的使用
  5. 灰度重心法原理与实现
  6. Insert Interval
  7. UOJ #214 [UNR #1]合唱队形 (概率期望计数、DP、Min-Max容斥)
  8. VTK:图像方向用法实战
  9. weblogic内存溢出linux,解决weblogic内存溢出有关问题
  10. 每天九点十分开始每半小时一次执行一个cron_每天通勤4小时!西咸双城生活的上班族,不简单...
  11. linux配置rsync服务器
  12. C++基础学习8:类的定义(class)
  13. 约束最优化方法 (一) 最优性条件
  14. 数据库系统概述之数据库的安全性
  15. 技术分析:细说3D投影机技术原理
  16. [存储] Cobar使用文档(可用作MySQL大型集群解决方案)
  17. 东南大学计算机网络安全中心,胡轶宁 - 东南大学 - 网络空间安全学院
  18. Fatal signal 11 (SIGSEGV) at 0x00000004 (code=1)
  19. [活动]和Jeffery大师的最近距离
  20. magisk卸载内置软件_手机刷入面具magisk授权后,ROOT权限经常丢失解决方法

热门文章

  1. Calendar Game POJ - 1082(关于日历的博弈问题)
  2. maven mysql的jdbctemplate_JDBC、JDBCTemplate、MyBatis、Hiberante 比较与分析
  3. Caffe编译代码的时候报各种未定义未声明
  4. Trie:hdu 4825、1251、1247、Poj 3764
  5. 最小生成树Prime算法
  6. 2021牛客暑期多校训练营3 B Black and white 最小生成树 + 思维
  7. Codeforces Round #727 (Div. 2) E. Game with Cards dp + 思维
  8. P1537 弹珠 背包可行性dp
  9. 【NOI2019】弹跳【二维线段树】【dijkstra】
  10. 【NOIP2018】赛道修建【二分】【树形dp】【multiset】【贪心】