import re
from re import findall,search,sub,Ssearet_code = 'hadfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'# .的使用 相当于一个占位符
# a = 'xy123'
# b = re.findall('x..',a)
# print(b)# *的使用 匹配无限次 如果不是单一的一个字符,则不会出现空的
# a = 'xyxy123'
# b = re.findall('x*',a)
# print(b)# ?的使用
# a = 'xxxxxxy123'
# b = re.findall('x?',a)
# print(b)# 上面的了解就可以啦,需要掌握的只有一个  (.*?)# .*的使用
# c = re.findall('xx.*xx',searet_code)
# print(c)# .*?的使用
# c = re.findall('xx.*?xx',searet_code)
# print(c)# (.*?)的使用
# c = re.findall('xx(.*?)xx',searet_code)
# print(c)# s = '''sdfxxhello
# xxfsdfxxworldxxasdf'''
#
# d = re.findall('xx(.*?)xx',s,re.S)   # re.S .表示包括了换行符
# print(d)# 对比findall与search的区别
# s2 = 'asdxxIxx123xxlovexxdfd'
# f = re.search('xx(.*?)xx123xx(.*?)xx',s2).group(1)
# print(f)
#
# f2 = re.findall('xx(.*?)xx123xx(.*?)xx',s2)
# print(f2[0][1])# sub的使用举例
# s = '123sssss123'
# output = re.sub('123(.*?)123','123%d123'%789,s)
# print(output)# 演示不同的导入方法   不推荐这样使用from re import findall,search,sub,S
# info = findall('xx(.*?)xx',searet_code,S)
# for each in info:
#     print(each)# 不需使用compile 多此一举(程序自己会编译)
# pattern = 'xx(.*?)xx'
# new_pattern = re.compile(pattern,re.S)
# output = re.findall(new_pattern,searet_code)
# print(output)# 匹配纯数字
# a = 'asdfasdf1234567fas888dfas'
# b = re.findall('(\d+)',a)
# print(b)

以上是代码实例,和一些正则表达式中的常用技巧
以下是一些基本的描述:

.        匹配任意字符
*       匹配前一个字符0次或者无限次
?        匹配前一个字符0次或1次
.*      贪心算法
.*?  非贪心算法   像一个婴儿一样,少量多餐
()      括号内的数据作为结果返回    需要的内容放在括号里面,不需要的内容放在括号外面findall      匹配所有符合规律的内容,返回包含结果的列表
search      匹配并提取第一个符合规律的内容,返回一个正则表达式对象
sub         替换符合规律的内容,返回替换后的值正则表达式一些常用技巧
import
from re import*
from re import findall,search,sub,S
不需要complie
使用\d+匹配纯数字

python 极客学院 正则表达式相关推荐

  1. python极客学院爬虫_学习极客学院多线程爬虫课程的收获

    昨天开始了极客学院<XPath与多线程爬虫>课程的学习,主要涉及到XPath和requests的使用,在测试过程中出现了很多问题,经过不断摸索以及前辈们的帮助,现将经验总结如下: 1. P ...

  2. python极客学院爬虫_基于requests实现极客学院课程爬虫

    #coding=utf-8 __author__ = 'scaleworld' importrequestsimportreimportsys reload(sys) sys.setdefaulten ...

  3. python极客学院爬虫_极客学院Python文本爬虫

    # -*- coding: utf-8 -*- import re old_url = 'http://www.jikexueyuan.com/course/android/?pageNum=2' t ...

  4. 极客时间和极客学院_极客在海滩

    极客时间和极客学院 As reported by Jeremy, Andy and Jon, last weekend was a chance for that rare creature – th ...

  5. Python爬虫实战:极客学院

    今天我们来爬取一下极客学院的课程,这次我们用requests和xpath,小伙伴们看好了,这真是一对神奇组合,棒棒哒! 爬取前我们先看一下我们的目标: 1.抓取极客学院的课程 2.抓取每一门课程的课程 ...

  6. python爬虫下载极客学院视频

    这两天在极客学院看视频,感觉在网上看好不方便,所以写了个爬虫来下载视频. 具体思路是: 1.先登录极客学院 2.获取指定页面中的课程网址 3.获取每个课程中的视频的地址 4.下载视频 首先要访问这个网 ...

  7. 【极客学院】-python学习笔记-2-Python特色,学习路线

    极客学院课程地址:http://www.jikexueyuan.com/course/594.html Python功能强大: Python学习路线: Python的三大优点: 简单,功能强大,面向对 ...

  8. Python简单网页爬虫——极客学院视频自动下载

    一.需求背景 最近正好在研究Python,看了菜鸟教程上的基本教程,然后又再看极客学院的教学视频,向实战进军. 极客学院的视频是需要年费会员才能下载的,客户端倒是可以批量下载,但是下载之后,没有目录结 ...

  9. 【极客学院】-python学习笔记-Python快速入门(面向对象-引入外部文件-Web2Py创建网站)

    极客学院的课程,感觉很有意思,每节课都很短,但是很干货,我喜欢这个节奏 http://www.jikexueyuan.com/course/203.html 课程背景: Python语言功能强大, 能 ...

  10. 极客学院职业路径图课程视频下载-爬虫

    一.序言 最近看了极客学院的视频教程,相当不错,渴望把视频下载到本地.手动下载耗时耗力,因而决定研究一番,写一程序自动下载,终于小有成果!有图为证: 二.技术难点 既然要实现自动下载,免不了要爬取极客 ...

最新文章

  1. Java生成CRC16数据校验码
  2. 十进制中正整数N中1的个数(2)
  3. Mybatis的prefix和suffix使用
  4. olap与mysql_MySQL与OLAP:分析型SQL查询最佳实践探索
  5. python print()内置函数
  6. 《挖财编程题》水花仙数
  7. 学习笔记9-C语言-传参、类型限定符、递归
  8. 吴恩达《机器学习》学习笔记七——逻辑回归(二分类)代码
  9. OSI七层模型都是什么?
  10. 使用Three.js的材质
  11. AcWing1090.绿色通道(单调队列DP)
  12. leetcode python3 简单题155. Min Stack
  13. 【接口自动化测试】使用Fitness实现接口自动化测试
  14. 使用dmidecode查看服务器的内存条使用情况
  15. 企业员工管理系统封面html,单页面模板
  16. Python中的变量、引用、拷贝和作用域
  17. 现行一级学科和二级学科目录(学位授予和人才培养学科目录)
  18. MATLAB五子棋游戏(双人对战,可悔棋)
  19. 中文的括号和英文的括号区别_易混标点符号:中英文冒号(:、:)、比号(∶)...
  20. 系统封装教程(Win10案例)

热门文章

  1. GRE 词汇1(前缀)
  2. 如何使用 React Native 构建信用卡扫描仪
  3. 试验设计[实验设计]
  4. 2017百度之星资格赛 1001/hdu 6080 度度熊保护村庄
  5. CAD插件学习系列教程(八) tiff及jpg影像按真实坐标插入CAD,打包分享共4款
  6. 利用计算机解决鸡兔同笼问题,用计算机解决“鸡兔同笼”
  7. Django对接微信公众号以实现消息自动回复
  8. linux内核网络协议栈学习笔记:关于GRO/GSO/LRO/TSO等patch的分析和测
  9. Density 计算公式
  10. android手机怎么拍月亮,手机如何拍摄星空?2分钟教你如何拍出璀璨星空