python 极客学院正则表达式

import re
from re import findall,search,sub,Ssearet_code = 'hadfalifexxIxxfasdjifja134xxlovexx23345sdfxxyouxx8dfse'# .的使用 相当于一个占位符
# a = 'xy123'
# b = re.findall('x..',a)
# print(b)# *的使用 匹配无限次 如果不是单一的一个字符，则不会出现空的
# a = 'xyxy123'
# b = re.findall('x*',a)
# print(b)# ？的使用
# a = 'xxxxxxy123'
# b = re.findall('x?',a)
# print(b)# 上面的了解就可以啦，需要掌握的只有一个  （.*？）# .*的使用
# c = re.findall('xx.*xx',searet_code)
# print(c)# .*?的使用
# c = re.findall('xx.*?xx',searet_code)
# print(c)# (.*?)的使用
# c = re.findall('xx(.*?)xx',searet_code)
# print(c)# s = '''sdfxxhello
# xxfsdfxxworldxxasdf'''
#
# d = re.findall('xx(.*?)xx',s,re.S)   # re.S .表示包括了换行符
# print(d)# 对比findall与search的区别
# s2 = 'asdxxIxx123xxlovexxdfd'
# f = re.search('xx(.*?)xx123xx(.*?)xx',s2).group(1)
# print(f)
#
# f2 = re.findall('xx(.*?)xx123xx(.*?)xx',s2)
# print(f2[0][1])# sub的使用举例
# s = '123sssss123'
# output = re.sub('123(.*?)123','123%d123'%789,s)
# print(output)# 演示不同的导入方法   不推荐这样使用from re import findall,search,sub,S
# info = findall('xx(.*?)xx',searet_code,S)
# for each in info:
#     print(each)# 不需使用compile 多此一举（程序自己会编译）
# pattern = 'xx(.*?)xx'
# new_pattern = re.compile(pattern,re.S)
# output = re.findall(new_pattern,searet_code)
# print(output)# 匹配纯数字
# a = 'asdfasdf1234567fas888dfas'
# b = re.findall('(\d+)',a)
# print(b)

以上是代码实例，和一些正则表达式中的常用技巧
以下是一些基本的描述：

.        匹配任意字符
*       匹配前一个字符0次或者无限次
？        匹配前一个字符0次或1次
.*      贪心算法
.*？  非贪心算法   像一个婴儿一样，少量多餐
()      括号内的数据作为结果返回    需要的内容放在括号里面，不需要的内容放在括号外面findall      匹配所有符合规律的内容，返回包含结果的列表
search      匹配并提取第一个符合规律的内容，返回一个正则表达式对象
sub         替换符合规律的内容，返回替换后的值正则表达式一些常用技巧
import
from re import*
from re import findall,search,sub,S
不需要complie
使用\d+匹配纯数字

python 极客学院正则表达式相关推荐

python极客学院爬虫_学习极客学院多线程爬虫课程的收获
昨天开始了极客学院<XPath与多线程爬虫>课程的学习,主要涉及到XPath和requests的使用,在测试过程中出现了很多问题,经过不断摸索以及前辈们的帮助,现将经验总结如下: 1. P ...
python极客学院爬虫_基于requests实现极客学院课程爬虫
#coding=utf-8 __author__ = 'scaleworld' importrequestsimportreimportsys reload(sys) sys.setdefaulten ...
python极客学院爬虫_极客学院Python文本爬虫
# -*- coding: utf-8 -*- import re old_url = 'http://www.jikexueyuan.com/course/android/?pageNum=2' t ...
极客时间和极客学院_极客在海滩
极客时间和极客学院 As reported by Jeremy, Andy and Jon, last weekend was a chance for that rare creature – th ...
Python爬虫实战：极客学院
今天我们来爬取一下极客学院的课程,这次我们用requests和xpath,小伙伴们看好了,这真是一对神奇组合,棒棒哒! 爬取前我们先看一下我们的目标: 1.抓取极客学院的课程 2.抓取每一门课程的课程 ...
python爬虫下载极客学院视频
这两天在极客学院看视频,感觉在网上看好不方便,所以写了个爬虫来下载视频. 具体思路是: 1.先登录极客学院 2.获取指定页面中的课程网址 3.获取每个课程中的视频的地址 4.下载视频首先要访问这个网 ...
【极客学院】－python学习笔记-2-Python特色，学习路线
极客学院课程地址:http://www.jikexueyuan.com/course/594.html Python功能强大: Python学习路线: Python的三大优点: 简单,功能强大,面向对 ...
Python简单网页爬虫——极客学院视频自动下载
一.需求背景最近正好在研究Python,看了菜鸟教程上的基本教程,然后又再看极客学院的教学视频,向实战进军. 极客学院的视频是需要年费会员才能下载的,客户端倒是可以批量下载,但是下载之后,没有目录结 ...
【极客学院】－python学习笔记-Python快速入门(面向对象－引入外部文件－Web2Py创建网站)
极客学院的课程,感觉很有意思,每节课都很短,但是很干货,我喜欢这个节奏 http://www.jikexueyuan.com/course/203.html 课程背景: Python语言功能强大, 能 ...
极客学院职业路径图课程视频下载-爬虫
一.序言最近看了极客学院的视频教程,相当不错,渴望把视频下载到本地.手动下载耗时耗力,因而决定研究一番,写一程序自动下载,终于小有成果!有图为证: 二.技术难点既然要实现自动下载,免不了要爬取极客 ...

python 极客学院正则表达式

python 极客学院正则表达式相关推荐

最新文章

热门文章

python 极客学院 正则表达式

python 极客学院 正则表达式相关推荐

最新文章

热门文章

python 极客学院正则表达式

python 极客学院正则表达式相关推荐