1.正则表达式

正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。(百度概念)

简单理解:按照一定的规则,从某个字符串中匹配出想要的数据。这个规则就是正则表达式。

常用规则

规则 说明
\ 转意符,例如 \?
^ 字符串起始
$ 字符串结束
* 匹配前面子表达式0次或多次
+ 匹配前面子表达式1次或多次
? 匹配前面子表达式0次或1次
{n,m} 匹配至少n次,最多m次
. 匹配除 \n 之外的单个字符
(pattern) 匹配并获取这个匹配,例如匹配ab(cd)e正则表达式只返回 cd
[xyz] 字符集合,匹配任意集合里的字符
[^xyz] 排除集合里的字符,不能匹配
\d 匹配一个数字,等价 [0-9]

案例

  1. 验证手机号码:手机号码的规则是以1开头,第二位可以是34587,后面那9位就可以随意了。示例代码如下:
text = "18570631587"
ret = re.match('1[34587]\d{9}',text)
print(ret.group())>> 18570631587
  • 而如果是个不满足条件的手机号码。那么就匹配不到了。示例代码如下:
text = "1857063158"
ret = re.match('1[34587]\d{9}',text)
print(ret.group())
>> AttributeError: 'NoneType' object has no attribute
  1. 验证邮箱:邮箱的规则是邮箱名称是用数字、数字、下划线组成的,然后是@符号,后面就是域名了。示例代码如下:
text = "hynever@163.com"
ret = re.match('\w+@\w+\.[a-zA-Z\.]+',text)
print(ret.group())
  1. 验证URL:URL的规则是前面是http或者https或者是ftp然后再加上一个冒号,再加上一个斜杠,再后面就是可以出现任意非空白字符了。示例代码如下:
text = "http://www.baidu.com/"
ret = re.match('(http|https|ftp)://[^\s]+',text)
print(ret.group())
  1. 验证身份证:身份证的规则是,总共有18位,前面17位都是数字,后面一位可以是数字,也可以是小写的x,也可以是大写的X。示例代码如下:
text = "3113111890812323X"
ret = re.match('\d{17}[\dxX]',text)
print(ret.group())

贪婪模式和非贪婪模式

贪婪模式:正则表达式会匹配尽量多的字符。默认是贪婪模式。

非贪婪模式:正则表达式会尽量少的匹配字符。

? 该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时 ,匹配模式是非贪婪的。

示例代码

text = "0123456"
ret = re.match('\d+',text)
print(ret.group())
# 因为默认采用贪婪模式,所以会输出0123456
>> 0123456

可以改成非贪婪模式,那么就只会匹配到0。示例代码如下:

text = "0123456"
ret = re.match('\d+?',text)
print(ret.group())

re模块中常用函数

  1. match函数
  • 从开始的位置进行匹配。如果开始的位置没有匹配到。就直接失败了.
text = 'hello'
ret = re.match('h',text)
print(ret.group())
>> h
  • 如果第一个字母不是h,那么就会失败。
text = 'ahello'
ret = re.match('h',text)
print(ret.group())
>> AttributeError: 'NoneType' object has no attribute 'group'
  • 如果想要匹配换行的数据,那么就要传入一个flag=re.DOTALL,就可以匹配换行符了。
text = "abc\nabc"
ret = re.match('abc.*abc',text,re.DOTALL)
print(ret.group())
  1. search函数
  • 在字符串中找满足条件的字符。如果找到,就返回。说白了,就是只会找到第一个满足条件的。
text = 'apple price $99 orange price $88'
ret = re.search('\d+',text)
print(ret.group())
>> 99
  1. findall函数
  • 找出所有满足条件的,返回的是一个列表。
text = 'apple price $99 orange price $88'
ret = re.findall('\d+',text)
print(ret)
>> ['99', '88']
  1. sub函数
  • 用来替换字符串。将匹配到的字符串替换为其他字符串。
text = 'apple price $99 orange price $88'
ret = re.sub('\d+','0',text)
print(ret)
>> apple price $0 orange price $0
  1. split函数
  • 使用正则表达式来分割字符串。
text = "hello world ni hao"
ret = re.split('\W',text)
print(ret)
>> ["hello","world","ni","hao"]
  1. compile函数
  • 对于一些经常要用到的正则表达式,可以使用compile进行编译,后期再使用的时候可以直接拿过来用,执行效率会更快。而且compile还可以指定flag=re.VERBOSE,在写正则表达式的时候可以做好注释。
text = "the number is 20.50"
r = re.compile(r"""\d+ # 小数点前面的数字\.? # 小数点\d* # 小数点后面的数字""",re.VERBOSE)
ret = re.search(r,text)
print(ret.group())

2.爬取知乎250部电影信息

结合requests、re两者的内容爬取https://movie.douban.com/top250里的内容,要求抓取名次、影片名称、年份、导演等字段。

代码如下

import requests
import redef openurl(url):user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'headers = {'User-Agent': user_agent}try:r = requests.get(url, headers = headers, timeout = 20)r.raise_for_status()r.encoding = r.apparent_encodingreturn r.textexcept:print('无法访问网页' + url)if __name__ == '__main__':douban_250 = []for i in range(10):url = 'https://movie.douban.com/top250?start='url += str(i * 25)text = openurl(url)ranks = re.findall('<em class="">(.*)</em>', text)movie_names = re.findall('<img width="100" alt="(.*)" src="https', text)counties = re.findall('&nbsp;/&nbsp;(.*)&nbsp;/&nbsp;',text)directors = re.findall('导演: (.*)&nbsp;&nbsp;&nbsp;主演', text)z = zip(ranks, movie_names, counties, directors)for i in z:douban_250.append(i)with open('/Users/user/Desktop/22/movie250.txt', 'w') as f:for i in douban_250:f.writelines(str(i) + '\n')

结果如下

('1', '肖申克的救赎', '美国', '弗兰克·德拉邦特 Frank Darabont')
('2', '霸王别姬', '中国大陆 香港', '陈凯歌 Kaige Chen')
('3', '这个杀手不太冷', '法国', '吕克·贝松 Luc Besson')
('4', '阿甘正传', '美国', '罗伯特·泽米吉斯 Robert Zemeckis')
('5', '美丽人生', '意大利', '罗伯托·贝尼尼 Roberto Benigni')
('6', '千与千寻', '日本', '宫崎骏 Hayao Miyazaki')
('7', '泰坦尼克号', '美国', '詹姆斯·卡梅隆 James Cameron')
('8', '辛德勒的名单', '美国', '史蒂文·斯皮尔伯格 Steven Spielberg')
('9', '盗梦空间', '美国 英国', '克里斯托弗·诺兰 Christopher Nolan')
('10', '忠犬八公的故事', '美国 英国', '莱塞·霍尔斯道姆 Lasse Hallström')
('11', '机器人总动员', '美国', '安德鲁·斯坦顿 Andrew Stanton')
('12', '三傻大闹宝莱坞', '印度', '拉库马·希拉尼 Rajkumar Hirani')
('13', '放牛班的春天', '法国 瑞士 德国', '克里斯托夫·巴拉蒂 Christophe Barratier')
('14', '海上钢琴师', '意大利', '朱塞佩·托纳多雷 Giuseppe Tornatore')
('15', '楚门的世界', '美国', '彼得·威尔 Peter Weir')
('16', '大话西游之大圣娶亲', '香港 中国大陆', '刘镇伟 Jeffrey Lau')
('17', '星际穿越', '美国 英国 加拿大 冰岛', '克里斯托弗·诺兰 Christopher Nolan')
('18', '龙猫', '日本', '宫崎骏 Hayao Miyazaki')
('19', '熔炉', '韩国', '黄东赫 Dong-hyuk Hwang')
('20', '教父', '美国', '弗朗西斯·福特·科波拉 Francis Ford Coppola')
('21', '无间道', '香港', '刘伟强 / 麦兆辉')
('22', '疯狂动物城', '美国', '拜伦·霍华德 Byron Howard / 瑞奇·摩尔 Rich Moore')
('23', '当幸福来敲门', '美国', '加布里尔·穆奇诺 Gabriele Muccino')
('24', '怦然心动', '美国', '罗伯·莱纳 Rob Reiner')
('26', '蝙蝠侠:黑暗骑士', '美国 英国', '克里斯托弗·诺兰 Christopher Nolan')
('27', '乱世佳人', '美国', '维克多·弗莱明 Victor Fleming / 乔治·库克 George Cukor')
('28', '活着', '中国大陆 香港', '张艺谋 Yimou Zhang')
('29', '控方证人', '美国', '比利·怀尔德 Billy Wilder')
('30', '少年派的奇幻漂流', '美国 台湾 英国 加拿大', '李安 Ang Lee')
('31', '指环王3:王者无敌', '美国 新西兰', '彼得·杰克逊 Peter Jackson')
('32', '摔跤吧!爸爸', '印度', '涅提·蒂瓦里 Nitesh Tiwari')
('33', '天空之城', '日本', '宫崎骏 Hayao Miyazaki')
('34', '鬼子来了', '中国大陆', '姜文 Wen Jiang')
('35', '天堂电影院', '意大利 法国', '朱塞佩·托纳多雷 Giuseppe Tornatore')
('36', '十二怒汉', '美国', 'Sidney Lumet')
('37', '飞屋环游记', '美国', '彼特·道格特 Pete Docter / 鲍勃·彼德森 Bob Peterson')
('38', '大话西游之月光宝盒', '香港 中国大陆', '刘镇伟 Jeffrey Lau')
('39', '哈尔的移动城堡', '日本', '宫崎骏 Hayao Miyazaki')
('40', '搏击俱乐部', '美国 德国', '大卫·芬奇 David Fincher')
('41', '罗马假日', '美国', '威廉·惠勒 William Wyler')
('42', '末代皇帝', '英国 意大利 中国大陆 法国', '贝纳尔多·贝托鲁奇 Bernardo Bertolucci')
('43', '寻梦环游记', '美国', '李·昂克里奇 Lee Unkrich / 阿德里安·莫利纳 Adrian Molina')
('44', '闻香识女人', '美国', '马丁·布莱斯 Martin Brest')
('45', '辩护人', '韩国', '杨宇硕 Woo-seok Yang')
('46', '素媛', '韩国', '李濬益 Jun-ik Lee')
('47', '窃听风暴', '德国', '彼得·威尔 Peter Weir')
('48', '死亡诗社', '美国', 'Guy Ritchie')
('49', '两杆大烟枪', '英国', '米洛斯·福尔曼 Miloš Forman')
('51', '指环王2:双塔奇兵', '美国 新西兰', '彼得·杰克逊 Peter Jackson')
('52', '教父2', '美国', '弗朗西斯·福特·科波拉 Francis Ford Coppola')
('53', '指环王1:魔戒再现', '新西兰 美国', '彼得·杰克逊 Peter Jackson')
('54', '狮子王', '美国', 'Roger Allers / 罗伯·明可夫 Rob Minkoff')
('55', 'V字仇杀队', '美国 英国 德国', '詹姆斯·麦克特格 James McTeigue')
('56', '美丽心灵', '美国', '朗·霍华德 Ron Howard')
('57', '饮食男女', '台湾 美国', '李安 Ang Lee')
('58', '海豚湾', '美国', '路易·西霍尤斯 Louie Psihoyos')
('59', '情书', '日本', '岩井俊二 Shunji Iwai')
('60', '钢琴家', '法国 德国 英国 波兰', '罗曼·波兰斯基 Roman Polanski')
('61', '大闹天宫', '中国大陆', '万籁鸣 Laiming Wan / 唐澄 Cheng  Tang')
('62', '本杰明·巴顿奇事', '美国', '大卫·芬奇 David Fincher')
('63', '何以为家', '黎巴嫩 法国 美国', '娜丁·拉巴基 Nadine Labaki')
('64', '哈利·波特与魔法石', '美国 英国', 'Chris Columbus')
('65', '看不见的客人', '西班牙', '奥里奥尔·保罗 Oriol Paulo')
('66', '黑客帝国', '美国 澳大利亚', '朱塞佩·托纳多雷 Giuseppe Tornatore')
('67', '西西里的美丽传说', '意大利 美国', '马基德·马基迪 Majid Majidi')
('68', '小鞋子', '伊朗', '赛尔乔·莱翁内 Sergio Leone')
('69', '美国往事', '意大利 美国', '史蒂文·斯皮尔伯格 Steven Spielberg')
('70', '拯救大兵瑞恩', '美国', '姜文 Wen Jiang')
('71', '让子弹飞', '中国大陆 香港', '罗伯特·怀斯 Robert Wise')
('72', '音乐之声', '美国', '克里斯托弗·诺兰 Christopher Nolan')
('73', '致命魔术', '美国 英国', '大卫·芬奇 David Fincher')
('74', '七宗罪', '美国', '史蒂文·斯皮尔伯格 Steven Spielberg')
('76', '被嫌弃的松子的一生', '日本', '中岛哲也 Tetsuya Nakashima')
('77', '低俗小说', '美国', '昆汀·塔伦蒂诺 Quentin Tarantino')
('78', '沉默的羔羊', '美国', '乔纳森·戴米 Jonathan Demme')
('79', '蝴蝶效应', '美国 加拿大', '王家卫 Kar Wai Wong')
('80', '春光乍泄', '香港 日本 韩国', '梅尔·吉布森 Mel Gibson')
('81', '勇敢的心', '美国', '让-皮埃尔·热内 Jean-Pierre Jeunet')
('82', '天使爱美丽', '法国 德国', '马克·赫尔曼 Mark Herman')
('83', '穿条纹睡衣的男孩', '英国 美国', '蒂姆·波顿 Tim Burton')
('84', '剪刀手爱德华', '美国', '格斯·范·桑特 Gus Van Sant')
('85', '心灵捕手', '美国', 'Martin Scorsese')
('86', '禁闭岛', '美国', '韦斯·安德森 Wes Anderson')
('87', '布达佩斯大饭店', '美国 德国 英国', '詹姆斯·卡梅隆 James Cameron')
('88', '阿凡达', '美国 英国', '泷田洋二郎 Yôjirô Takita')
('89', '入殓师', '日本', '宫崎骏 Hayao Miyazaki')
('90', '幽灵公主', '日本', '戈尔·维宾斯基 Gore Verbinski')
('91', '加勒比海盗', '美国', '查理·卓别林 Charles Chaplin')
('92', '摩登时代', '美国', 'James Mangold')
('93', '致命ID', '美国', '李安 Ang Lee')
('94', '断背山', '美国 加拿大', '姜文 Wen Jiang')
('95', '阳光灿烂的日子', '中国大陆 香港', '王家卫 Kar Wai Wong')
('96', '重庆森林', '香港', 'M·奈特·沙马兰 M. Night Shyamalan')
('97', '第六感', '美国', '托马斯·温特伯格 Thomas Vinterberg')
('98', '狩猎', '丹麦 瑞典', '周星驰 Stephen Chow / 李力持 Lik-Chi Lee')
('99', '喜剧之王', '香港', '亚当·艾略特 Adam Elliot')
('101', '消失的爱人', '美国', '大卫·芬奇 David Fincher')
('102', '告白', '日本', '中岛哲也 Tetsuya Nakashima')
('103', '大鱼', '美国', '蒂姆·波顿 Tim Burton')
('104', '小森林 夏秋篇', '日本', '森淳一 Junichi Mori')
('105', '一一', '台湾 日本', '杨德昌 Edward Yang')
('106', '阳光姐妹淘', '韩国', '姜炯哲 Hyeong-Cheol Kang')
('107', '爱在黎明破晓前', '美国 奥地利 瑞士', '理查德·林克莱特 Richard Linklater')
('108', '请以你的名字呼唤我', '意大利 法国 巴西 美国 荷兰 德国', '卢卡·瓜达尼诺 Luca Guadagnino')
('109', '射雕英雄传之东成西就', '香港', '刘镇伟 Jeffrey Lau')
('110', '甜蜜蜜', '香港', '陈可辛 Peter Chan')
('111', '侧耳倾听', '日本', '近藤喜文 Yoshifumi Kondo')
('112', '红辣椒', '日本', '今敏 Satoshi Kon')
('113', '驯龙高手', '美国', '迪恩·德布洛斯 Dean DeBlois / 克里斯·桑德斯 Chris Sanders')
('114', '倩女幽魂', '香港', '程小东 Siu-Tung Ching')
('115', '超脱', '美国', '托尼·凯耶 Tony Kaye')
('116', '恐怖直播', '韩国', '金秉祐 Byeong-woo Kim')
('117', '菊次郎的夏天', '日本', '北野武 Takeshi Kitano')
('118', '爱在日落黄昏时', '美国', '理查德·林克莱特 Richard Linklater')
('119', '风之谷', '日本', '宫崎骏 Hayao Miyazaki')
('120', '小森林 冬春篇', '日本', '森淳一 Junichi Mori')
('121', '7号房的礼物', '韩国', '李焕庆 Hwan-kyeong Lee')
('122', '杀人回忆', '韩国', '奉俊昊 Joon-ho Bong')
('123', '哈利·波特与死亡圣器(下)', '美国 英国', '大卫·叶茨 David Yates')
('124', '海蒂和爷爷', '德国 瑞士 南非', '阿兰·葛斯彭纳 Alain Gsponer')
('125', '幸福终点站', '美国', '史蒂文·斯皮尔伯格 Steven Spielberg')
('126', '蝙蝠侠:黑暗骑士崛起', '美国 英国', '克里斯托弗·诺兰 Christopher Nolan')
('127', '上帝之城', '巴西 法国', '米林宏昌 Hiromasa Yonebayashi')
('128', '借东西的小人阿莉埃蒂', '日本', '大森贵弘 Takahiro Omori')
('129', '萤火之森', '日本', '唐·霍尔 Don Hall / 克里斯·威廉姆斯 Chris Williams')
('130', '超能陆战队', '美国', '李力持 Lik-Chi Lee')
('131', '唐伯虎点秋香', '香港', '皮艾尔·柯芬 Pierre Coffin / 克里斯·雷纳德 Chris Renaud')
('132', '神偷奶爸', '美国 法国', '是枝裕和 Hirokazu Koreeda')
('133', '无人知晓', '日本', '彼特·道格特 Pete Docter / 大卫·斯沃曼 David Silverman')
('134', '怪兽电力公司', '美国', '文牧野 Muye Wen')
('135', '我不是药神', '中国大陆', '詹姆斯·温 James Wan')
('136', '电锯惊魂', '美国', '罗启锐 Alex Law')
('137', '岁月神偷', '香港 中国大陆', '李·昂克里奇 Lee Unkrich')
('138', '玩具总动员3', '美国', '保罗·格林格拉斯 Paul Greengrass')
('139', '谍影重重3', '美国 德国', '梅尔·吉布森 Mel Gibson')
('140', '血战钢锯岭', '美国 澳大利亚', '科克·德·米科 Kirk De Micco / 克里斯·桑德斯 Chris Sanders')
('141', '疯狂原始人', '美国', '黑泽明 Akira Kurosawa')
('142', '七武士', '日本', '李安 Ang Lee')
('143', '喜宴', '台湾 美国', '吴宇森 John Woo')
('144', '英雄本色', '香港', '理查德·柯蒂斯 Richard Curtis')
('145', '真爱至上', '英国 美国 法国', '王家卫 Kar Wai Wong')
('146', '东邪西毒', '香港 台湾', '高畑勋 Isao Takahata')
('147', '萤火虫之墓', '日本', '乔·怀特 Joe Wright')
('148', '傲慢与偏见', '法国 英国 美国', '理查德·柯蒂斯 Richard Curtis')
('149', '时空恋旅人', '英国', '丹尼·鲍尔 Danny Boyle / 洛芙琳·坦丹 Loveleen Tandan')
('151', '黑天鹅', '美国', '达伦·阿罗诺夫斯基 Darren Aronofsky')
('152', '记忆碎片', '美国', '克里斯托弗·诺兰 Christopher Nolan')
('153', '心迷宫', '中国大陆', '忻钰坤 Yukun Xin')
('154', '纵横四海', '香港', '吴宇森 John Woo')
('155', '教父3', '美国', '弗朗西斯·福特·科波拉 Francis Ford Coppola')
('156', '荒蛮故事', '阿根廷 西班牙', '达米安·斯兹弗隆 Damián Szifron')
('157', '完美的世界', '美国', '克林特·伊斯特伍德 Clint Eastwood')
('158', '达拉斯买家俱乐部', '美国', '让-马克·瓦雷 Jean-Marc Vallée')
('159', '雨人', '美国', '巴瑞·莱文森 Barry Levinson')
('160', '花样年华', '香港', '王家卫 Kar Wai Wong')
('161', '三块广告牌', '美国 英国', '马丁·麦克唐纳 Martin McDonagh')
('162', '被解救的姜戈', '美国', '昆汀·塔伦蒂诺 Quentin Tarantino')
('163', '卢旺达饭店', '英国 南非 意大利 美国', '特瑞·乔治 Terry George')
('164', '海边的曼彻斯特', '美国', '肯尼斯·罗纳根 Kenneth Lonergan')
('165', '你的名字。', '日本', '新海诚 Makoto Shinkai')
('166', '头脑特工队', '美国', '藤森雅也 Masaya Fujimori')
('167', '你看起来好像很好吃', '日本', '杰茜·尼尔森 Jessie Nelson')
('168', '我是山姆', '美国', '尼克·卡索维茨 Nick Cassavetes')
('169', '恋恋笔记本', '美国', '瑞奇·莫尔 Rich Moore')
('170', '无敌破坏王', '美国', '杰拉尔·乌里 Gérard Oury')
('171', '虎口脱险', '法国 英国', '卡洛斯·沙尔丹哈 Carlos Saldanha / 克里斯·韦奇 Chris Wedge')
('172', '冰川时代', '美国', '郭柯 Ke Guo')
('173', '二十二', '中国大陆', '雅克·贝汉 Jacques Perrin / 雅克·克鲁奥德 Jacques Cluzaud')
('174', '海洋', '法国 瑞士 西班牙 美国 阿联酋', '严定宪 Dingxian Yan / 王树忱 Shuchen Wang')
('176', '雨中曲', '美国', '斯坦利·多南 Stanley Donen / 吉恩·凯利 Gene Kelly')
('177', '爆裂鼓手', '美国', '达米恩·查泽雷 Damien Chazelle')
('178', '未麻的部屋', '日本', '今敏 Satoshi Kon')
('179', '模仿游戏', '英国 美国', '莫滕·泰杜姆 Morten Tyldum')
('180', '一个叫欧维的男人决定去死', '瑞典', '汉内斯·赫尔姆 Hannes Holm')
('181', '燃情岁月', '美国', '爱德华·兹威克 Edward Zwick')
('182', '忠犬八公物语', '日本', 'Seijirô Kôyama')
('183', '人工智能', '美国', '史蒂文·斯皮尔伯格 Steven Spielberg')
('184', '魔女宅急便', '日本', '宫崎骏 Hayao Miyazaki')
('185', '房间', '爱尔兰 加拿大 英国 美国', '伦尼·阿伯拉罕森 Lenny Abrahamson')
('186', '穿越时空的少女', '日本', '细田守 Mamoru Hosoda')
('187', '魂断蓝桥', '美国', '茂文·勒鲁瓦 Mervyn LeRoy')
('188', '天书奇谭', '中国大陆', '王树忱 Shuchen Wang / 钱运达 Yunda Qian')
('189', '恐怖游轮', '英国 澳大利亚', '克里斯托弗·史密斯 Christopher Smith')
('190', '海街日记', '日本', '是枝裕和 Hirokazu Koreeda')
('191', '黑客帝国3:矩阵革命', '美国 澳大利亚', 'Andy Wachowski / Larry Wachowski')
('192', '猜火车', '英国', '丹尼·博伊尔 Danny Boyle')
('193', '完美陌生人', '意大利', '保罗·格诺维瑟 Paolo Genovese')
('194', '罗生门', '日本', '黑泽明 Akira Kurosawa')
('195', '阿飞正传', '香港', '王家卫 Kar Wai Wong')
('196', '香水', '德国 法国 西班牙 美国', '汤姆·提克威 Tom Tykwer')
('197', '可可西里', '中国大陆 香港', '陆川 Chuan Lu')
('198', '朗读者', '美国 德国', '史蒂芬·戴德利 Stephen Daldry')
('199', '头号玩家', '美国', '史蒂文·斯皮尔伯格 Steven Spielberg')
('200', '浪潮', '德国', '丹尼斯·甘塞尔 Dennis Gansel')
('201', '谍影重重2', '美国 德国', '保罗·格林格拉斯 Paul Greengrass')
('202', '谍影重重', '美国 德国 捷克', '道格·里曼 Doug Liman')
('203', '牯岭街少年杀人事件', '台湾', '杨德昌 Edward Yang')
('204', '功夫', '中国大陆 香港', '周星驰 Stephen Chow')
('205', '战争之王', '美国 法国', '安德鲁·尼科尔 Andrew Niccol')
('206', '地球上的星星', '印度', '阿米尔·汗 Aamir Khan')
('207', '疯狂的石头', '中国大陆 香港', '宁浩 Hao Ning')
('208', '初恋这件小事', '泰国', '徐克 Hark Tsui')
('209', '青蛇', '香港', 'Alfred Hitchcock')
('210', '惊魂记', '美国', '詹姆斯·卡梅隆 James Cameron')
('211', '终结者2:审判日', '美国 法国', '邓肯·琼斯 Duncan Jones')
('212', '源代码', '美国 加拿大', '理查德·林克莱特 Richard Linklater')
('213', '爱在午夜降临前', '美国 希腊', '是枝裕和 Hirokazu Koreeda')
('214', '步履不停', '日本', '李惠民 Raymond Lee')
('215', '新龙门客栈', '香港 中国大陆', '卡比尔·汗 Kabir Khan')
('216', '小萝莉的猴神大叔', '印度', '斯蒂芬·卓博斯基 Stephen Chbosky')
('217', '奇迹男孩', '美国 香港', '阿斯哈·法哈蒂  Asghar Farhadi')
('218', '一次别离', '伊朗 法国', '克里斯托弗·诺兰 Christopher Nolan')
('219', '追随', '英国', '约翰·卡尼 John Carney')
('220', '再次出发之纽约遇见你', '美国', 'Quentin Tarantino')
('221', '无耻混蛋', '美国 德国', '保罗·哈吉斯 Paul Haggis')
('222', '撞车', '美国 德国', '小津安二郎 Yasujirô Ozu')
('223', '东京物语', '日本', '爱德华·兹威克 Edward Zwick')
('224', '血钻', '美国 德国', 'Charles Chaplin')
('226', '彗星来的那一夜', '美国 英国', '詹姆斯·沃德·布柯特 James Ward Byrkit')
('227', '2001太空漫游', '英国 美国', '斯坦利·库布里克 Stanley Kubrick')
('228', '釜山行', '韩国', '延尚昊 Sang-ho Yeon')
('229', '梦之安魂曲', '美国', '达伦·阿伦诺夫斯基 Darren Aronofsky')
('230', '绿里奇迹', '美国', 'Frank Darabont')
('231', '新世界', '韩国', '朴勋政 Hoon-jung Park')
('232', '疯狂的麦克斯4:狂暴之路', '澳大利亚 美国', '乔治·米勒 George Miller')
('233', '聚焦', '美国', '托马斯·麦卡锡 Thomas McCarthy')
('234', 'E.T. 外星人', '美国', 'Steven Spielberg')
('235', '末路狂花', '美国 法国', '雷德利·斯科特 Ridley Scott')
('236', '这个男人来自地球', '美国', '理查德·沙因克曼 Richard Schenkman')
('237', '黑鹰坠落', '美国', '雷德利·斯科特 Ridley Scott')
('238', '发条橙', '英国 美国', 'Stanley Kubrick')
('239', '遗愿清单', '美国', '罗伯·莱纳 Rob Reiner')
('240', '变脸', '美国', '吴宇森 John Woo')
('241', '勇闯夺命岛', '美国', '迈克尔·贝 Michael Bay')
('242', '国王的演讲', '英国 澳大利亚 美国', '汤姆·霍珀 Tom Hooper')
('243', '我爱你', '韩国', '秋昌民 Chang-min Choo')
('244', '黄金三镖客', '意大利 西班牙 西德', 'Sergio Leone')
('245', '千钧一发', '美国', '安德鲁·尼科尔 Andrew Niccol')
('246', '非常嫌疑犯', '德国 美国', '布莱恩·辛格 Bryan Singer')
('247', '秒速5厘米', '日本', '新海诚 Makoto Shinkai')
('248', '驴得水', '中国大陆', '周申 Shen Zhou / 刘露 Lu Liu')
('249', '四个春天', '中国大陆', '陆庆屹 Lu Qing Yi')
('250', '卡萨布兰卡', '美国', '迈克尔·柯蒂兹 Michael Curtiz')

Day2--正则表达式相关推荐

  1. .net core 正则表达式 获取 等号后面的值_Python3 正则表达式

    Python人工智能 - python 人工智能-神经网络 - 创客学院直播室​www.makeru.com.cnPython AI开发实战营 - Day2:Python世界中的封装与异常 - 创客学 ...

  2. [day2]python网络爬虫实战:爬取美女写真图片(增强版)

    l> 我的新书<Android App开发入门与实战>已于2020年8月由人民邮电出版社出版,欢迎购买.点击进入详情 文章目录 1.开发环境 2.第三方库 3.实现 1.分析url格 ...

  3. C# 从入门到入土(自学笔记)--Day2

    目录 学习目标: 学习内容: 学习时间: 学习产出: C#封装 C#方法 C#可空类型 C#数组 C#字符串 学习目标: 手打代码,并把所有代码封装成函数,在入口函数调用即可.一个main只有一个re ...

  4. 第四周Day2 —— Python的re模块和面向对象

    第四周Day2 -- Python的re模块和面向对象 一.re模块 1.re.compile(正则表达式) ​ 根据正则表达式创建一个正则表达式对象. re_obj = re.compile('\d ...

  5. 【 js基础 Day2】js的流程控制:分支语句,循环.顺序结构

    复习 JavaScript简称为JS JavaScript是什么? 是一门脚本语言:不需要编译,直接运行 是一门解释性的语言:遇到一样代码就解释一行代码 C#语言是一门面向对象的语言,也是编译语言,是 ...

  6. 通过正则表达式校验手机号码,拿走即用!

    校验手机号码 2021/01/06更新,电信新增了191号段 1. 单纯校验长度 2.正则表达式校验数字 3.正则表达式校验是否是大陆号码 4.正则表达式校验是否是香港号码 //校验长度private ...

  7. Linux shell 学习笔记(15)— shell 正则表达式

    1. 定义 BRE 模式 1.1 纯文本 第一条原则就是:正则表达式模式都区分大小写.这意味着它们只会匹配大小写也相符的模式. $ echo "This is a test" | ...

  8. re2正则表达式匹配引擎的c接口版本cre2的中文使用手册

    前言 re2 官方地址: https://github.com/google/re2 cre2 官方地址: https://github.com/marcomaggi/cre2 1 基本类型定义 不透 ...

  9. 正则表达式(括号)、[中括号]、{大括号}的区别小结

    正则表达式(括号).[中括号].{大括号}的区别小结 </h1><div class="clear"></div><div class=& ...

  10. Python中正则表达式用法 重点格式以这个为准_首看_各种问题

    20210811 https://www.jb51.net/article/101258.htm 一.惰性模式的概念: 此模式和贪婪模式恰好相反,它尽可能少的匹配字符以满足正则表达式即可,例如: va ...

最新文章

  1. Inplayable技术分享
  2. Pytorch——YOLOv3
  3. leetcode算法题--可被三整除的最大和
  4. 怎样通过WireShark抓到的包分析出SIP流程图
  5. 启用第三方Chrome插件
  6. 浙大团队研发铜基沸石纱布口罩,1分钟杀灭新冠病毒逾99%
  7. react 条件渲染
  8. 【机器学习】贝叶斯线性回归(最大后验估计+高斯先验)
  9. linux ftp用户指定多个目录,linux ftp服务器下用户限制目录的方法
  10. linux 分区 备份软件下载,硬盘分区备份(Image For Windows)
  11. django shortcut函数
  12. 494. 目标和(JavaScript)
  13. ACM PKU 1019 Number Sequence http://acm.pku.edu.cn/JudgeOnline/problem?id=1019
  14. mysql56 配置内存_【mysql】mysql 内存配置调优
  15. kubernetes Pod yaml解析注释
  16. 【权值分块】bzoj1588 [HNOI2002]营业额统计
  17. 单片机-控制-伺服电机-舵机
  18. 后场村的加班别有不同
  19. 赛博朋克2077 夜曲余烬电梯无法进入+保镖堵门bug解决方法
  20. Java内存泄漏分析系列之七:使用MAT的Histogram和Dominator Tree定位溢出源

热门文章

  1. 433lora手持机|手持数据采集终端|lora模块手持PDA
  2. SQLSERVER EXPRESS 安装失败 code1645
  3. 基于java的电子病历管理系统ssh框架
  4. 【POJ 2484】A Funny Game(对称博弈)
  5. 三步使用Docker容器创建RoboCup仿真2D环境
  6. python 桑基图_数据可视化之 Sankey 桑基图的实现
  7. Learning Spatio-Temporal Transformer for Visual Tracking——精读笔记
  8. 永洪BI配置测试及遇到的一些问题
  9. 智慧校园是实现智慧教育的必由之路
  10. 数据分析师前景如何,需要学习什么技能?