今天在写一个简单爬虫,最后的文本提取部分,却一直提不出想要的部分。
文本格式是这样的

<div class="rich-content topic-richtext"><p data-align="left">文本文本文本</p>
</div>

离文本最近的<p data-align="left">不固定,只能用上面的<div class="rich-content topic-richtext">来匹配,但是用我仅知道的re的一点皮毛re.findall('(.*?)',text)发现,一直匹配不到
查了半天,才意识到我的问题是,匹配多行文本,顺利找到方法:

https://www.jianshu.com/p/ebb3694a2b80

re.compile()函数可接受一个有用的标记–re.DOTALL。这使得正则表达式中的句点(.)可以匹配所有的字符,也包括换行符

添加re.DOTALL,顺利解决

comment = re.compile(r'(.*?)', flags=re.DOTALL)

比起解决问题,更重要的是知道你在面临什么问题

re正则表达式匹配多行文本相关推荐

  1. php正则表达式 匹配多行,PHP正则表达式怎么匹配多行

    PHP正则表达式怎么匹配多行 一.总结 1.可以用匹配模式修饰符s来使点匹配所有字符,包括换行符. 二.PHP匹配多行的正则表达式分析 代码如下: aaaa bbbb cccc dddd 像这种的文本 ...

  2. PHP正则表达式——匹配多行

    <table> <tr><td>aaaa</td></tr> <tr><td>bbbb</td>< ...

  3. 正则表达式匹配多行注解/**/

    /* Location:           C:\Users\admin\Documents\sdf\WEB-INF\lib\sds-server-validcode-1.1.0-SNAPSHOT. ...

  4. Python: 正则表达式匹配多行,实现多行匹配模式

    1) 点 (.)去匹配任意字符的时候,不能匹配换行符 在这个模式中(?:.|\n)是指定了一个非捕获组(仅仅用来做匹配,部能通过单独捕获或者编号的组) 2) re.DOTALL re.compile( ...

  5. PHP正则表达式怎么匹配多行

    PHP正则表达式怎么匹配多行 一.总结 1.可以用匹配模式修饰符s来使点匹配所有字符,包括换行符. 二.PHP匹配多行的正则表达式分析 代码如下: <table>  <tr>& ...

  6. IOS 正则表达式匹配文本中URL位置并获取URL所在位置(解决连接中文问题)

    IOS 正则表达式匹配文本中URL位置并获取URL所在位置(解决连接中文问题) 参考文章: (1)IOS 正则表达式匹配文本中URL位置并获取URL所在位置(解决连接中文问题) (2)https:// ...

  7. 【python正则表达式匹配获取文本中的11位手机号码】

    [python正则表达式匹配获取文本中的11位手机号码] 文前白话 代码实现 效果 正则知识补充 文前白话 根据需要,匹配一段没有固定格式的文本,识别其中的11位数字作为手机号,如果11位数字后还有数 ...

  8. re2正则表达式匹配引擎的c接口版本cre2的中文使用手册

    前言 re2 官方地址: https://github.com/google/re2 cre2 官方地址: https://github.com/marcomaggi/cre2 1 基本类型定义 不透 ...

  9. bigint对应java什么类型_「JAVA」从格式化输出到扫描输入,深究Java正则表达式匹配之道

    字符串是不可变的 字符串是不可变的,也就是说当字符串的内容发生改变的时候,会创建一个新的String对象:但是如果内容没有发生改变的时候,String类的方法会返回原字符串对象的引用. 而正则表达式往 ...

最新文章

  1. Java 内部类及其原理
  2. 「行业趋势」人工智能凭什么“教育”人
  3. Linux中的chmod权限问题
  4. flume java_Flume的安装及简单的使用(一)
  5. hadoop 2.9.2 yarn配置公平调度器
  6. jmeter达梦数据库
  7. Webpack搭建ES6开发环境步骤
  8. angular源码分析之platformBrowserDynamic
  9. ARM上的Bootloader的具体实现1071098736
  10. java 位运算 hashcode_hashcode面试题
  11. 斐讯盒子N1_YYF_刷机ROM_讯飞语音助手实用版固件及教程分享
  12. JS/html5前端合成语音(播报)
  13. 亚商投资顾问 早餐FM/0913
  14. Dither(抖动): Bayer Matrix(Bayer ordered dither matrix)与Bayer Filter(拜尔滤镜)
  15. Axure谷歌浏览器扩展程序下载及安装方法(免翻墙)
  16. Android中的EditText输入银行卡号四位空一格
  17. 驱动开发:实现字符设备
  18. 探索AI实践最优解,AISummit全球人工智能技术大会完美落幕
  19. oracle 审计设置,oracle数据库审计设置
  20. 【JavaScript】原生态兼容IE6的图片轮播

热门文章

  1. JAVA实验七 图形用户界面的设计与实现
  2. ctf 命令执行总结
  3. Linux知识点整理(五)—— Linux 磁盘与文件系统管理
  4. Python 英文电影中参演人员名单一般以某种方式进行排版显示
  5. oracle vm win10,virtualbox win10系统下载-oracle vm virtualbox windows 10 64 bitv6.1.14 最新版 - 极光下载站...
  6. 软件开源,航芯方案分享 | 全自动咖啡机设计方案
  7. leetcode刷的一些杂题
  8. RSS订阅微信公众号初探-feed43
  9. Conflux CTO伍鸣博士应邀出席金色沙龙
  10. ch341a i2c 安卓_CH341A实现USB转I2C的问题