我试图用Python正则表达式库解析维基百科SQL转储。最终目标是将此转储导入PostgreSQL,但我知道字符串中的撇号需要事先加倍。

尽管在这个转储中的字符串中的每个撇号都有一个反斜杠,我宁愿不删除反斜杠。

(42,'Thirty_Years\'_War',33,5,0,0)

使用该命令

re.match(".*?([\w]+?'[\w\s]+?).*?", line)当'line'从文本文件中解析出来时,我无法在'Thirty_Years \'War'中找出撇号。

为了比较,这些行在解析时工作正常(没有最后一行)。

The person's car

The person's car's gasoline

Hodges' Harbrace Handbook

'Hodges' Harbrace Handbook'

portspeople',1475,29,0,0),(42,'Thirty_Years\'_War',33,5,0,0)

正确和预期的输出(无最后一行):

The person''s car

The person''s car''s gasoline

Hodges'' Harbrace Handbook

('Hodges'' Harbrace Handbook')

portspeople',1475,29,0,0),(42,'Thirty_Years\'_War',33,5,0,0)

使用该命令

re.match(".*?([\w\\]+?'[\w\s]+?).*?", line)打破它。

The person''s car

The person''''s car''''s gasoline

Hodges'' Harbrace Handbook

(''''''''Hodges'''''''' Harbrace Handbook'''''''')

portspeople'''''''''''''''',1475,29,0,0),(42,''''''''''''''''Thirty_Years\''''''''''''''''_War'''''''''''''''',33,5,0,0)

它是否陷入某种循环?什么是正确的正则表达式代码使用?

我没有考虑SQL注入攻击,因为这个脚本只用于解析维基百科文章的转储(不包含SQL注入攻击的例子)。

python 如何匹配一撇字符_使用Python正则表达式解析斜杠和撇号相关推荐

  1. python正则匹配括号以及内容_【Python】正则表达式匹配最里层括号的内容

    现在有一个字符串: str1 = '(subject_id = "A" OR (status_id = "Open" AND (status_id = &quo ...

  2. python删除字符串中重复字符_从Python中删除字符串标点符号的最佳方法

    似乎有一个比以下更简单的方法: 1 2 3import string s ="string. With. Punctuation?" # Sample string out = s ...

  3. python replace替换多个字符_关于python:使用string.replace(x,y)替换所有

    我刚刚开始学习python,并希望使用string.replace(x,y). 具体来说,根据字母是否最初大写,将所有内容全部替换为X和x. 例如 John S. Smith - > Xxxx ...

  4. python怎么把图片变成字符_用Python把图片变成字符画

    更新!项目最新地址链接:click me 我们先来看一下效果(图为知乎的吉祥物:刘看山) 原画 字符画(由于图片较大,所以截图的时候未截完整:P) 代码在此,简单讲解请看代码的注释部分,部分详解在代码 ...

  5. python中怎样使用re模块_[转]Python中RE模块的应用

    Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 Emecs 风格的模式.Emacs 风格模式可读性稍差 ...

  6. python正则匹配空格+数字+空格_详解Python中正则匹配TAB及空格的小技巧

    详解Python中正则匹配TAB及空格的小技巧 发布时间:2020-10-15 08:38:48 来源:脚本之家 阅读:94 作者:杰瑞26 在正则中,使用.*可以匹配所有字符,其中.代表除\n外的任 ...

  7. python输出转义符字符_[8] Python转义字符和切片

    1. 概述 今天我们要补充一下字符串和列表的相关内容.加粗体代表我们已经介绍的内容,斜体代表新增内容.计算机编程的原理简要介绍 集成开发环境PyCharm 变量名.数字.字符串.列表 句式 输入和输出 ...

  8. python删除字符串中重复字符_删除字符串中重复字符python 用CAD怎么画DNA反向

    用CAD怎么画DNA反向平行双螺旋结构绘螺旋线时,用选扭曲,确定顺时针. 画双头螺旋线时,第二根螺旋线底圆起点与第一根螺旋线底圆起点,可用角度分隔如180°.python去除文本中重复的字符串可有可无 ...

  9. python字典合并输入用字符_左右用R右手Python9——字符串合并与拆分

    原标题:左右用R右手Python9--字符串合并与拆分 杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化.个人公众号:数 ...

最新文章

  1. django搭建示例-ubantu环境
  2. Mysql 内部结构 / Replication | 原理
  3. Dalvik中类的加载
  4. 【如何管理开机自启动程序】
  5. 数字电路数据选择器及其应用实验报告_科普|说说大数据是什么,及其特点与应用...
  6. 一些图形学中的数学应用
  7. python一个等号和两个等号的区别_请问Python语言中is与双等号==有什么区别及作用...
  8. 兼容之css中的hack
  9. html图片没有白边,css插入背景图片底部有白边的解决方法
  10. gds文件 导出_RSoft CAD新的导入/导出GDS档案方法
  11. TCP/IP协议号大全
  12. ps关于去除脸上的痘痘问题和美白问题
  13. gmail 邮箱服务器,gmail邮箱设置
  14. ERNIE-Enhanced Language Representation with Informative Entities 阅读笔记
  15. 木子案正判后的故事发展(猜想)
  16. web前端读取串口数据
  17. Activity、Service、子线程之间的消息传递轻松实现
  18. 海豚调度器初次使用 .......
  19. 设计模式之禅【迭代器模式】
  20. 【多图】二进制的起源,从01到创造天地万物

热门文章

  1. 【8.6】代码源 - 【前缀集】【矩阵游戏】【谁才是最终赢家?】【放置多米诺骨牌】
  2. 我们来了!多云架构时代,欢迎加入中国开源网络新势力
  3. Redis数据结构 GeoHash
  4. MCE公司:免疫治疗新课题——好心情,要保持!
  5. postman导出,断言,批量执行
  6. mysql我没压岁钱了,你压没压我?岁没岁我?该不该给我压岁钱表情包
  7. 武汉凭什么被列为国家超大城市?
  8. 服务器被挖矿入侵,进程 command为ld-linux-x86-64占用cpu很高,解决经历
  9. 程序员代码面试指南第二版 4.猫狗队列
  10. 眼见不为“实”,人们更信任人工智能合成的假脸