网上搜到的大都太复杂,最后找到一个用正则表达式实现的:

import re
s = "string. With. Punctuation?"
# 如果空白符也需要过滤,使用 r'[^\w]'
s = re.sub(r'[^\w\s]','',s)

支持中文和中文标点。

原理很简单:在正则表达式中,\w 匹配字母或数字或下划线或汉字(具体与字符集有关),^\w 表示相反匹配。

转自:http://baimoz.me/1656/

转载于:https://www.cnblogs.com/zl1991/p/10769922.html

python 过滤文本中的标点符号(转)相关推荐

  1. python过滤文本中的emoji表情

    python过滤文本中的emoji表情 最近在处理文本内容的时候发现很多文本会有特色表情,由于占位较多,想着能过滤掉就好,也不影响文本内容含义,并且对后续做语义分析也有帮助. 网上搜了下,总体还是通过 ...

  2. 如何用python读取文本中指定行的内容

    如何用python读取文本中指定行的内容 搜索资料 我来答 分享 新浪微博 QQ空间 浏览 5284 次 查看全文 http://www.taodudu.cc/news/show-64036.ht ...

  3. 用python统计字母个数_python统计字母个数 python 统计文本中字母个数

    python 统计文本中字母个数 作业文件等有人回答小编再发,之前发文件被屏蔽了明明转身就有一个温馨的港湾,却偏偏还要去追逐那无望的孤船. l = 0with open('file.txt', 'r' ...

  4. python过滤字符串中不属于指定集合的字符的代码

    将做工程过程比较重要的一些内容备份一下,如下资料是关于python过滤字符串中不属于指定集合的字符的内容. import string 生成所有字符的可复用的字符串,它还可以作为 一个翻译表,指明&q ...

  5. python提取文本中的字符串到新的txt_Python实现jieba对文本分词并写入新的文本文件,然后提取出文本中的关键词...

    版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. Python实现jieba对文本分词并写入新的文本文件,然后提取出文本中的关键词思想 先对文本进行 ...

  6. python不属于字符串的是_【python cookbook】python过滤字符串中不属于指定集合的字符...

    1 #!/usr/bin/python 2 #-*- coding: utf-8 -*- 3 4 #过滤字符串中不属于指定集合的字符 5 6 importstring7 8 #生成所有字符的可复用的字 ...

  7. python读取文本中的内容

    1.获取路径符 pathseq = os.path.seq 2.文本中获取内容 import os import sys from collections import OrderedDictdef ...

  8. 用perl过滤文本中的IP和端口

    1.可以提取html,等无规律的文本中的ip和端口. cat proxycn.txt  |perl -lne ' print $1 if ( /((\d{1,3}\.){3}\d{1,3}:\d{1, ...

  9. python 去除文本中的中文、中文符号

    删除中文及中文符号的方法,网上很多是python2 的写法,现在将python3的用法记录如下. 知识点 - 正则表达式 - 中文字符库zhon.hanzi,使用命令行pip3 install zho ...

最新文章

  1. 详解/etc/fstab文件内容
  2. a eraser eraser还是an_eraser前面用a还是an
  3. node 命令行升级版本
  4. IDM出现输入用户名和密码不能下载解决方法
  5. Python编程练习题
  6. 200 个工具分析机器学习十年:前途未卜、工程师是核心!
  7. w7设置双显示器_学习工作效率不高?处理事情慢半拍?教你使用双显示器来改善...
  8. 071120 sunny
  9. Web 前端视频资源分享(Bootstrap/Vue/小程序)
  10. 利用ARCGIS制作MIKE21边界文件
  11. 防病毒网关、防火墙与防病毒软件功能及部署对比
  12. echarts柱状图渐变色
  13. 谷歌地图kml能透明吗_如何打开KML和KMZ文件并与卫星影像叠加
  14. exlsx表格教程_excel表格制作教程
  15. PostgreSQL的学习心得和知识总结(十九)|数据库游标详细使用说明及特性总结(全网最精细最详尽 仰望星空也要脚踏实地)
  16. docker 出现错误:no such file or directory. Are you trying to connect to a TLS-enabled daemon without TLS
  17. 成功的条件:高人指点、贵人相助、小人监督、个人奋斗
  18. 感恩与祝福——与巴铁兄弟的友情告别
  19. php时间相减_PHP 日期加减计算方法示例
  20. 连接华为云服务中心常见问题汇总

热门文章

  1. account表里有什么 银行_模拟一个银行账户类Account,账户类中包括所有者、账号、余额、账户总数、存款、取款等信息。_学小易找答案...
  2. mysql 使用sum limit_mysql踩坑记录之limit和sum函数混合使用问题
  3. html标签info,HtmlTrInfo 元素
  4. python实现程序重启_python实现自动重启本程序的方法
  5. 基于javaweb(springboot+mybatis)宠物医院预约管理系统设计和实现
  6. 通信原理实验c语言,基于LabVIEW软件的通信原理实验教学平台设计方案
  7. c语言文件读写_学生信息管理系统(C语言\单向链表\文件读写)
  8. delay 芯片时序output_【第二章 STA概念 上】静态时序分析圣经翻译计划
  9. Android端发送字符到Wed端,android应用端向web端获取字符串。
  10. java hash取余_为什么Java的hash表的长度一直是2的指数次幂?为什么这个(hash(h-1)=hash%h)位运算公式等价于取余运算?...