我正在尝试将字符串拆分为单词和标点符号,并将标点符号添加到拆分生成的列表中。

例如:

>>> c = "help, me"

>>> print c.split()

['help,', 'me']

我真正希望列表看起来像是:

['help', ',', 'me']

因此,我希望将字符串在空白处拆分,并将标点符号与单词分开。

我尝试先解析字符串,然后运行拆分:

>>> for character in c:

...     if character in ".,;!?":

...             outputCharacter = " %s" % character

...     else:

...             outputCharacter = character

...     separatedPunctuation += outputCharacter

>>> print separatedPunctuation

help , me

>>> print separatedPunctuation.split()

['help', ',', 'me']

这会产生我想要的结果,但是在大文件上速度很慢。

有办法更有效地做到这一点吗?

python将字符串拆分成单词_将字符串拆分为单词和标点符号相关推荐

  1. Java 将字符串拆分成数组,实现字符串组合

    将字符串拆分成数组和实现字符串组合 不能使用语言的基本分割组合函数(如 Java 的 String.split, php 的 explode 和 implode) 1) 字符串拆分成字符串数组,如&q ...

  2. java String中文字符串分割成数组 中文字符串分割成一定长度的字符串数组

    java String中文字符串分割成一定长度的字符串数组 /*** 几个字一组 变量控制 大于零有意义*/ int num = 6; /*** 待操作的字符串*/ String str = &quo ...

  3. python去除字符串中的单词_从字符串中删除单词列表

    看着你问题的其他答案,我注意到他们告诉你如何做你想做的事,但他们没有回答你在最后提出的问题.If the input query is "What is Hello", I get ...

  4. angular 字符串转换成数字_蓝盟IT外包,Python算法的一般技术和嵌入式库|python|字符串|key|算法|调用...

    近年来,随着python着火,python也开始受到很多程序员的喜爱. 很多程序员已经开始使用python作为第一语言. 最近在python上刷问题时,我想去找python的刷问题常用库api和刷问题 ...

  5. python字符串转换成整数_在Python中将字符串转换为整数的方法

    在本文中,我们将向你展示如何将Python字符串转换为整数,可在Linux操作平台上进行.Python中的所有数据类型(包括整数和字符串)都是对象,通常在编写Python代码时,你需要将一种数据类型转 ...

  6. mybatis字符串转成数字_计算机储存数字和字符的方法你了解多少?

    前语:不要为了读文章而读文章,一定要带着问题来读文章,勤思考. 本文链接: http://1t.click/J7E 前言 最近在学习中涉及到计算机储存.传输数字和字符等操作,由于对字节.2进制.10进 ...

  7. python英文版怎么改成中文版_“PyQt的Qt Designer菜单是中文版的,怎么改成英文的“python的qt designer教程...

    python qt designer 怎么多建一个dialog 请说的详细点,那原消?还是只是出外一个窗口,如果出现另外一个窗口,那么这个窗口是 exec()吗?就是弹出窗口不关闭无法点击原有窗口,即 ...

  8. oracle将字符串转成数组_【算法打卡】上升下降字符串

    小时候的偶像,现在还是 难度:简单 题目: 给你一个字符串 s ,请你根据下面的算法重新构造字符串: 从 s 中选出 最小 的字符,将它 接在 结果字符串的后面. 从 s 剩余字符中选出 最小 的字符 ...

  9. python判断字符串是否回文_判断字符串是否为回文 python

    回文正序和逆序一样的字符串,例如abccba 方法一 def is_palindrome1(text): l = list(text) l.reverse() t1 = ''.join(l) if t ...

  10. java如果把字符串转成对象_为什么Java中的字符串对象是不可变的,有什么好处?...

    专注于Java领域优质技术号,欢迎关注 原创: 阿杜的世界 阅读本文大概需要 4分钟. 所谓不可变对象,是指一个对象在创建后,它的内部状态不会被改变的对象.这意味着当我们将一个不可变对象的引用赋值给某 ...

最新文章

  1. 如何获取数据库中标的所有字段和数据类型?
  2. 【linux】CMake Error in CMakeLists.txt: No CMAKE_CXX_COMPILER could be found.
  3. Android自定义动态壁纸,Android自定义动态壁纸开发详解
  4. Linux下安装部署ElasticSearch教程【7.10.1】
  5. 《机器学习实战》第十五章 MapReduce
  6. 丁力 | cnSchema:中⽂知识图谱的普通话
  7. DOM 事件深入浅出(一)
  8. IE10 访问 ASP.NET 站点的问题
  9. Vue 新手引导标签
  10. ajax 实时进度_三分钟搭建websocket实时在线聊天,项目经理也不敢这么写
  11. Linux下头文件.h的使用
  12. 什么是CMMI认证?
  13. VS中打开C项目源文件、头文件分类文件夹不见了?这样操作打开!
  14. 神剑轩辕java,上古十大神剑有哪些 有一把居然是专门用来弑君杀父的
  15. macOS下快速复制文件或文件夹路径
  16. Domain Adaptive在无监督语义分割上的应用
  17. 电脑常用快捷键与指示灯
  18. pythons_pythons是什么意思_pythons怎么读_pythons翻译_用法_发音_词组_同反义词_巨蛇_大蟒( python的名词复数 )-新东方在线英语词典...
  19. EasyNVR 使用记录
  20. matlab 画图中线型及颜色设置

热门文章

  1. 如何从零搭建一个hexo博客网站01
  2. java 6 linux_CentOS 6.5 安装java
  3. 报错日常——Tomcat45秒超时问题
  4. phabricator mysql_Phabricator服务的搭建
  5. php上传图片并显示代码,php图片上传代码(完整版已测试)
  6. 持续集成(Continuous integration)
  7. 国家计算机科学进展,主动网络安全的研究与进展
  8. 山东大学青岛计算机学院贺平,计算机学院学子在全国数学建模竞赛中再获佳绩...
  9. html字符串替换src,替换html字符串中img标签src的值.
  10. 最小的JAVA WEB SERVER源程序 可正常運行