我正在致力于Twitter数据标准化。Twitter用户经常使用诸如此类的术语来强调“爱”一词。我希望通过替换重复的字符,直到获得合适的有意义的词,将这样的重复字符变成一个适当的英语单词(我知道通过这种机制我无法区分善与恶)。

我的策略是

识别此类重复字符串的存在。我会寻找两个以上相同的字符,因为可能没有一个英文单词包含两个以上的重复字符。

String[] strings = { "stoooooopppppppppppppppppp","looooooove", "good","OK", "boolean", "mee", "claaap" };

String regex = "([a-z])\\1{2,}";

Pattern pattern = Pattern.compile(regex);

for (String string : strings) {

Matcher matcher = pattern.matcher(string);

if (matcher.find()) {

System.out.println(string+" TRUE ");

}

}

在诸如Wordnet之类的词典中搜索此类单词

替换两个重复字符之外的所有字符,然后检入Lexicon

如果不在词典中,请删除另一个重复字符(否则将其视为拼写错误)。

由于我缺乏Java知识,所以我无法管理3和4。问题是,我不能替换两个重复的连续字符。以下代码段替换了所有重复的字符,但重复的字符除外

System.out.println(data.replaceAll("([a-zA-Z])\\1{2,}", "$1"));

需要帮助来找出A。如何替换除2个连续重复字符之外的所有字符B.如何从A的输出中删除另一个连续字符[我认为B可以通过以下代码段进行管理]

System.out.println(data.replaceAll("([a-zA-Z])\\1{1,}", "$1"));

编辑:WiktorStribiżew提供的解决方案可以在Java中完美运行。我想知道需要什么更改才能在python中获得相同的结果。Python使用re.sub。

java 去掉连续重复字符串_替换Java中连续的重复字符相关推荐

  1. java找重复字符串_在java中怎样查找重复字符串

    在一段java编程代码中,字符串是不可缺少的一个要素,属于java中的基础知识,字符串不仅在java面试题中会出现,在编写代码时更要掌握怎样使用字符串.在前面我们也学习过关于字符串截取的知识,你应该有 ...

  2. python查找数列中重复数字_在数组中找出重复的数字(异或法)

    购买本课程后,可以加51CTO学院李宁老师官方交流群:550369460注意,该群只允许购买李宁老师课程的学员进行技术交流,加群时需要提供在51CTO购买李宁老师课程的订单编号(任何一个课程的订单编号 ...

  3. java list 去空字符串_【JAVA基础】list和字符串判空

    前言: 我们在项目中经常需要对获取的list集合或String类型变量判空,看前辈的代码,不同的人判空的方法不一样,那么,Java代码中,对list集合和String类型变量到底该如何判空呢? 一.J ...

  4. java sql server连接字符串_关于Java:SQL Server的等效jdbc连接字符串

    我目前正在使用以下连接字符串连接到数据库(该数据库与ServerIP在同一服务器上): String constr ="Data Source=ServerIP,1433;Network L ...

  5. java以逗号截取字符串_使用java流获取逗号分隔的字符串

    我使用 java Stream有以下代码. 我正在尝试获取函数来构建一个值的字符串:"a,b"在这种情况下. 但是,输出(在这种情况下,separateByComma)始终为&qu ...

  6. java整数转二进制字符串_在Java中将int转换为二进制字符串表示形式?

    AbbyPaden.. 5 这是我几分钟前刚写的东西.希望能帮助到你! public class Main { public static void main(String[] args) { Arr ...

  7. 【源码+图片素材】Java王者荣耀游戏开发_开发Java游戏项目【王者荣耀】1天搞定!!!腾讯游戏_Java课程设计_Java实战项目_Java初级项目

    王者荣耀是当下热门手游之一,小伙伴们是否想过如何制作一款属于自己的王者荣耀游戏呢? 本课程讲解了一个王者荣耀游戏的详细编写流程,即使你是刚入门Java的新手,只要你简单掌握了该游戏所需要的JavaSE ...

  8. java密码框转字符串_实现汉字的凯撒密码(内容包括:去掉字符串中的转义字符、汉字的unicode转换)...

    实验内容: 选择合适的秘钥,利用上述三个算法:熟悉恺撒密码.双重置换密码.一次一密密码算法.加密如下明文: 大风起兮云飞扬, 威加海内兮归故乡, 安得猛士兮守四方. <大风歌>--刘邦 3 ...

  9. java中井号字符串_深入Java基础(二)——字符串

    这段时间在准备找一份java实习工作,所以来把基础知识整理归纳一下 文章结构: 1.equals和== 2.字符串的基本知识以及字符串的源码解读: 3.字符串的注意点以及使用推荐: 一.equals和 ...

  10. java判断是否第一次出现_利用java判断字符首次出现的位置,java替换最后一个特定字符...

    利用java判断字符首次出现的位置利用爪哇判断字符首次出现的位置, 目的: (学习视频分享:java视频教程 实现代码如下: 导入Java.util.收藏品: 导入Java.util.LinkedLi ...

最新文章

  1. PCL点云配准(2)
  2. Android中的PopupWindow详解
  3. 字符串操作练习:星座、凯撒密码、99乘法表、词频统计预处理
  4. 在mysql中怎样设置值唯一_mysql怎么设置行值唯一?
  5. leetcode刷题练习
  6. 如何使 React 中的 useEffect、useLayoutEffect 只调用一次
  7. 2017.7.26 幻想乡战略游戏 失败总结
  8. 简单的php文件上传实例
  9. C++——判身份证号码真伪
  10. 项目启动管理、需求分析、可行性方案论证  IT项目管理
  11. Centos7清理垃圾文件或过期文件
  12. 零基础玩转树莓派(六)—遥控小车
  13. 企业级客户端病毒清除工具 Damage Cleanup Service
  14. 动网产品失败, 合作伙伴寒心离去
  15. 最新微信公众号文章数据导出软件工具
  16. 测试路由器的防火墙配置,wan:入站数据,出站数据,转发
  17. 为艺术而生的惊艳算法
  18. VMware虚拟化- vMotion 迁移原理与应用
  19. 【android】EditText输入银行卡号每四位空一格
  20. 【智能材料】用人工智能发现新型材料,金属玻璃可替代钢材

热门文章

  1. UnsatisfiedDependencyException报错的原因
  2. C++阶段03笔记03【文件操作(文本文件读写、二进制文件读写)】
  3. 九宫格六边形html,六边形拼图
  4. Oracle EBS FSG报表运行无数据RG_RARG0004Error
  5. 1378:最短路径(shopth)
  6. qq 客服 php,QQ支持临时会话设置
  7. 戴尔启动修复无法自动修复此计算机,在 Dell 计算机上运行 Windows 启动修复
  8. android 桌面快捷方式静态shortcuts异常
  9. 支付宝接口 设置支付宝订单的超时时间为15分钟
  10. 预编译的头文件 pch.h