其实从html富文本中提取纯文本很简单,富文本基本上是使用html标签给文本加上丰富多彩的样式。

所以只需要将富文本字符串中的“<.....>”标签剔除,即可得到纯文本。我们可以使用正则表达式,来匹配所有的html标签,并替换成空字符,如下:

//html剔除富文本标签,留下纯文本
function getSimpleText(html){
var re1 = new RegExp("<.+?>","g");//匹配html标签的正则表达式,"g"是搜索匹配多个符合的内容
var msg = html.replace(re1,'');//执行替换成空字符
return msg;
}

java:

str = str.replaceAll("<.+?>", "");

------------------------------------

原文地址:

https://blog.csdn.net/fengxi__/article/details/79297773

转载于:https://www.cnblogs.com/commissar-Xia/p/11330168.html

从html富文本中提取纯文本相关推荐

  1. Java实现从Html文本中提取纯文本

    1.应用场景:从一份html文件中或从String(是html内容)中提取纯文本,去掉网页标签: 2.代码一:replaceAll搞定 //从html中提取纯文本public static Strin ...

  2. js把vue转化html,将 vue.js 获取的 html 文本转化为纯文本

    我存入数据表中的数据是使用 html  格式,获取数据是使用 vue 获取. 遇到了一个问题,就是界面上显示的数据是 html 格式的,但是我需要它显示纯文本. 怎么做呢?首先在  js  中写一个将 ...

  3. PHP提取富文本中的纯文字

    有时候富文本的内容需要放到列表页进行展示,这个时候就不能直接把content展示出来了,需要进行数据处理(只取文字部分)来展示 /*** 提取富文本中的纯文字* addtime 2020年8月10日 ...

  4. python自动发邮件富文本_django 实现后台从富文本提取纯文本

    前言: 很多时候我们都会用富文本,比如说在版权区.博客文章编辑时等等.但是如果我们要做一个搜索的功能,去从富文本中查找关键字,就需要将富文本中的文本了.但是 django 并没有专门函数去做.这个时候 ...

  5. HtmlParser提取网页中的纯文本信息

    转载自   HtmlParser提取网页中的纯文本信息 HTMLParser 一个解析web页面的开源类库.           准备学习下搜索方面的技术,就学习了些网络爬虫的知识.最近一直在一个点上 ...

  6. python-批量提取srt文件中的纯文本

    python-批量提取srt文件中的纯文本 1.功能介绍 为了方便日常的使用,我将批量提取 srt 文件中纯文本的程序打包成了 exe 文件,这样就不用安装 python 环境和相关的库了. 现在版本 ...

  7. 一种精确从文本中提取URL的思路及实现

    在今年三四月份,我接受了一个需求:从文本中提取URL.这样的需求,可能算是非常小众的需求了.大概只有QQ.飞信.阿里旺旺等之类的即时通讯软件存在这样的需求.在研究这个之前,我测试了这些软件这块功能,发 ...

  8. 自然语言处理(NLP)之从文本中提取时间

    在我们的日常生活和工作中,从文本中提取时间是一项非常基础却重要的工作,因此,接下来将介绍如何从文本中有效地提取时间.   举个简单的例子,我们需要从下面的文本中提取时间: 6月28日,杭州市统计局权威 ...

  9. 从文本中提取知识图谱代码比较好的,代码对齐,可以使用的

    从文本中提取知识图谱代码比较好的,代码对齐,可以使用的 https://blog.csdn.net/fendouaini/article/details/102987373 https://blog. ...

最新文章

  1. 我们学习效率为什么这么低?CMU和PITT的科学家利用BCI技术对此做了相关研究
  2. 程序员请注意:异步编程模式已被人注册为专利
  3. 【翻译】WF从入门到精通(第六章):加载和卸载实例
  4. Django实战(1):需求分析和设计
  5. opengl 安装_一步步学OpenGL(34) -《GLFX,一个OpenGL效果库》
  6. java todo error_Java全局异常处理(TODO)
  7. 14002.petalinux编译配置项目
  8. 计算机数值方法(1):引论
  9. 基于ABBYY SDK 实现java版本 Hello 功能!
  10. 两个pdf合并成一个pdf
  11. 抖音招商团长入驻条件
  12. 计算机毕业设计基于Android的计算器app设计
  13. 【UE4笔记】蓝图联机游戏制作
  14. 如何找回存储在DBeaver连接中的数据库密码
  15. 5.zookeeper集成Java项目curator客户端
  16. CSS中Margin的注意问题
  17. 直播美颜sdk是什么?它是怎么让用户”变美“的?
  18. WEB安全之:SQL Injection--DVWA环境测试
  19. ‘xxx‘ is not public in ‘xxx‘,Cannot be accessed from outside package
  20. 今年双十一,一个时代的落幕!

热门文章

  1. matlab偏微分方程工具箱求解
  2. 使用threeJS根据点的坐标绘制曲线
  3. btoa java,java的btoa、atob
  4. vue 秒转换为时分秒_三年级数学上册时分秒换算口诀(附重点习题)
  5. 第九届“图灵杯”NEUQ-ACM程序设计竞赛个人赛题解
  6. java bufferedinputstream关闭_Java BufferedInputStream close()用法及代码示例
  7. java txt 二维数组_java 将一个二维数组存到txt文件里,然后再读取
  8. linux iops 监控,企业级监控软件使用zabbix key 监控IOPS状态
  9. Android调用系统相册、拍照以及裁剪最简单的实现(兼容7.0)
  10. python︱函数、for、if、_name_、迭代器、防范报错、类定义、装饰器、argparse模块、yield