Atitit.jsou html转换纯文本 java c# php
Atitit.jsou html转换纯文本 java c# php
1. 原理<p> <h> <li><div> 等lable转换为回车1
2. 调用2
3. Php的实现strip_tags2
4. 参考2
1. 原理<p> <h> <li><div> 等lable转换为回车
"'&(quot|#34);'i", // 替换 HTML 实体
作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 汉字名:艾龙, EMAIL:1466519819@qq.com
转载请注明来源: http://blog.csdn.net/attilax
public void head(Node node, int depth) {
String name = node.nodeName();
if (node instanceof TextNode)
append(((TextNode) node).text());
else if (name.equals("li"))
append("\n * ");
}
public void tail(Node node, int depth) {
String name = node.nodeName();
if (name.equals("br"))
append("\n");
else if (StringUtil.in(name, new String[] { "p", "h1", "h2", "h3",
"h4", "h5" }))
append("\n\n");
else if (name.equals("a"))
append(String.format(" <%s>",
new Object[] { node.absUrl("href") }));
}
private void append(String text)
2. 调用
public static void main(String[] args) {
pathx.isWebPathMode = true;
String f = pathx.classPath() + "/com/attilax/cms/cms_tmplt.html";
String txt = filex.read(f);
Document doc = Jsoup.parse(txt);
// Document doc = Jsoup.connect(url).get();
String plainText;
HtmlToPlainText formatter = new HtmlToPlainText();
plainText = formatter.getPlainText(doc);
System.out.println(plainText);
String x = "工作时间:08:00-22:00\r\n性别要求:男女不限";
x = plainText;
@SuppressWarnings("rawtypes")
Map m = new RowParser().parse(x);
System.out.println(AtiJson.toJson(m));
System.out.println("---f");
}
3. Php的实现strip_tags
string strip_tags(string str[,string allowable_tags])
4. 参考
Jsoup代码解读之一-概述 - ImportNew.htm
PHP将HTML转换成纯文本内容实例-Php常用代码-Php教程-壹聚教程网.htm
Atitit.jsou html转换纯文本 java c# php相关推荐
- java邮箱格式_JavaMail入门:创建纯文本、HTML格式的邮件
转自:http://haolloyin.blog.51cto.com/1177454/353849/ 在 http://java.sun.com/products/javamail/ 下载了 Java ...
- Java实现从Html文本中提取纯文本
1.应用场景:从一份html文件中或从String(是html内容)中提取纯文本,去掉网页标签: 2.代码一:replaceAll搞定 //从html中提取纯文本public static Strin ...
- excel函数公式html文档,Excel中把计算式转换为运算结果的方法 EXCEL中计算出的公式如何转换成纯文本内容?...
如何在EXCEL中将计算公式直接变结果如我在A1输入计算式:(1+2*3+4/5-6)*1.2+(1+5) 如何在B1得出该计算式的选中B1然后按快捷键ctrl+F3,进入名称管理器,新建,输入任意名 ...
- java过滤html标签获取纯文本信息
转载自 java过滤html标签获取纯文本信息 package com.lyt.base.util;import java.util.regex.Pattern;public class Filter ...
- java使用htmlparser提取网页纯文本例子
转载自 java使用htmlparser提取网页纯文本例子 这篇文章主要介绍了java使用htmlparser提取网页纯文本例子,需要的朋友可以参考下 package com.test; impo ...
- java如何去掉html标签_Java后端去掉HTML标签获取纯文本-Fun言
今天又对我的博客首页进行了一次版本的更新,使其自适应屏幕,获得更好的用户体验,然后就出现点小问题,那就是原来的摘要是人为添加的,有长有短,对自适应屏幕有影响,所以我们现在是截取文章的前200个字来完成 ...
- vba编程把纯文本转换成html,如何在Excel的单元格中将HTML转换为文本?
如何在Excel的单元格中将HTML转换为文本? 如下面的屏幕截图所示,如果工作表单元格中存在许多html标记,那么如何在Excel中将它们转换为纯文本? 本文将向您展示两种从Excel单元格中删除所 ...
- java 正则表达式提取html纯文本
本文来自我的个人博客: java 正则表达式提取html纯文本 做内容的大家都知道,从html中直接提取纯文本是一个非常大的问题.现将我做的正则匹配贴上: import java.util.regex ...
- Atitit.js javascript异常处理机制与java异常的转换 多重catc hDWR 环境 .js exception process Vob7...
Atitit.js javascript异常处理机制与java异常的转换 多重catc hDWR 环境 .js exception process Vob7 1. 1. javascript异常处理机 ...
- java 发送 mail 纯文本发送和html格式发送
java 发送 mail 纯文本发送和html格式发送 一:需要引入mail maven jar包 <!--邮件发送包--> <dependency><groupId&g ...
最新文章
- 【天命奇御】成就进度62/71的通关攻略(1·开篇前言)
- java输入字符串异常_设计一个 Java 程序,自定义异常类,从命令行(键盘)输入一个字符串,如果该字符串值为“XYZ”。。。...
- rewrite or internal redirection cycle while processing nginx重定向报错
- 专题 11 IPC之管道
- 不会被计算机打败的棋类游戏,电脑首次打败人类围棋冠军意味着什么?
- 自定义View:测量measure,布局layout,绘制draw
- 信息系统项目管理师论文考试汇总(2010~2021年)
- SpringBoot-JPA的查询语言详解
- 优化 ASP.NET Core Docker 镜像的大小
- 2020德勤面试开始了吗_2020公务员面试公告已出,5月28日开始面试
- Netty 4.0 新的特性及需要注意的地方
- SpringCloud 从菜鸟到大牛之五 统一配置中心 Spring Cloud Config
- MC新手入门(十三)------ 添加游戏角色
- jQuery之事件移除
- 企业级工作流解决方案(七)--微服务Tcp消息传输模型之消息编解码
- ICPC程序设计题解系列
- 以太坊智能合约开发,Web3.js API 中文文档 ethereum web3.js入门说明
- matepad2会有鸿蒙os,华为MatePad Pro2曝光!两款产品,预装鸿蒙OS
- 智慧供水:整体解决方案建设需求
- 将人力资源HR纳入OKR
热门文章
- ttk.treeview鼠标悬浮文字_电竞新选择,罗技G键盘、鼠标、耳机三件套给力体验...
- window10运行python弹出商店_Python上架Windows 10应用商店,但主要用于学习,正式项目还...
- SnapHelper硬核讲解
- Python3中如何做的自定义模块的引用?
- 一个web项目web.xml的配置中context-param配置作用
- C语言实现base64编码,base64解码
- 互联网产品需求管理思考——统一需求管理
- Java EE 6 最终草案暗示了平台的未来发展方向
- 这个世界是怎么了?做商业软件的怎么越来越流氓了?
- python——import日常学习记录