Atitit.jsou html转换纯文本 java c# php

1. 原理<p> <h> <li><div> 等lable转换为回车1

2. 调用2

3. Php的实现strip_tags2

4. 参考2

1. 原理<p> <h> <li><div> 等lable转换为回车

"'&(quot|#34);'i", // 替换 HTML 实体

作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 汉字名:艾龙,  EMAIL:1466519819@qq.com

转载请注明来源: http://blog.csdn.net/attilax

public void head(Node node, int depth) {

String name = node.nodeName();

if (node instanceof TextNode)

append(((TextNode) node).text());

else if (name.equals("li"))

append("\n * ");

}

public void tail(Node node, int depth) {

String name = node.nodeName();

if (name.equals("br"))

append("\n");

else if (StringUtil.in(name, new String[] { "p", "h1", "h2", "h3",

"h4", "h5" }))

append("\n\n");

else if (name.equals("a"))

append(String.format(" <%s>",

new Object[] { node.absUrl("href") }));

}

private void append(String text)

2. 调用

public static void main(String[] args) {

pathx.isWebPathMode = true;

String f = pathx.classPath() + "/com/attilax/cms/cms_tmplt.html";

String txt = filex.read(f);

Document doc = Jsoup.parse(txt);

// Document doc = Jsoup.connect(url).get();

String plainText;

HtmlToPlainText formatter = new HtmlToPlainText();

plainText = formatter.getPlainText(doc);

System.out.println(plainText);

String x = "工作时间:08:00-22:00\r\n性别要求:男女不限";

x = plainText;

@SuppressWarnings("rawtypes")

Map m = new RowParser().parse(x);

System.out.println(AtiJson.toJson(m));

System.out.println("---f");

}

3. Php的实现strip_tags

string strip_tags(string str[,string allowable_tags])

4. 参考

Jsoup代码解读之一-概述 - ImportNew.htm

PHP将HTML转换成纯文本内容实例-Php常用代码-Php教程-壹聚教程网.htm

Atitit.jsou html转换纯文本 java c# php相关推荐

  1. java邮箱格式_JavaMail入门:创建纯文本、HTML格式的邮件

    转自:http://haolloyin.blog.51cto.com/1177454/353849/ 在 http://java.sun.com/products/javamail/ 下载了 Java ...

  2. Java实现从Html文本中提取纯文本

    1.应用场景:从一份html文件中或从String(是html内容)中提取纯文本,去掉网页标签: 2.代码一:replaceAll搞定 //从html中提取纯文本public static Strin ...

  3. excel函数公式html文档,Excel中把计算式转换为运算结果的方法 EXCEL中计算出的公式如何转换成纯文本内容?...

    如何在EXCEL中将计算公式直接变结果如我在A1输入计算式:(1+2*3+4/5-6)*1.2+(1+5) 如何在B1得出该计算式的选中B1然后按快捷键ctrl+F3,进入名称管理器,新建,输入任意名 ...

  4. java过滤html标签获取纯文本信息

    转载自 java过滤html标签获取纯文本信息 package com.lyt.base.util;import java.util.regex.Pattern;public class Filter ...

  5. java使用htmlparser提取网页纯文本例子

    转载自   java使用htmlparser提取网页纯文本例子 这篇文章主要介绍了java使用htmlparser提取网页纯文本例子,需要的朋友可以参考下 package com.test; impo ...

  6. java如何去掉html标签_Java后端去掉HTML标签获取纯文本-Fun言

    今天又对我的博客首页进行了一次版本的更新,使其自适应屏幕,获得更好的用户体验,然后就出现点小问题,那就是原来的摘要是人为添加的,有长有短,对自适应屏幕有影响,所以我们现在是截取文章的前200个字来完成 ...

  7. vba编程把纯文本转换成html,如何在Excel的单元格中将HTML转换为文本?

    如何在Excel的单元格中将HTML转换为文本? 如下面的屏幕截图所示,如果工作表单元格中存在许多html标记,那么如何在Excel中将它们转换为纯文本? 本文将向您展示两种从Excel单元格中删除所 ...

  8. java 正则表达式提取html纯文本

    本文来自我的个人博客: java 正则表达式提取html纯文本 做内容的大家都知道,从html中直接提取纯文本是一个非常大的问题.现将我做的正则匹配贴上: import java.util.regex ...

  9. Atitit.js javascript异常处理机制与java异常的转换 多重catc hDWR 环境 .js exception process Vob7...

    Atitit.js javascript异常处理机制与java异常的转换 多重catc hDWR 环境 .js exception process Vob7 1. 1. javascript异常处理机 ...

  10. java 发送 mail 纯文本发送和html格式发送

    java 发送 mail 纯文本发送和html格式发送 一:需要引入mail maven jar包 <!--邮件发送包--> <dependency><groupId&g ...

最新文章

  1. 【天命奇御】成就进度62/71的通关攻略(1·开篇前言)
  2. java输入字符串异常_设计一个 Java 程序,自定义异常类,从命令行(键盘)输入一个字符串,如果该字符串值为“XYZ”。。。...
  3. rewrite or internal redirection cycle while processing nginx重定向报错
  4. 专题 11 IPC之管道
  5. 不会被计算机打败的棋类游戏,电脑首次打败人类围棋冠军意味着什么?
  6. 自定义View:测量measure,布局layout,绘制draw
  7. 信息系统项目管理师论文考试汇总(2010~2021年)
  8. SpringBoot-JPA的查询语言详解
  9. 优化 ASP.NET Core Docker 镜像的大小
  10. 2020德勤面试开始了吗_2020公务员面试公告已出,5月28日开始面试
  11. Netty 4.0 新的特性及需要注意的地方
  12. SpringCloud 从菜鸟到大牛之五 统一配置中心 Spring Cloud Config
  13. MC新手入门(十三)------ 添加游戏角色
  14. jQuery之事件移除
  15. 企业级工作流解决方案(七)--微服务Tcp消息传输模型之消息编解码
  16. ICPC程序设计题解系列
  17. 以太坊智能合约开发,Web3.js API 中文文档 ethereum web3.js入门说明
  18. matepad2会有鸿蒙os,华为MatePad Pro2曝光!两款产品,预装鸿蒙OS
  19. 智慧供水:整体解决方案建设需求
  20. 将人力资源HR纳入OKR

热门文章

  1. ttk.treeview鼠标悬浮文字_电竞新选择,罗技G键盘、鼠标、耳机三件套给力体验...
  2. window10运行python弹出商店_Python上架Windows 10应用商店,但主要用于学习,正式项目还...
  3. SnapHelper硬核讲解
  4. Python3中如何做的自定义模块的引用?
  5. 一个web项目web.xml的配置中context-param配置作用
  6. C语言实现base64编码,base64解码
  7. 互联网产品需求管理思考——统一需求管理
  8. Java EE 6 最终草案暗示了平台的未来发展方向
  9. 这个世界是怎么了?做商业软件的怎么越来越流氓了?
  10. python——import日常学习记录