我面临的问题是我在XML中有一个字符串的节点,代表HTML。 我需要削减该字符串,但是,当然,这可能导致在invalide HTML的标记(例如,如果我切字符串总是后30个字符我很容易失去闭元件等等)。 怎么办? 这似乎是非常困难的,因为我没有通过谷歌找到真正的帮助。XSLT:将字符串解析为XML节点集(concret:将HTML-String转换为节点集)?

我的想法至今:以“分析字符串”和正则表达式选择节点和内容,并把它们写上课XML元素节点。 但是我遇到很大的问题来处理所有情况,特别是嵌套节点。

有人有一些想法吗?

FYI:我的记事本:

正则表达式:抓住第一个标签

第一个节点的读标记名

认沽标记名正则表达式和搜索整个标签,还可以选择字符串的其余部分(去请稍后再试)

查看完整内容:更多标签?是: - >步骤1中,无: - >步骤5

写入标签作为节点元件

字符串取其余 - >步骤1

下面是XML的文档:

header

A little article. Here it's already done!

]]>

我想要做什么:

在我有一个字符串(HTML),只是想输出字符的特殊金额(例如,前25)。当我这样做只是在弦上,我得到这样的结果:

"

header

A little article"

在下一步我把这个字符串的HTML输出,但在这一点上,我获得合法的标记,因为

-Tag不关闭。

所以我的第一种方法是:解析这个字符串以获取每个标记的XML-Nodes,然后遍历每个节点,编写一个xml元素(以确保最终标记将有效)并复制尽可能多的字符,直到达到极限,在这个例子中将是25个字符。

2012-01-03

K.S.

+0

您可能希望在您的问题中包含您的XML文档。 –

2012-01-03 09:50:48

+0

你对输入XML有任何控制吗?如果你没有使用CDATA标签,这可能是可能的。使用CDATA标记,HTML字符串仅被视为文本的通用字符串,并且不容易在HTML标记处进行分析。删除CDATA标签,然后您可以开始匹配标签... –

2012-01-03 10:51:43

+0

请编辑您的问题并提供转换所需的结果。目前还不清楚你想要“删除”哪个字符串。 –

2012-01-03 12:56:39

xml html 转化为字符串,XSLT:将字符串解析为XML节点集(concret:将HTML-String转换为节点集)?...相关推荐

  1. java类对象转化成字符串_String类型字符串(xml格式)转换成java对象类型

    使用到的包: 1. 2. 将字符串类型的字符串转换成的Java的对象时,需要先将字符的格式转换成JSON格式的字符串(所以用到了json.jar包),在使用JSON格式的字符串转换成的Java的对象类 ...

  2. python把字符串转化为字典_python 将字符串转换为字典

    在一般的工程处理中,需要将获取的字符串数据转换为字典,这样处理起来会非常方便. 我获取的是json数据: content = {"corpus_no":"64702772 ...

  3. python 爬虫(七)lxml模块 + lxml数据提取(字符串的xml/html文件--转换--element对象--转换--字符串)调用XPath方法筛选数据 + 案例(扇贝 酷狗 网易云音乐)

    爬虫小知识:爬取网站流程 确定网站哪个url是数据的来源. 简要分析一下网站结构,查看数据一般放在哪里. 查看是否有分页,解决分页的问题. 发送请求,查看response.text里面是否有我们想要的 ...

  4. python把字符串转化为字典_python 将字符串转换成字典dict的各种方式总结

    1)利用eval可以将字典格式的字符串与字典户转 >>>mstr = '{"name":"yct","age":10}' ...

  5. java中获取XML中的子xml_如何将子元素从XML提取到Java中的字符串?

    小编典典 没错,使用标准XML API并不是一种好方法-这是一个示例(可能是bug缠身:它可以运行,但是我很久以前就写了). import javax.xml.*; import javax.xml. ...

  6. python获取月份字符串_python 时间字符串与日期转化

    python 时间字符串与日期转化 datetime.datetime.strptime(string, format) 根据指定的格式解析字符串为一个datetime类型.相当于datetime.d ...

  7. java秒转换为年月日_java时间转化为年月日以及将秒转化为天小时分秒字符串显示总结...

    注意:php的后台的时间按照秒计算,android按照毫秒计算,所以时间 String getstrtime = Tool.getNormalTime(Long.parseLong(time + &q ...

  8. 题目:请写一段将正整数转化为四进制字符串的函数(十进制正整数转四进制字符串)

    题目: 请写一段将正整数转化为四进制字符串的函数,函数原型和参看说明如下:Stringchange_to_4(long a) 输入:a,这是long类型的正整数 输出:是一个由'0'.'1'.'2'. ...

  9. java时分秒字符串转时间,秒转化为天小时分秒字符串的java实现和js实现

    需求描述:将秒转化为天小时分秒字符串显示,例如:3660s --> 1小时1分0秒 java实现: /** * 秒转化为天小时分秒字符串 * * @param seconds * @return ...

最新文章

  1. 【java】兴唐第十五节课
  2. 一场“交通进化”将至: 5G带给车联网与自动驾驶哪些升级?
  3. 一起谈.NET技术,在.NET Workflow 3.5中使用多线程提高工作流性能
  4. 一个可以设置中奖概率的抽奖程序[转]
  5. 中国全装修行业发展形势及投资决策建议报告2022版
  6. 利用 commit 理解镜像构成
  7. Django 使用 mysql 数据库连接
  8. 理论基础 —— 索引 —— 分块索引
  9. git 查看代码量_学会这三个命令,你就不再是git只会用三板斧的菜鸟了
  10. CCF201712-1 最小差值
  11. 1.6 Dropout 正则化
  12. 第9章 逻辑回归 学习笔记 上
  13. 容器技术Docker K8s 42 Serverless Kubernetes(ASK)详解-ASK应用管理
  14. cocos2d-x-3.x 场景(3)场景切换特效
  15. 沟通管理-输入、输出、工具和技术
  16. 5000预算组装台式机配置清单
  17. 黑马程序员——java 泛型
  18. 告别2016迎接2017,分享一些第三方插件
  19. Torchtext快速入门(一)——Vocab
  20. java海康威视设备注册、获取摄像头、录像机在线状态,获取指定摄像头PTZ值

热门文章

  1. Mysql索引示例_MYSQL索引实例
  2. 波士顿大学计算机与传媒专业,波士顿大学传媒专业好吗
  3. python指定文件路径_python实现指定文件夹下的指定文件移动到指定位置
  4. controller配对与接触配对
  5. 创业型公司的产品经理应该知道的事情
  6. nginx源码学习资源
  7. WinCE 修改系统字体 开启ClearType平滑字体
  8. php中的控制器是什么意思,理解PHP中的MVC编程之控制器_php
  9. java 登录编程_Java编程通过session访问需要登录的页面
  10. java游戏服务器面试_我做游戏开发这八年