我目前正在尝试提取html元素,这些元素本身有一个文本,并用一个特殊的标记将它们包装起来。在

例如,我的HTML如下所示:

  • This text still has children

    Simple Text

    • Hello

      World

我试图将标记仅包装在标记周围,以便以后可以进一步解析它们,因此我尝试使其看起来像这样:

^{pr2}$

我目前还不能编辑我的脚本的位置,但是我还不能确定它的位置:def parseSection(node):

b = str(node)

changes = set()

tag_start, tag_end = extractTags(b)

# index 0 is the element itself

for cell in node.findChildren()[1:]:

if cell.findChildren():

cell = parseSection(cell)

else:

# safe to extract with regular expressions, only 1 standardized tag created by BeautifulSoup

subtag_start, subtag_end = extractTags(str(cell))

changes.add((str(cell), "[/EditableText]{0}[EditableText]{1}[/EditableText]{2}[EditableText]".format(subtag_start, str(cell.text), subtag_end)))

text = extractText(b)

for change in changes:

text = text.replace(change[0], change[1])

return bs("{0}[EditableText]{1}[/EditableText]{2}".format(tag_start, text, tag_end), "html.parser")

脚本生成以下内容:

[EditableText]

This text still has children

[/EditableText]

[EditableText]

Simple Text

[/EditableText]

[EditableText]

  • Hello [/EditableText]

    [EditableText][/EditableText]

    [EditableText]

    World

[/EditableText]

我怎样才能检查并修复它?我很感激每一个可能的答案。在

html中可以编辑的文本,用BeautifulSoup编辑html中的文本相关推荐

  1. Emacs中使用Forms-mode以表格形式展示/编辑简单的文本数据

    1 Forms-mode ~~~~~~~~~~~~~  * forms-mode涉及到两个文件:一个数据文件,存储了要展示的数据. 一个控制文件,描述了如何展示数据  * Emacs中使用Forms- ...

  2. Microsoft Word教程:如何在 Word 中创建文档、添加和编辑文本?

    欢迎观看 Microsoft Word 教程,小编带大家学习 Microsoft Word 的使用技巧,了解如何在 Word 中创建文档.添加和编辑文本. 创建文档,打开 Word,选择「空白文档」. ...

  3. Microsoft Word教程「1」,如何在 Word 中创建文档、添加和编辑文本?

    欢迎观看 Microsoft Word 教程,小编带大家学习 Microsoft Word 的使用技巧,了解如何在 Word 中创建文档.添加和编辑文本. 创建文档,打开 Word,选择「空白文档」. ...

  4. 在html中文本框不可编辑状态,input框不可编辑_怎么让Html文本框不可编辑

    摘要 腾兴网为您分享:怎么让Html文本框不可编辑,中国知网,优品多多,优路教育,银万财富等软件知识,以及hackertyperneo,永久进销存软件,dnf女鬼剑武器补丁,锁机软件,hevc编码器, ...

  5. s-sed(stream editor) 文本填充和编辑 基本使用

    文章目录 前言 语法格式 sed 操作地址 sed子命令 sed正则表达式 sed使用实例 打印命令 p 删除命令 d 替换命令 s 指定操作地址的范围 逗号 , 多重编辑命令 e 下行插入命令 a ...

  6. 如何编辑PDF文件,怎么修改PDF中的文字

    相信大家都使用过PDF文件,那么有没有编辑过PDF文件呢,PDF文件的编辑是需要借助PDF编辑器的,PDF文件中的文字要怎么修改呢,Word文档的文字就直接编辑,而PDF文件并非这样,想知道怎么编辑吗 ...

  7. vue input文本框中文字整体添加整体删除_揭秘神奇的PPT文本框,高手都喜欢这样的招数...

    大家好,我是A君,分享越多,快乐越多. 是否对PPT中的文本框操作还是简单的输入文字呢?赶紧看看PPT高手是如何利用文本框轻松制作出高级PPT的. 01 使用文本框转换成SmartArt 有时候,我们 ...

  8. 在WPF应用程序中利用IEditableObject接口实现可撤销编辑的对象

    这是我辅导的一个项目开发中的例子,他们是用WPF做界面开发,在学习了如何使用MVVM来实现界面与逻辑的分离,并且很好的数据更新之后,有一个疑问就是,这种双向的数据更新确实很不错,但如果我们希望用户可以 ...

  9. jq选中单选框后文本框不可编辑_打开速度最快最强大的PDF免费工具,编辑+阅读功能一体...

    前几天,有个同事遇到个问题,她在她的电脑上用word编辑好的教案,到了印刷室准备打印时,格式却变了.她只好又重新调整了一遍,才打印了出来.浪费了不少时间.大家听她说这个问题后,纷纷附和,原来大家都遇到 ...

最新文章

  1. [转]ASP.NET页面生命周期描述
  2. loadrunner录制0事件_LoadRunner脚本异常捕获处理
  3. mysql 查询语句 参数,mysql参数化查询语句有关问题
  4. 自然灾害能否被利用?
  5. 被忽视但很实用的那部分SQL
  6. RTSP服务器之————rtsp-server(轻量级RTSP / RTP流媒体服务器)
  7. C#中一些日期的相关操作
  8. 使用Dwr时出现java.lang.SecurityException: Access to debug pages is denied
  9. sqli-labs在线网站
  10. 用泛型的sort与binarySearch方法
  11. 《仿人机器人原理与实战》一2.2 行为链与仿人机器人设计
  12. 哇哦!?固件裁剪到1.82K? 他们是怎么做到的?
  13. linux自动清除超出的文件,Linux下面自动清理超过指定大小的文件
  14. python实现压缩文件夹
  15. 软件工程实践2017——软件产品案例分析
  16. 局域网使用teamviewer
  17. 中国有多少博士,博士现在的待遇水平如何?
  18. [RedHat学习笔记]总结现学的所有命令(RH033),以及相关概念。
  19. 服务器空间在线解压程序及使用教程
  20. 爱思华宝邮件服务器技术规范

热门文章

  1. unity 陀螺仪控制节点旋转
  2. CentOS 5/6下安装Axel插件加速yum下载
  3. inno setup 打包脚本学习
  4. 论Postgres的“已提交的而且 xmin’比当前事务的XID小的记录对当前事务才是可见的”...
  5. 状态机(FSM)的介绍--以检测序列1001为例
  6. 自己总结一下wpf image source 绑定的几种方式
  7. php excel 导入大量,用phpExcelReader不能导入大量数据解决办法
  8. 马哥语录第一季第二集
  9. cssd oracle,Oracle RAC /etc/init.d/init.cssd startcheck
  10. 【转】Visio(流程图绘制软件)的免费替代品