我正在使用

PHP和libtidy来尝试筛选可能是历史上最糟糕和最不正确的HTML表格使用情况.该站点关闭了几个table,tr,td,font或bold标签,并且一致地嵌套了表中的许多不同的表层.

示例代码段:

Home Team - Wildcats

Away Team - Polar Bears

Rosters

Baird, T

Knight, P

Miller, B

Huebsch, B

11 

Buschmann, C

12 

Reding, J

14 

Simpson, S

27 

Kupferschmidt, M

28 

Anderson, D

31 

Gehrts, J

39 

McGinnis, G

42 

Temple, B

44 

Kemplin, A

77 

Weiner, B

95 

Zytkoskie, D

Mack, A

Foucault, R

11 

Oberpriller, D *

12 

Underwood, J

15 

Oberpriller, M

19 

Langfus, B

25 

Carroll, R

30 

Hirdler, T

33 

Gibson, S

35 

Marthaler, C

44 

Yurik, J

58 

Gronemeyer, S

Goals

Player

Period

Time

Assist 1

Assist 2

SH

PP

Kupferschmidt, M

1

12:51

Kemplin, A

None

McGinnis, G

1

12:33

Huebsch, B

None

Kupferschmidt, M

2

16:01

None

None

Buschmann, C

3

00:38

None

None

Player

Period

Time

Assist 1

Assist 2

SH

PP

Oberpriller, D *

3

12:31

Gronemeyer, S

None

Penalties

Player

Period

Minutes

Offense

Start

Expired

Buschmann, C

3

2

Interference

11:11

09:11

Buschmann, C

3

2

Unsportmanlike Conduct

03:26

01:26

Bench

3

2

Too Many Men

01:46

00:00

Player

Period

Minutes

Offense

Start

Expired

Marthaler, C

1

2

Interference

01:19

16:19

Underwood, J

2

2

Interference

12:32

10:32

Marthaler, C

3

2

Interference

11:39

09:39

Goalies

Name

Shots

Goals

Baird, T

20

1

Open Net

0

Name

Shots

Goals

Hirdler, T

42

奇怪的是,所有浏览器似乎都很好.

PHPTidy设法很好地理解了这一切,但是这些表是如此深入且几乎随机地嵌套,使用DOM XPath很难遍历它.

有没有人对其他方法有任何建议?

POST-MORTEM:经过太多的比利时小麦啤酒和弄脏了我的代码真正的好我通过strip_tags()删除所有标签除了table,tr和td,然后通过libtidy运行它得到了很好的结果.它现在格式很漂亮,很容易遍历.看起来它只是需要一点点按摩才能将它发送到解析器.

php代码丑,php – 屏幕截图你生命中见过的最丑陋的HTML相关推荐

  1. ASP.NET Web 页面生命中的一天

    ASP.NET Web 页面生命中的一天  Dino Esposito Wintellect 2003 年 8 月 适用于: Microsoft® ASP.NET 摘要:了解为 ASP.NET Web ...

  2. Android Studio 单刷《第一行代码》系列 06 —— Fragment 生命周期

    前情提要(Previously) 本系列将使用 Android Studio 将<第一行代码>(书中讲解案例使用Eclipse)刷一遍,旨在为想入坑 Android 开发,并选择 Andr ...

  3. 【转】赞一下huicpc035 和《 生命中的最后一天》

    本来以为HNU的huicpc035和我一样退役了,后来听说他组成了新的footman队,于是又关注了下他. 035体现了两个我觉得非常重要的品质: 1.刻苦的训练 2.有效的训练 (本文将主要讨论个人 ...

  4. 赞一下huicpc035 和《 生命中的最后一天》

    本来以为HNU的huicpc035和我一样退役了,后来听说他组成了新的footman队,于是又关注了下他. 035体现了两个我觉得非常重要的品质: 1.刻苦的训练 2.有效的训练 (本文将主要讨论个人 ...

  5. android studio生命周期代码,Android Studio 单刷《第一行代码》系列 06 —— Fragment 生命周期...

    前情提要(Previously) 本系列将使用 Android Studio 将<第一行代码>(书中讲解案例使用Eclipse)刷一遍,旨在为想入坑 Android 开发,并选择 Andr ...

  6. 别拒绝生命中偶尔的初恋

    不自觉的又要感叹一下光阴似箭.日月如梭,转眼都两个多月了,我的博客也沉寂了两个多月了. 6月底回家,七月一日正式到新单位报到,我已经在新的岗位上了整整两个月的班了.虽然新的工作也是一样有不如意的地方, ...

  7. 【Android 逆向】Android 进程注入工具开发 ( 注入代码分析 | 远程调用 目标进程中 libc.so 动态库中的 mmap 函数 三 | 等待远程函数执行完毕 | 寄存器获取返回值 )

    文章目录 前言 一.等待远程进程 mmap 函数执行完毕 二.从寄存器中获取进程返回值 三.博客资源 前言 前置博客 : [Android 逆向]Android 进程注入工具开发 ( 注入代码分析 | ...

  8. 【Android 逆向】Android 进程注入工具开发 ( 注入代码分析 | 远程调用 目标进程中 libc.so 动态库中的 mmap 函数 二 | 准备参数 | 远程调用 mmap 函数 )

    文章目录 一.准备 mmap 函数的参数 二.mmap 函数远程调用 一.准备 mmap 函数的参数 上一篇博客 [Android 逆向]Android 进程注入工具开发 ( 注入代码分析 | 远程调 ...

  9. 【Android 逆向】Android 进程注入工具开发 ( 注入代码分析 | 获取 远程 目标进程 中的 /system/lib/libc.so 动态库中的 mmap 函数地址 )

    文章目录 一.获取 远程 目标进程 中的 /system/lib/libc.so 动态库中的 mmap 函数地址 二.从 /proc/pid/maps 文件中获取 指定 进程 中的 /system/l ...

最新文章

  1. ubuntu18.04配置wifi 方法
  2. phpcms URL修改
  3. java占位符打印_java简单日志打印规范小记
  4. FP、FN、TP、TN、精确率(Precision)、召回率(Recall)、准确率(Accuracy)评价指标详述
  5. 采用Opserver来监控你的ASP.NET项目系列(三、监控你的服务器状态)
  6. ABC类IP地址划分
  7. JavaFTP文件传输 简单实现
  8. linux扫描仪安装程序,给扫描仪在Linux系统里安个家
  9. cadence SPB17.4 - export placement file to openpnp
  10. 这条命令帮我在一分钟内修改了200台远程服务器密码!
  11. 搜狗站群代码之搜狗批量推送工具
  12. 495. Teemo Attacking(提莫攻击)
  13. Extraneous non-emits event listeners (xxxXxx) were passed to component but could not be automaticall
  14. 苹果电脑桌面找不到计算机,苹果电脑MacBook桌面正下方的图标消失不见的解决方法...
  15. cad断点快捷键_CAD打断和打断于点怎么使用?CAD打断快捷键命令及操作方法
  16. 计算机格式怎么调,怎么改电脑硬盘格式?
  17. c++等边三角形(DFS实例)
  18. 【python】math函数库介绍及其例题
  19. Sam Altman 山姆奥特曼:如何成功 ?How To Be Successful
  20. 云支付登录 html,云闪付 · 迅鼎支付(免签) - 安装文档 · 看云

热门文章

  1. Linux debian安装Notepadqq,Linux系统下的Notepad++编辑器
  2. python爬虫获取中国天气网天气数据 requests BeautifulSoup re
  3. 微信开发3之php模板信息推送
  4. 计算机辅助设计教案板书,计算机辅助设计教案计机辅助设计教案.doc
  5. mysql 需要什么硬件配置_如何来给指定的硬件环境配置一份比较合理的MySQL配置文件-爱可生...
  6. emplace_back和push_back区别
  7. 灰度值怎么降级_微服务生态的灰度发布如何实现?
  8. 计算机网络最短路径路由选择,最短路径算法Dijkstra算法在路由选择中的应用.pdf...
  9. mysql jdbc 绑定变量_jdbc测试mysql数据库sql预解析(绑定变量)
  10. java 旅行家的预算_洛谷 P1016 旅行家的预算 Java解法