我正在编写一个beauthulsoup/python代码来从html表中获取数据。该表的问题是某些列可能有空白数据(单元格为空)。当我运行这段代码时,当它第一次遇到表中的空白单元格时,它会以一个“类型错误”停止,我只得到直到那行代码为止的输出。在

下面的代码在第一次出现空单元格时因类型错误而停止。在for tr in rows:

cols = tr.findAll('td')

for td in cols:

text = ''.join(td.find(text=True))

print

以上代码的输出示例-

^{pr2}$

注意,在上面输出的最后一行中,在last value(BB)之后没有数据。这是因为在表中有一个空白单元格,因此python在输出这么多数据后停止运行。在

我试图修改它,但现在它在某些已经有数据的单元格中输入空白。在

更新代码:for tr in rows:

cols = tr.findAll('td')

for td in cols:

if td.find(text=''):

text = ''.join('blank')

else:

text = ''.join(td.find(text=True))

print text + ", ",

print

以上代码的输出示例-blank, 123, c, d, 6, 0, blank, blank,

blank, 21, b, e, 6, 5, blank, blank,

blank, 1, a, f, 7, 5, blank,

注意-即使在上面的情况下,它在第三个单元格中遇到实际的空白数据后也会停止。在

我做错什么了?我基本上希望单元格输出在单元格没有数据时为空,否则输出应该是实际的单元格内容。在

python 获取表格中的空数据_在python beautifulsoup中获取表格单元格值为空时的文本输出...相关推荐

  1. mysql查询集合中的特定数据_快速查询List中指定的数据

    时间:2017/5/15 作者:李国君 题目:快速查询List中指定的数据 背景:当List中保存了大量的数据时,用传统的方法去遍历指定的数据肯定会效率低下,有一个方法就是类似于数据库查询那样,根据索 ...

  2. 怎样在单元格中插入图表_如何为Excel图表标签使用单元格值

    怎样在单元格中插入图表 Make your chart labels in Microsoft Excel dynamic by linking them to cell values. When t ...

  3. python 预测任意天后股票数据_在Python中使用LSTM进行股票市场预测

    本文概述 在本教程中, 你将看到如何使用称为长短期记忆的时间序列模型. LSTM模型功能强大, 特别是通过设计保留了长期记忆, 这一点将在以后看到.你将在本教程中解决以下主题: 了解为什么你需要能够预 ...

  4. 利用python爬取58同城简历数据_利用python爬取58同城简历数据-Go语言中文社区

    利用python爬取58同城简历数据 最近接到一个工作,需要获取58同城上面的简历信息(http://gz.58.com/qzyewu/).最开始想到是用python里面的scrapy框架制作爬虫.但 ...

  5. python获取mysql表中一列数据_将Python列表插入mySQL数据库中的一列

    嗨,我试图在一列中插入一个python列表,但是它总是在语法上给出错误. 这是新手.谢谢你的帮助.谢谢.在from time import time import MySQLdb import url ...

  6. python 从excel中抓取数据_使用Python抓取美团数据存于Excel中

    0.程序是针对美团中的美食部分数据按好评排序采集. 要抓取保存的数据为: 商家名类型  地理位置 评论人数  均价  最低价格 1.首先编写网页数据采集函数,使用request采集网页源码,具体实现如 ...

  7. python 读取xml获取包含指定标签的数据_用Python元素提取XML的特定行

    我有点困在我正在做的一个项目上,它使用Python--我对它非常陌生.我被告知使用ElementTree并从传入的XML文件中获取指定的数据.听起来很简单,但我不擅长编程.非常低(a!)一个传入文件的 ...

  8. python从csv提取需要的数据_使用Python从文本(CSV文件)中提取数据

    我正在帮助一个狗救助小组分析他们即将被收养的申请.所有应用程序都是通过在线系统输入的,每个应用程序都将获得一个自动生成的表单ID.然后将申请分配给不同的志愿者进行处理. 大多数信息都很简单,我可以使用 ...

  9. xlsx表格怎么筛选重复数据_怎样在excel2010中筛选出重复数据呢?

    数据是信息的表现形式和载体,可以是符号.文字.数字.语音.图像.视频等.数据和信息是不可分离的,数据是信息的表达,信息是数据的内涵.在这一篇教程里面,小编主要和大家简单的介绍一下:怎样在Excel20 ...

最新文章

  1. 钻井缸套排量_川庆钻探||合理化建议成果展示:用陶瓷代替金属,缸套使用寿命延长了10倍...
  2. 监控Spark应用方法简介
  3. Dataset:机器学习和深度学习中对数据集进行高级绘图(数据集可视化,箱线图等)的简介、应用之详细攻略——daidingdaiding
  4. YbtOJ#893-带权的图【高斯消元,结论】
  5. keras中的mini-batch gradient descent (转)
  6. DW制作过程基本标准常识
  7. matlab画爱心代码分享
  8. Codeforces Round #341 (Div. 2)
  9. 导入项目到IDEA报javax/xml/bind/DatatypeConverter错误?
  10. 实验4-1-10 兔子繁衍问题 (15 分)
  11. 3-5-多数组k大值
  12. StructLayout(LayoutKind.Sequential)(转)
  13. 如何去除计算机病毒,怎么清除计算机病毒
  14. maven deploy jar包和源码包到私服
  15. Cisco WLC 基础配置
  16. iMac恢复出厂设置及安装
  17. Problem G: 薪酬计算
  18. Codeforces711C 【DP】
  19. 美丽乡村可行性研究报告
  20. 云师大计算机调剂,云南师范大学调剂公告

热门文章

  1. 宽带ADSL安装过程的18个问答
  2. gnome-mplayer 挂载 srt字幕 乱码
  3. linux pn,Linux环境变量设置--总结
  4. python 内置函数_python的内置函数、方法
  5. selenium+webdriver错误...exceptions.ElementNotInteractableException: Message: Element is not visible处理
  6. 常用接口抓包以及接口测试工具总结
  7. JMeter功能不够用?看我的
  8. Seldom2.0: 如何更简单的实现HTTP接口测试
  9. PAT甲级1005 字符串的处理
  10. messagebox弹窗_从案例入手学Python——检测文件生成并弹窗提醒