我需要使用BeautifulSoup从页面获取所有文本.在BeautifulSoup的文档中,它显示你可以做soup.get_text()来做到这一点.当我在reddit.com上尝试这样做时,我收到了这个错误:

UnicodeEncodeError in soup.py:16

'cp932' codec can't encode character u'\xa0' in position 2262: illegal multibyte sequence

我在我检查的大多数网站上都遇到了类似的错误.

当我做了soup.prettify()时,我也遇到了类似的错误,但我通过将其更改为soup.prettify(‘UTF-8’)来修复它.有没有什么办法解决这一问题?提前致谢!

6月24日更新

我发现了一些似乎适用于其他人的代码,但我仍然需要使用UTF-8而不是默认代码.码:

texts = soup.findAll(text=True)

def visible(element):

if element.parent.name in ['style', 'script', '[document]', 'head', 'title']:

return False

elif re.match('', str(element)): return False

elif re.match('\n', str(element)): return False

return True

visible_texts = filter(visible, texts)

print visible_texts

但错误是不同的.进展?

UnicodeEncodeError in soup.py:29

'ascii' codec can't encode character u'\xbb' in position 1: ordinal not in range

(128)

python中soup_python – 使用带有UTF-8的soup.get_text()相关推荐

  1. python中soup_python中BeautifulSoup的详细介绍(附代码)

    本篇文章给大家带来的内容是关于python中BeautifulSoup的详细介绍(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. Beautiful Soup提供一些简单的. ...

  2. python发送邮件带附件_在python中如何发送带有附件的邮件?

    在发邮件时,如果需要发文件,我们会与电子邮件附在一起传送至对方邮箱.用来附加说明或者提供材料用的电子表格 网页.数据库等等是不能简单用文本形式的邮件来发送的,而且表格.网页.数据库等在邮件服务商提供的 ...

  3. 怎样使用python画复杂函数_在python中绘制复杂的函数?

    我试图在python中绘制一个带有可变参数的复杂函数,并且发现我无法解释的差异.我的代码如下所示:import matplotlib.pyplot as plt from numpy import p ...

  4. Python中常用最神秘的函数! lambda 函数深度总结!

    今天我们来学习 Python 中的 lambda 函数,并探讨使用它的优点和局限性 Let's do it! 什么是 Python 中的 Lambda 函数 lambda 函数是一个匿名函数(即,没有 ...

  5. Python处理Excel表中单元格带有换行的数据

    Python处理Excel表中单元格带有换行的数据 文章目录 Python处理Excel表中单元格带有换行的数据 问题样式 实例问题 实例实现代码 实例结果 问题样式 在数据处理过程中常常会遇到这样一 ...

  6. html绑定带有形参的函数,Python中函数参数类型和参数绑定

    参数类型 Python函数的参数类型一共有五种,分别是: POSITIONAL_OR_KEYWORD(位置参数或关键字参数) VAR_POSITIONAL(可变参数) KEYWORD_ONLY(关键字 ...

  7. python中引入名称中带有横杠模块的时候出现:SyntaxError: invalid syntax

    首先使用pip3 list查看pyhton中存在哪些模块 通过上图可知,我们有模块de-core-news-sm 然后,在python中import带有横杠的模块的时候,会报错:SyntaxError ...

  8. 使用Python中自带的print输出带有颜色或者背景的字符串

    方法1: 使用Python中自带的print输出带有颜色或者背景的字符串 书写语法 print(\033[显示方式;前景色;背景色m输出内容\033[0m) 其中,显示方式.前景色.背景色都是可选参数 ...

  9. python 示例_在Python中带有示例的while关键字

    python 示例 关键字的Python (Python for keyword) while is a keyword (case-sensitive) in python, it is used ...

最新文章

  1. 一次被僵尸网络病毒攻击的过程
  2. shellcode 编码技术
  3. 下一代微服务架构基础:ServiceMesh?
  4. “农业大数据”专题征文通知
  5. 安装英伟达驱动,提示驱动和windows版本不兼容或是硬件不兼容的问题
  6. Axure 元件导入元件库
  7. 工程测量附合导线简易平差计算(附软件下载)
  8. 用友集团前端面经整理及答案
  9. SpringBoot2.6.5整合CXF框架
  10. python下载所有 XKCD 漫画
  11. 深度学习在情感分类中的应用
  12. 国产CAD软件对于AutoCAD,更适合哪种?
  13. uC/OS和uClinux的比较
  14. mac android工具下载,适用于Mac OS的安卓数据恢复软件Android Toolkit,支持macOS 10.15?...
  15. 旁路电容与去耦电容,傻傻分不清
  16. Maven 打jar包部署到生产环境的pom文件
  17. canvas绘制video
  18. 01.软件项目管理与敏捷方法——敏捷项目生命周期详解笔记
  19. 空投:实现去中心化、建立DAO的必经之路
  20. 化学中计算机模拟试题,高三期中化学考试试题(内附答案)

热门文章

  1. sklearn自学指南(part52)--潜在狄利克雷分配(LDA)
  2. sklearn自学指南(part16)--SGD,Perceptron,PassiveAggressive
  3. 图卷积神经网络(part5)--GraphSAGE
  4. 图卷积神经网络(part4)--GNN
  5. 第三次学JAVA再学不好就吃翔(part9)--基础语法之键盘录入
  6. 线性回归模型算法原理及Python实现
  7. 基于业务解释的特征重要性计算
  8. 使用 SAP UI5 消费 OData 服务的一些常见错误和解决方案
  9. jMeter 里如何使用 variable
  10. 介绍一个能将任意关键字高亮实现的 Visual Studio Code 扩展