版权声明:本文为CSDN博主「曾记否?」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_38607035/article/details/82595170

在写爬虫爬取网页信息时,发生了以下错误:
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’

意思大致是Unicode编码错误,gbk编解码器不能编码\xa0字符。

错误原因

当我们获取这个网页的源代码的时候,是将这个网页用utf-8的解码方式将其转换成对应的Unicode字符,当我们使用print()函数将其打印到Windows系统的DOS窗口上的时候(DOS窗口的编码方式是GBK),自动将Unicode字符通过GBK编码转换为GBK编码方式的str。

整个过程是: [用python爬取] UTF-8(str) -> [缓存中存放] Unicode(byte) -> [DOS中显示] GBK(str)

对比原网页,发现报错的位置原本要输出的文本为空,也就是目标标签内的值为 。

网页源代码中的  的utf-8 编码是:\xc2 \xa0,转换为Unicode字符为:\xa0,当显示到DOS窗口上的时候,转换为GBK编码的字符串,但是\xa0这个Unicode字符没有对应的 GBK 编码的字符串,所以出现错误。

UnicodeEncodeError: 'gbk' codec can't encode character '\xa0'相关推荐

  1. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 21: illegal multibyte sequ

    关于python的pywinaotu库print_control_identifiers()因为获取内容有'\xa0'而报错 报错内容: UnicodeEncodeError: 'gbk' codec ...

  2. Python3 解决编码问题: `UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: ille

    Python3 解决编码问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: illega ...

  3. UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 的解决方法

    最近初学网络爬虫,今天在练习使用Python的request模块的时候遇到了一个错误. import requests#发送请求 response = requests.get("https ...

  4. python UnicodeEncodeError: 'gbk' codec can't encode character ...

    使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character ' ...

  5. python encode gbk_[转]Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法

    使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character ' ...

  6. Python-logging报错解决:UnicodeEncodeError: 'gbk' codec can't encode character '\u' in position: illegal

    我在Python3 中使用Logging模块把日志打到终端输出时会报错. 代码如下: import logging logging.basicConfig(level=logging.INFO,fil ...

  7. 解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX

    从网上抓了一些字节流,想打印出来结果发生了一下错误: UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position ...

  8. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq

    解决UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 295: illegal multibyte s ...

  9. Python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character 解决方法

    Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法 参考文章: (1)Python UnicodeEncodeErro ...

  10. 解决python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xb5‘ in position 255: illegal mult

    UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 373: illegal multibyte s ...

最新文章

  1. svd奇异值分解_SVD(奇异值分解)到底在干什么
  2. PHP+Mysql数据库操作简类
  3. SQLServer数据的基本操作:简单的增、删、改、查
  4. 构建javaweb项目
  5. 《P5R》的反派设计有什么可取之处?
  6. castle windsor学习----- Services and Components 两者的定义
  7. 如何读懂 C 语言复杂的声明
  8. mysql有状态无状态_k8s statefulSet 有状态应用和无状态应用区别
  9. 在互联网时代如何工作得更简单
  10. eclipse-阶段五- 在[vo.BookMessageData]类型bean中找不到任何有关属性[Total]的信息
  11. MATLBA官方给出的2D Allen-Cahn Matlab代码分析
  12. 38000词汇词根统计
  13. 146条经典偏方(祖传秘方)
  14. python字典的存储结构_Python 字典的存储结构
  15. 关于使用shopify 和theme 模版使用问题。
  16. spring boot毕业生跟踪调查管理系统 毕业设计源码论文+答辩PPT
  17. 反外挂之手写汇编锁血功能
  18. 初学古琴怎么学?古琴入门基础知识
  19. Qt翻译文件ts中type理解
  20. PPT结尾页只有“谢谢”?你out了!聪明人都这样结尾,礼仪满满

热门文章

  1. python换行输入数据_python 对比两个文件内容或字符串内容时的换行符/交作业检测小程序...
  2. linux上的录屏软件下载,linux-推荐两款好用的录屏软件
  3. 5类6类7类网线对比_5类 6类 7类网线有没有什么区别
  4. 桌面便签哪个软件好用?求推荐一款便签软件?
  5. 通过 ANE(Adobe Native Extension) 启动Andriod服务 推送消息(三)
  6. 腾讯微云和坚果云哪个好用?
  7. Violent python - UNIX Password CrackerZipfile Password Cracker
  8. google 安装去广告插件
  9. adblock plus去广告插件下载与安装
  10. 876. 链表的中间结点【我亦无他唯手熟尔】