UnicodeEncodeError: 'gbk' codec can't encode character '\xa0'
版权声明:本文为CSDN博主「曾记否?」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/qq_38607035/article/details/82595170
在写爬虫爬取网页信息时,发生了以下错误:
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xa0’
意思大致是Unicode编码错误,gbk编解码器不能编码\xa0字符。
错误原因
当我们获取这个网页的源代码的时候,是将这个网页用utf-8的解码方式将其转换成对应的Unicode字符,当我们使用print()函数将其打印到Windows系统的DOS窗口上的时候(DOS窗口的编码方式是GBK),自动将Unicode字符通过GBK编码转换为GBK编码方式的str。
整个过程是: [用python爬取] UTF-8(str) -> [缓存中存放] Unicode(byte) -> [DOS中显示] GBK(str)
对比原网页,发现报错的位置原本要输出的文本为空,也就是目标标签内的值为 。
网页源代码中的 的utf-8 编码是:\xc2 \xa0,转换为Unicode字符为:\xa0,当显示到DOS窗口上的时候,转换为GBK编码的字符串,但是\xa0这个Unicode字符没有对应的 GBK 编码的字符串,所以出现错误。
UnicodeEncodeError: 'gbk' codec can't encode character '\xa0'相关推荐
- UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 21: illegal multibyte sequ
关于python的pywinaotu库print_control_identifiers()因为获取内容有'\xa0'而报错 报错内容: UnicodeEncodeError: 'gbk' codec ...
- Python3 解决编码问题: `UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: ille
Python3 解决编码问题: UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 10: illega ...
- UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position 的解决方法
最近初学网络爬虫,今天在练习使用Python的request模块的时候遇到了一个错误. import requests#发送请求 response = requests.get("https ...
- python UnicodeEncodeError: 'gbk' codec can't encode character ...
使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character ' ...
- python encode gbk_[转]Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法
使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character ' ...
- Python-logging报错解决:UnicodeEncodeError: 'gbk' codec can't encode character '\u' in position: illegal
我在Python3 中使用Logging模块把日志打到终端输出时会报错. 代码如下: import logging logging.basicConfig(level=logging.INFO,fil ...
- 解决python3 UnicodeEncodeError: 'gbk' codec can't encode character '\xXX' in position XX
从网上抓了一些字节流,想打印出来结果发生了一下错误: UnicodeEncodeError: 'gbk' codec can't encode character '\xbb' in position ...
- UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq
解决UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 295: illegal multibyte s ...
- Python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character 解决方法
Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法 参考文章: (1)Python UnicodeEncodeErro ...
- 解决python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xb5‘ in position 255: illegal mult
UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 373: illegal multibyte s ...
最新文章
- svd奇异值分解_SVD(奇异值分解)到底在干什么
- PHP+Mysql数据库操作简类
- SQLServer数据的基本操作:简单的增、删、改、查
- 构建javaweb项目
- 《P5R》的反派设计有什么可取之处?
- castle windsor学习----- Services and Components 两者的定义
- 如何读懂 C 语言复杂的声明
- mysql有状态无状态_k8s statefulSet 有状态应用和无状态应用区别
- 在互联网时代如何工作得更简单
- eclipse-阶段五- 在[vo.BookMessageData]类型bean中找不到任何有关属性[Total]的信息
- MATLBA官方给出的2D Allen-Cahn Matlab代码分析
- 38000词汇词根统计
- 146条经典偏方(祖传秘方)
- python字典的存储结构_Python 字典的存储结构
- 关于使用shopify 和theme 模版使用问题。
- spring boot毕业生跟踪调查管理系统 毕业设计源码论文+答辩PPT
- 反外挂之手写汇编锁血功能
- 初学古琴怎么学?古琴入门基础知识
- Qt翻译文件ts中type理解
- PPT结尾页只有“谢谢”?你out了!聪明人都这样结尾,礼仪满满
热门文章
- python换行输入数据_python 对比两个文件内容或字符串内容时的换行符/交作业检测小程序...
- linux上的录屏软件下载,linux-推荐两款好用的录屏软件
- 5类6类7类网线对比_5类 6类 7类网线有没有什么区别
- 桌面便签哪个软件好用?求推荐一款便签软件?
- 通过 ANE(Adobe Native Extension) 启动Andriod服务 推送消息(三)
- 腾讯微云和坚果云哪个好用?
- Violent python - UNIX Password CrackerZipfile Password Cracker
- google 安装去广告插件
- adblock plus去广告插件下载与安装
- 876. 链表的中间结点【我亦无他唯手熟尔】