UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u25aa‘ in position 11923: illegal multibyte
UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u25aa’ in position 11923: illegal multibyte sequence之错误处理
文章目录
- UnicodeEncodeError: 'gbk' codec can't encode character '\u25aa' in position 11923: illegal multibyte sequence之错误处理
- 一、问题简介
- 二、问题的解决
- 1、打开这个界面:
- 2、接着再打开这个界面:
- 3、将上图中画红圈的编码改为UTF-8:
- 4、成功解决:
一、问题简介
我在爬虫的时候出现了这个编码问题,但是我查看了网页的源代码,发现原网页就是UTF-8编码的,我搜索了好多好多的资料,还有很多实在CSDN上的,但是一直没有解决,而且我还在我的代码中进行了转码的工作:
(我的代码如下所示)
import requests
import re
import time
import warnings
# warnings.filterwarnings("ignore")
url = 'https://baike.baidu.com/item/Python/407313?fr=aladdin'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ''AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.57'
}
response = requests.get(url=url, headers=headers)
response.encoding = 'utf-8'
print(response, '响应状态码是:', response.status_code) # response.status_code是响应状态码
print('字符的编码为:', response.encoding) # response.encoding 是返回网页的编码类型,比如:'gbk', 'utf-8', 'gb2312'等
# print(response.json())
# print(response.content)
# print(response.text)
print(response.text)
但一直都报这个错,无论我怎么转码都没有用:
二、问题的解决
随后我请教了我的Python老师,后来才明白了错误的原因:
网页的确是utf-8编码的,我的爬虫代码也没有问题,但是问题就是在于我的打印输出所选择的编码格式是GBK,所以应该将打印输出所选择的编码格式(是GBK), 也改为utf-8 ,这样就可以正常显示了:
完整解决过程如下:
1、打开这个界面:
2、接着再打开这个界面:
3、将上图中画红圈的编码改为UTF-8:
之后点击OK按钮即可
4、成功解决:
可以从上图中看出来,已经成功地显示出来了所需要的网页信息(即就是说:网页的源代码。)
由此,该问题就得到了成功的解决了~~~
以上就是我对我遇到的这个问题进行的解决,希望对大家有借鉴的意义。~~~
UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u25aa‘ in position 11923: illegal multibyte相关推荐
- UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq
解决UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 295: illegal multibyte s ...
- UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 21: illegal multibyte sequ
关于python的pywinaotu库print_control_identifiers()因为获取内容有'\xa0'而报错 报错内容: UnicodeEncodeError: 'gbk' codec ...
- UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u0467‘ in position 0: illegal multibyte解决方案
大家好,我是herosunly.985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用.曾获得阿里云天池比赛第一名,科大讯飞比赛第三名,CCF比赛第四名.拥有多项发明专利.对机器学 ...
- UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xee‘ in position 71: illegal multibyte sequ
成功解决:UnicodeEncodeError: 'gbk' codec can't encode character '\xee' in position 71: illegal multibyte ...
- UnicodeEncodeError: 'gbk' codec can't encode character '\u200b' in position 0: illegal multibyte seq
python 在写入文件的时候,会出现这个问题: 主要是我们在进行写入的时候没有进行编码设置,因为在windows下,新文件的默认编码是gbk编码,所以我们在写入文件的时候需要设置一个编码格式,如下: ...
- UnicodeEncodeError: 'gbk' codec can't encode character '\xeb' in position 20: illegal multibyte sequ
源代码:with open (os.path.join(self.root,filename),mode='w',newline='') as f: writer=csv.writer(f) for ...
- UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 314810: illegal multibyte
遇到这个错误,在网上找了很久.大家都说的是原理为啥会这样,首先确定这是特殊字符,一般用不上,不需要.这就简单了,用正表达式把它删除了就可以了 比如出错的就是:\xa9 这个字符 # 这个一般都是需要输 ...
- UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe2‘ in position 26: illegal multibyte sequ
在用python将读入json文件并写入csv文件时遇到如下报错: 查了很多帖子发现是读入文件时编码的错误,尝试改成'utf-8'\'gb18030' 等都依然报错 改成encoding='gb231 ...
- 解决python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xb5‘ in position 255: illegal mult
UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 373: illegal multibyte s ...
- 爬虫问题小记 --- UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 25703: illegal
问题: 今天在做爬虫的时候遇到如下问题,提示gbk编码方式无法对字符'\xa9'进行编码. UnicodeEncodeError: 'gbk' codec can't encode character ...
最新文章
- 打破认知:程序设计 #x3D; 算法 + 数据结构?
- 人工智能--遗传算法(旅行商问题)
- python pip在哪里_Python 2.7.9(Linux)中的pip在哪里
- Android动画及滑动事件冲突解决(转载)
- Linux禁止用户登录
- 智能语音识别app下载-智能语音识别app安卓版下载v2.2 - 非凡软件站
- java+io体系结构图_Java IO 体系结构
- 论文阅读SG-PBFT: a Secure and Highly Efficient Blockchain PBFT Consensus Algorithm for IoV
- 飞天云动港交所上市:市值39亿港元 成港股元宇宙第一股
- GhostNet网络详解
- 清华AMiner团队推出AI订阅:实时追踪科研动态,定制个人科研信息流 | 专访唐杰教授团队
- CSP-S 蒟蒻啊qaq
- 大数据时代的新闻变革
- HTML基础知识(一) 网页简介
- unity应用(Apply)预制体时报错
- 【数字图像处理】特征提取轮廓特征对黑色素瘤恶性/良性分类
- 电脑手柄,Windows7电脑游戏手柄怎么设置?
- 同济大学博导陈明:解读中国制造2025
- 支付网站服务器费用怎么记账,支付云服务器的费用怎么做账
- [高数][高昆轮][高等数学上][第二章-导数与微分]03.高阶导数
热门文章
- python画图的函数_python画图函数
- 如何用计算机函数来求加权总分,Excel计算加权总分,函数公式还是超级表厉害,一起看看!-excel乘法函数...
- vue基于ECharts的股票行情分时图绘制
- ckplayer默认html,ckplayer.html
- Matlab转C/C++/Cmex文件加速运行方法
- 计算机相关各机构简称
- 万用表测量电阻图解及使用注意事项
- 寻找生态位置,中小险企破局生态建设——保险生态建设...
- Typora设置图片背景
- 韩国与日本历年GDP总量和人均GDP的对比(1953-2020年)