UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u25aa’ in position 11923: illegal multibyte sequence之错误处理

文章目录

  • UnicodeEncodeError: 'gbk' codec can't encode character '\u25aa' in position 11923: illegal multibyte sequence之错误处理
  • 一、问题简介
  • 二、问题的解决
    • 1、打开这个界面:
    • 2、接着再打开这个界面:
    • 3、将上图中画红圈的编码改为UTF-8:
    • 4、成功解决:

一、问题简介

我在爬虫的时候出现了这个编码问题,但是我查看了网页的源代码,发现原网页就是UTF-8编码的,我搜索了好多好多的资料,还有很多实在CSDN上的,但是一直没有解决,而且我还在我的代码中进行了转码的工作:
(我的代码如下所示)

import requests
import re
import time
import warnings
# warnings.filterwarnings("ignore")
url = 'https://baike.baidu.com/item/Python/407313?fr=aladdin'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ''AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/89.0.4389.90 Safari/537.36 Edg/89.0.774.57'
}
response = requests.get(url=url, headers=headers)
response.encoding = 'utf-8'
print(response, '响应状态码是:', response.status_code)  # response.status_code是响应状态码
print('字符的编码为:', response.encoding)  # response.encoding 是返回网页的编码类型,比如:'gbk', 'utf-8', 'gb2312'等
# print(response.json())
# print(response.content)
# print(response.text)
print(response.text)

但一直都报这个错,无论我怎么转码都没有用:

二、问题的解决

随后我请教了我的Python老师,后来才明白了错误的原因:
网页的确是utf-8编码的,我的爬虫代码也没有问题,但是问题就是在于我的打印输出所选择的编码格式是GBK,所以应该将打印输出所选择的编码格式(是GBK), 也改为utf-8 ,这样就可以正常显示了:
完整解决过程如下:

1、打开这个界面:

2、接着再打开这个界面:

3、将上图中画红圈的编码改为UTF-8:


之后点击OK按钮即可

4、成功解决:


可以从上图中看出来,已经成功地显示出来了所需要的网页信息(即就是说:网页的源代码。)
由此,该问题就得到了成功的解决了~~~

以上就是我对我遇到的这个问题进行的解决,希望对大家有借鉴的意义。~~~

UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u25aa‘ in position 11923: illegal multibyte相关推荐

  1. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe7‘ in position 295: illegal multibyte seq

    解决UnicodeEncodeError: 'gbk' codec can't encode character '\xe7' in position 295: illegal multibyte s ...

  2. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xa0‘ in position 21: illegal multibyte sequ

    关于python的pywinaotu库print_control_identifiers()因为获取内容有'\xa0'而报错 报错内容: UnicodeEncodeError: 'gbk' codec ...

  3. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\u0467‘ in position 0: illegal multibyte解决方案

      大家好,我是herosunly.985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用.曾获得阿里云天池比赛第一名,科大讯飞比赛第三名,CCF比赛第四名.拥有多项发明专利.对机器学 ...

  4. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xee‘ in position 71: illegal multibyte sequ

    成功解决:UnicodeEncodeError: 'gbk' codec can't encode character '\xee' in position 71: illegal multibyte ...

  5. UnicodeEncodeError: 'gbk' codec can't encode character '\u200b' in position 0: illegal multibyte seq

    python 在写入文件的时候,会出现这个问题: 主要是我们在进行写入的时候没有进行编码设置,因为在windows下,新文件的默认编码是gbk编码,所以我们在写入文件的时候需要设置一个编码格式,如下: ...

  6. UnicodeEncodeError: 'gbk' codec can't encode character '\xeb' in position 20: illegal multibyte sequ

    源代码:with open (os.path.join(self.root,filename),mode='w',newline='') as f: writer=csv.writer(f) for ...

  7. UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 314810: illegal multibyte

    遇到这个错误,在网上找了很久.大家都说的是原理为啥会这样,首先确定这是特殊字符,一般用不上,不需要.这就简单了,用正表达式把它删除了就可以了 比如出错的就是:\xa9 这个字符 # 这个一般都是需要输 ...

  8. UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xe2‘ in position 26: illegal multibyte sequ

    在用python将读入json文件并写入csv文件时遇到如下报错: 查了很多帖子发现是读入文件时编码的错误,尝试改成'utf-8'\'gb18030' 等都依然报错 改成encoding='gb231 ...

  9. 解决python UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\xb5‘ in position 255: illegal mult

    UnicodeEncodeError: 'gbk' codec can't encode character '\ufffd' in position 373: illegal multibyte s ...

  10. 爬虫问题小记 --- UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 25703: illegal

    问题: 今天在做爬虫的时候遇到如下问题,提示gbk编码方式无法对字符'\xa9'进行编码. UnicodeEncodeError: 'gbk' codec can't encode character ...

最新文章

  1. 打破认知:程序设计 #x3D; 算法 + 数据结构?
  2. 人工智能--遗传算法(旅行商问题)
  3. python pip在哪里_Python 2.7.9(Linux)中的pip在哪里
  4. Android动画及滑动事件冲突解决(转载)
  5. Linux禁止用户登录
  6. 智能语音识别app下载-智能语音识别app安卓版下载v2.2 - 非凡软件站
  7. java+io体系结构图_Java IO 体系结构
  8. 论文阅读SG-PBFT: a Secure and Highly Efficient Blockchain PBFT Consensus Algorithm for IoV
  9. 飞天云动港交所上市:市值39亿港元 成港股元宇宙第一股
  10. GhostNet网络详解
  11. 清华AMiner团队推出AI订阅:实时追踪科研动态,定制个人科研信息流 | 专访唐杰教授团队
  12. CSP-S 蒟蒻啊qaq
  13. 大数据时代的新闻变革
  14. HTML基础知识(一) 网页简介
  15. unity应用(Apply)预制体时报错
  16. 【数字图像处理】特征提取轮廓特征对黑色素瘤恶性/良性分类
  17. 电脑手柄,Windows7电脑游戏手柄怎么设置?
  18. 同济大学博导陈明:解读中国制造2025
  19. 支付网站服务器费用怎么记账,支付云服务器的费用怎么做账
  20. [高数][高昆轮][高等数学上][第二章-导数与微分]03.高阶导数

热门文章

  1. python画图的函数_python画图函数
  2. 如何用计算机函数来求加权总分,Excel计算加权总分,函数公式还是超级表厉害,一起看看!-excel乘法函数...
  3. vue基于ECharts的股票行情分时图绘制
  4. ckplayer默认html,ckplayer.html
  5. Matlab转C/C++/Cmex文件加速运行方法
  6. 计算机相关各机构简称
  7. 万用表测量电阻图解及使用注意事项
  8. 寻找生态位置,中小险企破局生态建设——保险生态建设...
  9. Typora设置图片背景
  10. 韩国与日本历年GDP总量和人均GDP的对比(1953-2020年)