学习python爬虫的小伙伴们,肯定都会遇到过乱码的问题,并为此问题感到十分发愁,今天就带大家了解一下如何解决中文乱码问题。

大家肯定都会使用python+request库+bs4库进行简单的爬虫了,我们在开开心心的拿着爬虫得到的文本想要进一步加工分析的时候,看到乱码总是让人头疼。其实,遇到中文乱码可以考虑以下几个方面:

第一个,是否已经设置页面的编码格式。在request库中,我们发送一个请求链接,返回给我们一个response对象。当我们使用python爬虫访问的那个页面没有在头部声明编码格式的时候,这个时候我们python爬虫的结果会默认其编码格式为ISO-8859-1(虽然实际上或许并不是这个编码,但是python最后会认为是这个编码格式,一般服务器的默认编码也是ISO-8859-1。)所以,我们需要在python代码中重新设置页面的编码格式,即对response.encoding属性手动设置为UTF-8编码。

小伙伴可能很细心的设置了页面的编码格式,但是看到python爬虫结果依旧还是乱码。这个时候,可能会是python与bs4库的编码冲突问题。

第二个,使用的版本是否是python3版本。有很多小伙伴很早就使用了python,早期使用的都是python2版本,但是python2版本和bs4会存在编码冲突,因为其默认编码格式不一样。bs4库的默认编码格式是UTF-8,python2版本默认编码是ASCII编码,因此会造成中文显示乱码的问题。然而,python3的默认编码格式是UTF-8,因此,升级python版本就好了,这样还会为以后省下不少麻烦事。

python乱码怎么办_Python爬虫结果是乱码怎么办?带你了解乱码的原因及其解决办法...相关推荐

  1. python车牌识别系统抬杆_车牌识别系统不抬杆的原因和解决办法

    目前很多停车场.小区都使用了车牌识别系统来对车辆进行管理,但是在使用的过程中会有一些突发状况,比如车牌识别系统不抬杆.那么车牌识别系统不抬杆怎么办呢?下面南天瑞丰给大家分享车牌识别系统不抬杆的原因和解 ...

  2. mysql保存中文乱码的原因和解决办法

    当你遇到这个mysql保存中文乱码问题的时候,期待找到mysql保存中文乱码的原因和解决办法这样一篇能解决问题的文章是多么激动人心.   也许30%的程序员会选择自己百度,结果发现网友已经贴了很多类似 ...

  3. mysql保存时乱码了_MySQL保存中文乱码的原因和解决办法

    (3)MySQL的字符集设置. 这个是重点了,一般都是在这里搞错而出现了mysql乱码. mysql编码设置可以分为三种设置:数据库的编码.表的编码.和字段的编码. a.数据库的编码: 在sqlyog ...

  4. MoviePy中文乱码的原因以及解决办法

    很多朋友在群里面提问说TextClip出现中文乱码.今天写博客讲一下原因及解决办法. 原因: 很多人直接拷贝了别人的代码案例,像下面这样: from moviepy.editor import Tex ...

  5. 中文字符乱码的原因及解决办法

    中文字符乱码的原因及解决办法 java的内核是Unicode的,也就是说,在程序处理字符时是用Unicode来表示字符的,但是文件和流的保存方式是使用字节流的.在java的基本数据类型中,char是U ...

  6. html里显示中文乱码的原因及解决办法

    html里显示中文乱码的原因及解决办法 我试着写第一个html文件时候,发现打开保存的html文件后,中文显示的是乱码的.我知道这是字符编码的原因,发现要在开头统一规范下编码格式,通常charset的 ...

  7. python open文件失败_python open打开文件失败原因及解决办法

    1.问题: 今天遇到一个问题,在使用绝对路径open(filename,mode)时失败 代码如下: try: source=open('D:\eclipse-workspace\AcrSoftwar ...

  8. 【Python教程】Jupyter Notebook把一段很长的代码分成多行的解决办法

    Jupyter Notebook把一段很长的代码分成多行的解决办法 使用Jupyter Notebook时经常会遇到一段代码很长 导致代码块向右边延伸了很多 感觉 很! 不! 方! 便! 所以就想把这 ...

  9. python使用ctype中”OSError: [WinError 193] %1 不是有效的 Win32 应用程序“的解决办法

    python使用ctype中"OSError: [WinError 193] %1 不是有效的 Win32 应用程序"的解决办法 解决办法: 下载32位的python,重新安装即可 ...

  10. python的moviepy库 打包 报错: ‘moviepy.audio.fx.all‘ has no attribute ‘audio_fade 的解决办法

    本篇文章主要讲解python的moviepy库 打包 报错: 'moviepy.audio.fx.all' has no attribute 'audio_fade 的解决办法 日期:2022年3月9 ...

最新文章

  1. python数据分析常用的算法_萌新向Python数据分析及数据挖掘 第三章 机器学习常用算法 第二节 线性回归算法 (上)理解篇...
  2. 中国煤炭行业十四五投资战略与供需形势分析报告2022版
  3. 剥开比原看代码(八):比原的Dashboard是怎么做出来的?
  4. rrdtool zabbix mysql_MRTG、Cacti、Rrdtool、Nagios、Zabbix安装比较
  5. c语言让系统蓝屏,0x000000116,教您解决电脑蓝屏代码0x000000116
  6. python-socket2
  7. python爬取新浪博客_python爬取韩寒博客的实例
  8. [PHPCMS]精美大气自适应资源模板下载网站源码
  9. 如何用用计算机名访问共享打印机,局域网怎么连接共享打印机共享
  10. K9G8G08U0A升级到K9GAG08U0D烧录NK要注意的地方
  11. AlertManager配置参数解析
  12. poi导出excel写入公式_【java poi 写入Excel后读取公式值问题】poi导入excel
  13. 关于Qt 5-MSVC 2015 64位在 win7 64位系统debug程序崩溃的问题
  14. DirectX 9.0笔记]第一章 初始化 Direct3D
  15. 汉诺塔系列问题: 汉诺塔II、汉诺塔III、汉诺塔IV、汉诺塔V、汉诺塔VI
  16. please tell me who you are?
  17. 终于倒下了!运营16年的雅虎问答,因“不受欢迎”将永久关闭
  18. 使用HTML(Web)开发iOS/iPhone/iPad应用
  19. python 自动点击鼠标左键和键盘
  20. [UOJ#207]共价大爷游长沙

热门文章

  1. springMVC 理解大综合
  2. 30种图像动画特效算法(C#多线程版)(上)
  3. Python一些常用模块
  4. Discuz 3x重新声明内置函数$解决jQuery冲突
  5. ThinkPHP——重复输出解决办法
  6. awstats的简单配置
  7. 如何隐藏UITabBar 已经如何使已经隐藏的TabBar重现(原创)
  8. Windows服务器系统的端口要求
  9. 可空类型 (C# 编程指南)
  10. linux内核之进程地址空间