最近在学习爬虫,但是关于解码和编码的问题上出现了一些问题,百度了一下,终于找到了问题的解决办法

爬取网页时,自己用的明明是utf-8的编码(第一行的注释为utf-8,编码中的编码格式也是utf-8),但是还是报gbk的错误,找了半天发现不是编码的问题,而是print的问题,因为pycharm自带的编码是gbk的,而输出的utf-8,难免就会出错了,所以要将默认的编码格式改为utf-8的

只需要进行如下设置:

①在file中选择settings

②然后再editor下的file encoding中,将两个编码格式均设置为utf-8的形式即可

补充:设置默认模块注释(第一行的代码注释不用一直输入,每次创建文件自动写入)

Python问题3——爬虫编码问题相关推荐

  1. python创建scrapy_Python爬虫教程-31-创建 Scrapy 爬虫框架项目

    首先说一下,本篇是在 Anaconda 环境下,所以如果没有安装 Anaconda 请先到官网下载安装 Scrapy 爬虫框架项目的创建0.打开[cmd] 1.进入你要使用的 Anaconda 环境1 ...

  2. python免费自学爬虫_这套Python爬虫学习教程,不到一天即可新手到进阶!免费领...

    想用Python做爬虫,而你却还不会Python的话,那么这些入门基础知识必不可少.很多小伙伴,特别是在学校的学生,接触到爬虫之后就感觉这个好厉害的样子,我要学.但是却完全不知道从何开始,很迷茫,学的 ...

  3. python爬取百度贴吧中的所有邮箱_使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号...

    原标题:使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号 不知道大家过年都是怎么过的,反正栏主是在家睡了一天,醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓 ...

  4. Python学习网络爬虫--转

    原文地址:https://github.com/lining0806/PythonSpiderNotes Python学习网络爬虫主要分3个大的版块:抓取,分析,存储 另外,比较常用的爬虫框架Scra ...

  5. python 3.x 爬虫基础---http headers详解

    python 3.x 爬虫基础 python 3.x 爬虫基础---http headers详解 python 3.x 爬虫基础---Urllib详解 python 3.x 爬虫基础---Requer ...

  6. Python 简单网页爬虫学习

    1 #coding=utf-8 2 3 # 参考文章: 4 # 1. python实现简单爬虫功能 5 # http://www.cnblogs.com/fnng/p/3576154.html 6 # ...

  7. python为什么叫爬虫-总算领会python为什么叫爬虫

    爬虫通常指的是网络爬虫,就是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.下面是小编为您整理的关于python为什么叫爬虫,希望对你有所帮助. python为什么叫爬虫 爬虫一般是指网络资源 ...

  8. python快速爬虫视频_“python怎么快速爬虫视频“python 爬网页视频教程

    用python怎样爬网页 # coding:utf8 import cookielib import urllib2 url = "http://blog.uouo123.com" ...

  9. 基于python的网络爬虫编程_基于Python的网络爬虫程序设计

    程序设计 ●Program Design 基于 Python的网络爬虫程序设计 网络 信 息量 的迅 猛 增 长,对 如何从海量的信息中准确的搜索 到用户需要的信息提 出了极大的 挑战.网络爬 虫具有 ...

最新文章

  1. java mysql查询界面_Java GUI小程序 实现数据库查询界面-Go语言中文社区
  2. 《C语言编程初学者指南》一1.9 本章小结
  3. 如何在SAP Fiori应用里使用React component
  4. 数值计算算法-多项式插值算法的实现与分析
  5. 【性能优化】PHP代码输出压缩后HTML
  6. python工资高还是java-python为什么叫爬虫 python工资高还是java的高
  7. 2020年开发者大会资料和武大定量遥感视频分享(部分)
  8. html 各大网站分享代码
  9. 半导体存储器件原理概述
  10. SNF快速开发平台--规则引擎在程序当中如何调用
  11. POJ 2503 Babelfish(map)
  12. 【SpringBoot】SpringBoot2.x 配置 笔记
  13. AD8255手电筒芯片 双路LED控制芯片 支持多种模式 外围简单
  14. 复制带随机指针的链表<难度系数⭐⭐>
  15. 使用x-switch进行代理
  16. win10取消默认文件打开方式
  17. 如何批量调整图片亮度?
  18. 2022年全球及中国制动系统行业头部企业市场占有率及排名调研报告
  19. 亚马逊CEO贝佐斯:蓝色起源将登月“拯救”地球
  20. Scratch音效素材试听后缀名问题

热门文章

  1. 360浏览器登录_浏览器发展历史介绍及当今主流浏览器的详细对比
  2. C++混淆点-构造函数参数
  3. 心动的本质是什么_那一刻,我怦然心动了......
  4. Pytest-ordering自定义用例执行顺序
  5. ele-plus包的安装和使用
  6. Nginx的平滑升级记录---适用于编译安装的Nginx
  7. 运用tp5上传图片,并生成缩略图
  8. js获取一个月的天数
  9. container-with-most-water(最大蓄水问题)
  10. tess4j 注意事项