小弟刚接触python,每次处理中文时都需要百度google大半天,一头雾水。

下面是一小段爬虫:

# -*- encoding:"utf-8"-*-

import urllib2

import sys

from bs4 import BeautifulSoup

reload(sys)

sys.setdefaultencoding('utf8')

headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}

req=urllib2.Request(url='http://bj.58.com/',headers=headers)

page = urllib2.urlopen(req)

html=page.read().decode('utf-8').encode('gbk')

soup = BeautifulSoup(html)

title = soup.find_all('h2')

# links = soup.find_all('a')

print title[10].get_text()

出现报错:

UnicodeEncodeError: 'gbk' codec can't encode character u'xbb' in position 13167: illegal multibyte sequence

小弟不是很明白遇到中文时,需要如何处理才能尽量不报错,是要写一大段代码判断还是一两行就能解决问题,比如:

reload(sys)

sys.setdefaultencoding('utf8')

这两行,我看有网友说是个好方法,但我感觉不是很有用。不知道是不是方法不对。

请各位大神不吝指教,小弟虚心学习

python为什么中文要encoding-python 中文编码问题如何解决?相关推荐

  1. python读取中文txt文本-python读取中文txt文本的方法

    对于python2.7 字符串在Python2.7内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码成unicode,再从unico ...

  2. python用中文怎么说-python如何设置中文界面

    python设置中文界面的方法:首先找到windows10中文字体所在文件夹[C:/Windows/Fonts/]:然后在代码前面加上相关代码[import matplotlib.pyplot as ...

  3. python语言中文怎么读-python中文读什么

    python中文叫什么 python中文叫什么? python中文叫蟒蛇,通常情况下,Python是一种计算机程序设计语言.是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随 ...

  4. python sqlalchemy中文手册-基于Python的SQLAlchemy的操作

    安装 在Python使用SQLAlchemy的首要前提是安装相应的模块,当然作为python的优势,可以到python安装目录下的scripts下,同时按住shift+加上鼠标左键,从而在菜单中打开命 ...

  5. python读取中文txt文本-python中使用txt文本保存和读取变量

    ### 问题: 在python中需要经常有需要提前生成复杂的计算结果变量的需求减少程序计算运行时间的需求,因此这里把变量存在txt文本文件中. 解决方法: 使用两个函数解决问题,一个函数把变量保存到文 ...

  6. python strftime 中文_strftime(python)问题

    我尝试在mosquito代理上发送数据,并在SQLite上添加相同的数据 这是我的剧本:#!/usr/bin/python3 # -*- coding: utf-8 -*- import sqlite ...

  7. Python的中文识别问题解决办法

    http://blog.csdn.net/whaoxysh/article/details/17260765 Python的中文问题解决办法 python 的eclips教程环境后写了一个测试程序.结 ...

  8. python 折线图中文乱码_彻底解决 Python画图中文乱码问题--Pyplotz组件

    1 源起 自从开始学习Python,就非常喜欢用来画图.一直没有需求画要中文显示信息的图,所以没有配置Python中文的环境.由于昨天就需要画几十个形式相同,只是数据不同的图,并且需要显示中文信息.如 ...

  9. python为什么中文要encoding-python中encoding是什么意思

    encoding是编码的意思,在python中,Unicode类型是作为编码的基础类型. Python encode() 方法以encoding指定的编码格式编码字符串.errors参数可以指定不同的 ...

  10. python中文叫什么-python中文别名

    广告关闭 腾讯云双11爆品提前享,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高满返5000元! sdk 3.0 实现了统一化,各个语言版本的 sdk具备使用方法相同.接口调用方式 ...

最新文章

  1. TickableObjects 和 ITickable
  2. jquery标签选择器应用示例
  3. Leetcode 剑指 Offer 57 - II. 和为s的连续正数序列 (每日一题 20210809)
  4. Intel Realsense pyrealsense rs.decimation_filter()类(通过使用具有特定内核大小的中值执行下采样)(抽取过滤器/抽取滤波器)
  5. 【论文解读】ICLR 2021 |可信多模态机器学习:兼听则明,信而有征
  6. boost::boost::directed_graph用法的测试程序
  7. php mysql实现每日签到积分_php+mysql+jquery实现日历签到功能
  8. http服务详解(1)——一次完整的http服务请求处理过程
  9. 计算机联系函范文,致客户联络函
  10. LeetCode 1389. 按既定顺序创建目标数组
  11. 全民战“疫”,ZStack ZCCT在线认证疫情期间免费开放!
  12. 清北2017夏令营考试 day2
  13. OTSU 获取最佳阈值,及opencv二值化
  14. java 二进制转换为十进制_二进制转换十进制 算法解析
  15. 《机器学习 公式推导与代码实现》随书PPT示例
  16. 阿里面试官:说一下公平锁和非公平锁的区别?
  17. 竞秀纷享“共享电商、共享商圈”模式
  18. ununtu20.04系统中如何划词翻译_接住了!有了这几个翻译软件,英语渣渣也能轻松读文献...
  19. Web技术的发展 网络发展简介(三)
  20. STM32学习之ILI9341控制显示屏输出(一)

热门文章

  1. C# Get network adapter info.
  2. Python字符串常用方法(二)
  3. coursera—吴恩达Machine Learning笔记(1-3周)
  4. SpringMVC 运行过程
  5. 安卓(android)建立项目时失败,出现Android Manifest.xml file missing几种解决方法?...
  6. Atitit.css 规范 bem  项目中 CSS 的组织和管理
  7. 一些今天看到的好句子
  8. 哪里可以找到python的免费教程-哪里有免费的python3教程啊?最好是有例子的视频教学...
  9. python使用方法-Python的使用方法
  10. python装饰器实例-Python函数装饰器--实例讲解