python 中文乱码处理分析过程
每个pyhton 页面顶端配置
#-*- coding:utf-8 -*-
提取href中的值
request请求:house_url =('http://www.fangyuanxinxiwang.com/'+house.xpath('a/@href')[0])本地页面请求:for hrefs in td_list[11].find_all('a'):url_a=hrefs.get('href')list 类型转化 str :' '.join(list_name) list(str_name)
获取系统编码格式
import sysprint(sys.getfilesystemencoding())
获取get请求响应页面的字符编码格式
htm = requests.get(url, headers=headers)print('响应:\nencoding={}'.format(htm.encoding))--用指定的编码格式解析出来,然后再用指定的编码格式进行编码
'str'.decode('utf-8').encode('utf-8') --用指定的编码格式解析出来,然后再用指定的编码格式进行编码
'str'.decode('utf-8').encode('utf-8') #Python decode() 方法以 encoding 指定的编码格式解码字符串。默认编码为字符串编码。#Python encode() 方法以 encoding 指定的编码格式编码字符串。errors参数可以指定不同的错误处理方案。
提示错误:AttributeError: ‘str‘ object has no attribute ‘decode‘
原因:
1、Python2和Python3在字符串编码上的区别。
2、Python 3.4: str : AttributeError: ‘str’ object has no attribute 'decode
解决方法:#必须将字节字符串解码后才能打印出来
print (‘张俊’.encode(‘utf-8’). decode(‘utf-8’) ) #<class 'str'> 不进行编码的情况下为string类型
str='\n'.join(title) print(type(str)) #<class 'bytes'> 编码后的类型为bytes
str = str.encode('ISO-8859-1') print(type(str)) #<class 'str'> 解码后为string类型
str=str.decode('utf-8') print(type(str))
总结方法为:获取响应页面的字符编码后,依照其编码格式进行编码,然后再按照编辑工具使用的字符编码进行解码。
python 中文乱码处理分析过程相关推荐
- python判断汉字个数_python判断列表里数量python中文乱码问题大总结
在运行这样类似的代码:#!/usr/bin/env python s="中文" print s 最近经常遇到这样的问题: 问题一:SyntaxError: Non-ASCII ch ...
- linux python乱码_linux下python中文乱码解决方案详解
linux下python中文乱码解决方案详解 发布时间:2020-09-06 20:24:49 来源:脚本之家 阅读:68 1. 场景描述 linux服务器下安装了Anaconda3,执行Pyhton ...
- 解决python中文乱码的方法
解决python中文乱码的方法 参考文章: (1)解决python中文乱码的方法 (2)https://www.cnblogs.com/bobodeboke/p/11935876.html 备忘一下.
- eclipse 编辑 python 中文乱码的解决方案
eclipse 编辑 python 中文乱码的解决方案 参考文章: (1)eclipse 编辑 python 中文乱码的解决方案 (2)https://www.cnblogs.com/mouseIT/ ...
- python中文文本情感分析
目录 python中文文本情感分析 导语 训练模型保存并测试正确率 使用保存的模型 python中文文本情感分析 导语 要做一个项目要用到中文文本情感分析,查找了多种资料,在网上看了很多博客后,终于完 ...
- 在Visual Studio Code 中配置Python 中文乱码问题
在Visual Studio Code 中配置Python 中文乱码问题 方法一:直接代码修改字符集 添加前四行代码 import io import sys #改变标准输出的默认编码 sys.std ...
- python爬虫中文乱码_Python 爬虫过程中的中文乱码问题
python+mongodb 在爬虫的过程中,抓到一个中文字段,encode和decode都无法正确显示 注:以下print均是在mongodb中截图显示的,在pythonshell中可能会有所不同 ...
- 彻底搞懂 python 中文乱码问题_彻底搞懂 Python 编码 - sylan215的软件测试技术学习 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...
因为中文的特殊编码,导致 Python2 和 Python3 使用过程中的各种编码问题,如果不清楚其中的关联关系,那么这就一直是个大坑,不是懵逼就还是懵逼,所以就目前碰到的情况彻底梳理下 Python ...
- Android中文乱码的分析与解决
Android中文乱码解决方法: 在手机与PC之间进行socket或HTTP通讯时,常常会出现中文乱码问题,其主要原因在于手机端字符编码默认为UTF-8,而服务器PC端默认为gbk或gb2312. 手 ...
最新文章
- 方法描述Mybatis使用之NEIS项目
- c++入门代码_C/C++编程笔记:C语言入门题之正倒金字塔,正反三角形代码详解
- Codeforces Round #480 (Div. 2) B. Marlin
- 技术开发频道一周精选2007-8-3
- ubuntu系统没有声音解决方法
- 网页左侧固定菜单栏的展开与收起
- I.MX6 make menuconfig进入x86模式
- Matlab2017b配置C++/C/Fortan编译器的问题
- AForge处理视频和拍照(暂时没有音频)
- java post 403_Spring MVC Post请求返回403错误,Get请求却正常,可能是安全框架引起的前端解决办法...
- 手把手教你基于PaddlePaddle的情绪识别
- 爱奇艺很高兴接受元宇宙及其概念
- java老师实例_java实例关于继承求实例,有关学生和老师的程序代码!望诸位软件达人帮忙,谢谢大虾!...
- C#操作IIS的代码
- martin fowler_Martin Kleppmann的大型访谈:“弄清楚分布式数据系统的未来”
- Java应用程序监控之 jconsole
- Spring WebClient实战
- 快速打开文件命令行的三种方法
- unity 通过 dll 传递字符串给python,实现小冰颜值鉴定
- 【论文解读】用于白内障分级/分类的机器学习技术
热门文章
- 【WPF】附加事件--《深入浅出WPF》
- python选择题题目_【Python测试面试题】面试问题:《我的Padd… - 看准网
- Ruby 安装 - Windows
- 在ubuntu中进行简单截屏、专业截屏、自定义截屏操作
- Afreechart很强大的图表库,支持股票曲线图,饼图,曲线
- android studio 工作区间背景颜色设置眼睛保护色
- 文档管理服务器脱机编辑,如何离线访问nicelabel文档管理系统
- JAVA计算机毕业设计甜趣网上蛋糕店订购系统(附源码、数据库)
- raid卡缓存对硬盘性能_我们怎么解决机械硬盘既慢又容易坏的问题?
- 视音频数据处理入门:H.264视频码流解析