每个pyhton 页面顶端配置

#-*- coding:utf-8 -*-

提取href中的值

request请求:house_url =('http://www.fangyuanxinxiwang.com/'+house.xpath('a/@href')[0])本地页面请求:for hrefs in td_list[11].find_all('a'):url_a=hrefs.get('href')list 类型转化 str :' '.join(list_name) list(str_name)

获取系统编码格式

import sysprint(sys.getfilesystemencoding())

获取get请求响应页面的字符编码格式

htm = requests.get(url, headers=headers)print('响应:\nencoding={}'.format(htm.encoding))--用指定的编码格式解析出来,然后再用指定的编码格式进行编码
'str'.decode('utf-8').encode('utf-8') --用指定的编码格式解析出来,然后再用指定的编码格式进行编码
'str'.decode('utf-8').encode('utf-8') #Python decode() 方法以 encoding 指定的编码格式解码字符串。默认编码为字符串编码。#Python encode() 方法以 encoding 指定的编码格式编码字符串。errors参数可以指定不同的错误处理方案。

提示错误:AttributeError: ‘str‘ object has no attribute ‘decode‘

原因:

1、Python2和Python3在字符串编码上的区别。

2、Python 3.4: str : AttributeError: ‘str’ object has no attribute 'decode

解决方法:#必须将字节字符串解码后才能打印出来
print (‘张俊’.encode(‘utf-8’). decode(‘utf-8’) ) #<class 'str'> 不进行编码的情况下为string类型
str='\n'.join(title) print(type(str)) #<class 'bytes'> 编码后的类型为bytes
str = str.encode('ISO-8859-1') print(type(str)) #<class 'str'> 解码后为string类型
str=str.decode('utf-8') print(type(str))

总结方法为:获取响应页面的字符编码后,依照其编码格式进行编码,然后再按照编辑工具使用的字符编码进行解码。

python 中文乱码处理分析过程相关推荐

  1. python判断汉字个数_python判断列表里数量python中文乱码问题大总结

    在运行这样类似的代码:#!/usr/bin/env python s="中文" print s 最近经常遇到这样的问题: 问题一:SyntaxError: Non-ASCII ch ...

  2. linux python乱码_linux下python中文乱码解决方案详解

    linux下python中文乱码解决方案详解 发布时间:2020-09-06 20:24:49 来源:脚本之家 阅读:68 1. 场景描述 linux服务器下安装了Anaconda3,执行Pyhton ...

  3. 解决python中文乱码的方法

    解决python中文乱码的方法 参考文章: (1)解决python中文乱码的方法 (2)https://www.cnblogs.com/bobodeboke/p/11935876.html 备忘一下.

  4. eclipse 编辑 python 中文乱码的解决方案

    eclipse 编辑 python 中文乱码的解决方案 参考文章: (1)eclipse 编辑 python 中文乱码的解决方案 (2)https://www.cnblogs.com/mouseIT/ ...

  5. python中文文本情感分析

    目录 python中文文本情感分析 导语 训练模型保存并测试正确率 使用保存的模型 python中文文本情感分析 导语 要做一个项目要用到中文文本情感分析,查找了多种资料,在网上看了很多博客后,终于完 ...

  6. 在Visual Studio Code 中配置Python 中文乱码问题

    在Visual Studio Code 中配置Python 中文乱码问题 方法一:直接代码修改字符集 添加前四行代码 import io import sys #改变标准输出的默认编码 sys.std ...

  7. python爬虫中文乱码_Python 爬虫过程中的中文乱码问题

    python+mongodb 在爬虫的过程中,抓到一个中文字段,encode和decode都无法正确显示 注:以下print均是在mongodb中截图显示的,在pythonshell中可能会有所不同 ...

  8. 彻底搞懂 python 中文乱码问题_彻底搞懂 Python 编码 - sylan215的软件测试技术学习 - 51Testing软件测试网 51Testing软件测试网-软件测试人的精神家园...

    因为中文的特殊编码,导致 Python2 和 Python3 使用过程中的各种编码问题,如果不清楚其中的关联关系,那么这就一直是个大坑,不是懵逼就还是懵逼,所以就目前碰到的情况彻底梳理下 Python ...

  9. Android中文乱码的分析与解决

    Android中文乱码解决方法: 在手机与PC之间进行socket或HTTP通讯时,常常会出现中文乱码问题,其主要原因在于手机端字符编码默认为UTF-8,而服务器PC端默认为gbk或gb2312. 手 ...

最新文章

  1. 方法描述Mybatis使用之NEIS项目
  2. c++入门代码_C/C++编程笔记:C语言入门题之正倒金字塔,正反三角形代码详解
  3. Codeforces Round #480 (Div. 2) B. Marlin
  4. 技术开发频道一周精选2007-8-3
  5. ubuntu系统没有声音解决方法
  6. 网页左侧固定菜单栏的展开与收起
  7. I.MX6 make menuconfig进入x86模式
  8. Matlab2017b配置C++/C/Fortan编译器的问题
  9. AForge处理视频和拍照(暂时没有音频)
  10. java post 403_Spring MVC Post请求返回403错误,Get请求却正常,可能是安全框架引起的前端解决办法...
  11. 手把手教你基于PaddlePaddle的情绪识别
  12. 爱奇艺很高兴接受元宇宙及其概念
  13. java老师实例_java实例关于继承求实例,有关学生和老师的程序代码!望诸位软件达人帮忙,谢谢大虾!...
  14. C#操作IIS的代码
  15. martin fowler_Martin Kleppmann的大型访谈:“弄清楚分布式数据系统的未来”
  16. Java应用程序监控之 jconsole
  17. Spring WebClient实战
  18. 快速打开文件命令行的三种方法
  19. unity 通过 dll 传递字符串给python,实现小冰颜值鉴定
  20. 【论文解读】用于白内障分级/分类的机器学习技术

热门文章

  1. 【WPF】附加事件--《深入浅出WPF》
  2. python选择题题目_【Python测试面试题】面试问题:《我的Padd… - 看准网
  3. Ruby 安装 - Windows
  4. 在ubuntu中进行简单截屏、专业截屏、自定义截屏操作
  5. Afreechart很强大的图表库,支持股票曲线图,饼图,曲线
  6. android studio 工作区间背景颜色设置眼睛保护色
  7. 文档管理服务器脱机编辑,如何离线访问nicelabel文档管理系统
  8. JAVA计算机毕业设计甜趣网上蛋糕店订购系统(附源码、数据库)
  9. raid卡缓存对硬盘性能_我们怎么解决机械硬盘既慢又容易坏的问题?
  10. 视音频数据处理入门:H.264视频码流解析