python html 中文 编码,如何用Python将HTML非ASCII数据编码为UTF-8
我试着这么做,却发现了这个错误:>>> import re
>>> x = 'Ingl\xeas'
>>> x
'Ingl\xeas'
>>> print x
Ingl�s
>>> x.decode('utf8')
Traceback (most recent call last):
File "", line 1, in
File "/usr/lib/python2.6/encodings/utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
UnicodeDecodeError: 'utf8' codec can't decode bytes in position 4-5: unexpected end of data
>>> x.decode('utf8', 'ignore')
u'Ingl'
>>> x.decode('utf8', 'replace')
u'Ingl\ufffd'
>>> print x.decode('utf8', 'replace')
Ingl�
>>> print x.decode('utf8', 'xmlcharrefreplace')
Traceback (most recent call last):
File "", line 1, in
File "/usr/lib/python2.6/encodings/utf_8.py", line 16, in decode
return codecs.utf_8_decode(input, errors, True)
TypeError: don't know how to handle UnicodeDecodeError in error callback
当我使用print语句时,我希望:>>> print x
u'Inglês'
欢迎任何帮助。
python html 中文 编码,如何用Python将HTML非ASCII数据编码为UTF-8相关推荐
- python打开中文文件名_解决python打开中文文件名乱码的问题
解决python打开中文文件名乱码的问题 发布时间:2020-07-27 11:20:22 来源:亿速云 阅读:162 作者:清晨 小编给大家分享一下解决python打开中文文件名乱码的问题,相信大部 ...
- python如何读取中文文件-如何用Python提取中文关键词?
本文一步步为你演示,如何用Python从中文文本中提取关键词.如果你需要对长文"观其大略",不妨尝试一下. 2017-12-07-20-38-22-7-426487.png 需求 ...
- python 英语分词_如何用Python做中文分词?
打算绘制中文词云图?那你得先学会如何做中文文本分词.跟着我们的教程,一步步用Python来动手实践吧. 需求 在<如何用Python做词云>一文中,我们介绍了英文文本的词云制作方法.大家玩 ...
- 有道python网课怎么样-如何用python“优雅的”调用有道翻译?
前言 其实在以前就盯上有道翻译了的,但是由于时间问题一直没有研究(我的骚操作还在后面,记得关注),本文主要讲解如何用python调用有道翻译,讲解这个爬虫与有道翻译的js"斗争"的 ...
- python打开中文文件名_[请教]python的中文文件名处理
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 3 楼的可以用 sys.getfilesystemencoding 检测,但由於文件系统的差异,文件名 100% 无损转还是不太可,比如很多 *nix 的 ...
- python处理中文字符串_处理python字符串中的中文字符
# -*- coding:utf-8 -*- import sys,os txta = open('a.txt','r') str = '' for line in txta: str += line ...
- python md5加密_如何用python“优雅”的调用有道翻译?
前言 其实在以前就盯上有道翻译了的,但是由于时间问题一直没有研究(我的骚操作还在后面,记得关注),本文主要讲解如何用python调用有道翻译,讲解这个爬虫与有道翻译的js"斗争"的 ...
- python小助手_如何用python写个人专属群聊提醒小助手?
前言 大家还记得教会父母玩微信是什么时候吗?父母学会后,我们的生活就发生了「质」的变化,父母也许会吐槽你的微信头像不好,要你换一个头像. 最近 pk哥 又被母后大人吐槽了,原因是亲戚微信群里某个亲戚生 ...
- python统计中文字符_使用 Python 统计中文字符的数量
使用 Python 统计中文字符的数量 方法一,排除法 假设只有中英文字符: import string def str_count(str): '''找出字符串中的中英文.空格.数字.标点符号个数' ...
最新文章
- MySQL面试题 | 附答案解析(二)
- Springboot使用Log4j2的配置详解
- java包装模式_在Java8中包装设计模式
- 南京理工大学计算机学院教授严捍,2019年7月1日学术报告二则(宋巍 教授,南京理工大学;张鹏程 副教授,河海大学)...
- VPC 2007 Console界面消失以及解决方法
- Mybatis, 实现一对多
- 【蓝桥杯】蓝桥杯日期类问题总结
- C/C++ 编译器全面采用 LLVM
- ias日志察看器(.net)
- python 图片识别
- 1.5 万字 + 40 张图解 HTTP 常见面试题(值得收藏)
- 虚拟现实未来前景无限
- 谷歌高级搜索技巧之高级语法查询指令
- 【转载】太阳天顶角 太阳高度角 太阳方位角
- 嵌入式学习代码总结(二)
- 小白龙——Java 开发环境 一(JDK的安装)
- 5个高质量简历模板网站,免费、免费、免费
- 伽卡他卡学生端 的卸载!!!
- 开源图像数据集管理工具fiftyone使用
- openresty ngx.ctx表
热门文章
- MySQL对多个条件分别计数
- ffmpeg 添加 sei 编码信息和解析
- 智能视频云监控平台主要功能分析
- [航海协会]无损加密
- 用单片机控制PH8810和无线收发模块实现远程控制家电
- 请听一个故事------百度员工离职总结:如何做个好员工
- linux 进程间切换,linux 进程管理 进程切换
- 计算机图形学 OpenGl-种子填充算法画红黄绿交通灯
- wkhtmltoimage 卡住了_用rails做一个简单的长微博生成工具
- 被周董和郎朗拨弄,钢琴的“内心”如何掀起“波澜”?