python自主学习——Unicode
Unicode
!!!个人主页:个人主页
!!!推荐一款模拟面试、刷题神器,从基础到大厂面试题:点击此处进入牛客网注册学习吧
!!!今日的努力,明日的未来
两种表示字符序列的类型:bytes
和str
。前者实例包括原始的8位值(就是原始的字节,由于美俄字节有8个二进制位,就是原始的8位值),后者的实例包含Unicode字符
文本字符串
utf-8——>可变长 1个字节时(0_ _ _ _ _ _ _ )2个字节时(110_ _ _ _ _ 10_ _ _ _ _ _ )3个字节(1110 _ _ _ _ 10_ _ _ _ _ 10 _ _ _ _ )4个字节(11110 _ _ 10 _ _ _ _ _ _ 10 _ _ _ _ _ 10_ _ _ _ _ _ )
‘你’——20320D——4F60H——0100 1111 0110 0000B(码点)——11100100 10111101 10100000(UTF-8)(b’E4BDA0’ = b’\xE4\xBD\xA0’)
|_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ 解码<<<<_ _ _ _ _ _ _ _ _ _ >>>>编码 _ _ _ _ _ _ _ _ _ _ |
在python3当中,字符串是由一系列Unicode码位所组成的不可变序列
通过某个字符的Unicode ID,可以直接获得其对应的字符。
- 用
\u
及4个十六进制的数字从Unicode256个基本多语言中指定某一特定的字符。其中,前两个十六进制数字用于指定平面号(00—FF),后面两个数字用于指定该字符在平面上的位置索引 - 使用更多的比特位来储存位于更高平面的字符。Python使用以
\U
开头的转义序列来处理,后面跟紧8个十六进制的数字,其中最左一位需为0 - 使用
\N{name}
来引用某一字符,其中name为该字符的标准名称,这时所有平面的字符都适用
两个方向的转换函数:
lookup()
接收不区分大小的标准名称,返回一个Unicode字符name()
接收一个Unicode字符,返回大写形式的名称- ord()`输出对应字符的十进制(码位)
- 用len()可计算Unicode字符的个数
编码与解码
编码:encode()
解码:decode()
print('
python自主学习——Unicode相关推荐
- python与php8-详解Python中Unicode和utf-8
在Python语言中,Uincode字符串处理一直是一个容易让人迷惑的问题.许多Python爱好者经常因为搞不清Unicode.UTF-8还有其它许许多多的编码之间的区别而大伤脑筋.本文将介绍Unic ...
- python decode unicode encode
字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(en ...
- Python中Unicode字符串
字符串还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数 ...
- python自主学习1
python自主学习 爬取百度图片 随机产生1000000条成绩记录 Access库student.mdb中表student内容如下 爬取百度图片 [题目] 1.根据百度图片库接口url,搜索多页图片 ...
- Python中Unicode字符串(字符串编码问题)
Python中Unicode字符串(字符串编码问题) 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以 ...
- python汉字转unicode_[转]Python、Unicode和中文
Python.Unicode和中文[转] python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识.当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题 ...
- python中unicode编码怎么用_详解Python2.x中对Unicode编码的使用
我确定有很多关于Unicode和Python的说明,但为了方便自己的理解使用,我还是打算再写一些关于它们的东西. 字节流 vs Unicode对象 我们先来用Python定义一个字符串.当你使用str ...
- python程序采用unicode编码、英文字符,Python 与 Unicode
unicode 与 utf8 的关系 unicode 定义了统一的字符集, UTF8 则是一种编码 unicode 字符集的方式. 在 python2 中, str 类型, unicode 类型都是 ...
- Python、Unicode和中文
python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识.当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了. 先来看看pytho ...
- 【Python】unicode' object is not callable
在Python中,出现'unicode' object is not callable的错误一般是把字符串当做函数使用了. 转载于:https://www.cnblogs.com/nju2014/p/ ...
最新文章
- 开发日记-20190725 关键词 读书笔记《Linux 系统管理技术手册(第二版)》DAY 15
- OpenCV——RGB三通道分离
- 人月神话贯彻执行_上古神话知识梳理,精华帖
- 德云斗笑社何九华为什么没参加_狗狗的身体卡在了门上,女主人低头一看忍不住笑了:这是膨胀了...
- django框架 day09
- python工资一般多少p-为什么这么多人喜欢Python?Python的就业方向是什么?
- 虚拟应用DemoApp功能演示详解
- 万年历,java如何实现日历查询
- c语言简单系统实例,简单的c语言编程实例
- 已知经纬度自动在地图上标点
- HDUOJ 2059 龟兔赛跑——
- Flink滚动窗口函数的开窗起始时间计算规则
- 关于电脑注册表regedit自定义管理右键菜单选项实例(删除增加)
- 《Unity 2018 AR与VR开发快速上手》简介
- 《MATLAB图像处理实例详解》:CH_7(图像分割技术)
- 自行更换锐捷RG-EG2000系列的内置硬盘
- python 深度学习环境安装(tensorflow-gpu)
- 模拟微信公众号回调请求
- linux下Nginx部署前后端项目
- 3d模型多怎么优化_【建模】适合3D建模的显卡
热门文章
- Python网络爬虫《九》
- EDCSA OPENSSL签名验签方法
- 解读加多宝的营销案例分析
- Win10:文件夹取消隐藏选项为灰色,无法勾选
- (计算机组成原理)第七章输入和输出系统-第三节3:I/O方式之DMA方式
- python中输入多个值用什么符号隔开_字典中多个元素之间使用
- 第043篇:VBA之单元格简写与引用、值与地址
- [渝粤题库]西北工业大学刑法
- 台电固态硬盘用什么测试软件,台电固态硬盘怎么样(台电固态硬盘测评结果出炉 )...
- 毕业生见习期考核鉴定表(单位考核意见)