ASCII编码

  1. 将0000 0000 ~ 0111 1111编码成英文与一些控制字符,
  2. ASCII 码使用指定的 7 位或 8 位二进制数组合来表示 128 或 256 种可能的字符。标准 ASCII 码也叫基础ASCII码,使用 7 位二进制数来表示所有的大写和小写字母,数字 0 到 9、标点符号, 以及在美式英语中使用的特殊控制字符。
  3. 在标准ASCII中,其最高位用作奇偶校验位。
  4. 所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中 1 的个数必须是奇数,若非奇数,则在最高位 添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位添1。
  5. 后128个称为扩展ASCII码,目前许多基于x86的系统都支持使用扩展(或“高”)ASCII。扩展 ASCII 码允许将每个字符的第 8 位用于确定附加的 128 个特殊符号字符、外来语字母和图形符号。

ASCII码表

ASCII值 控制字符 ASCII值 控制字符 ASCII值 控制字符 ASCII值 控制字符
0 NUT 32 (space) 64 @ 96
1 SOH 33 65 A 97 a
2 STX 34 66 B 98 b
3 ETX 35 # 67 C 99 c
4 EOT 36 $ 68 D 100 d
5 ENQ 37 % 69 E 101 e
6 ACK 38 & 70 F 102 f
7 BEL 39 , 71 G 103 g
8 BS 40 ( 72 H 104 h
9 HT 41 ) 73 I 105 i
10 LF 42 * 74 J 106 j
11 VT 43 + 75 K 107 k
12 FF 44 , 76 L 108 l
13 CR 45 - 77 M 109 m
14 SO 46 . 78 N 110 n
15 SI 47 / 79 O 111 o
16 DLE 48 0 80 P 112 p
17 DCI 49 1 81 Q 113 q
18 DC2 50 2 82 R 114 r
19 DC3 51 3 83 S 115 s
20 DC4 52 4 84 T 116 t
21 NAK 53 5 85 U 117 u
22 SYN 54 6 86 V 118 v
23 TB 55 7 87 W 119 w
24 CAN 56 8 88 X 120 x
25 EM 57 9 89 Y 121 y
26 SUB 58 : 90 Z 122 z
27 ESC 59 ; 91 [ 123 {
28 FS 60 < 92 / 124 |
29 GS 61 = 93 ] 125 }
30 RS 62 > 94 ^ 126 ~
31 US 63 ? 95 127 DEL

扩展

十进制

十六进制

字符

十进制

十六进制

字符

128

80

Ç

192

C0

129

81

ü

193

C1

130

82

é

194

C2

131

83

â

195

C3

132

84

ä

196

C4

133

85

à

197

C5

134

86

å

198

C6

135

87

ç

199

C7

136

88

ê

200

C8

137

89

ë

201

C9

138

8A

è

202

CA

139

8B

ï

203

CB

140

8C

î

204

CC

141

8D

ì

205

CD

142

8E

Ä

206

CE

143

8F

Å

207

CF

144

90

É

208

D0

145

91

æ

209

D1

146

92

Æ

210

D2

147

93

ô

211

D3

148

94

ö

212

D4

Ô

149

95

ò

213

D5

150

96

û

214

D6

151

97

ù

215

D7

152

98

ÿ

216

D8

153

99

Ö

217

D9

154

9A

Ü

218

DA

155

9B

¢

219

DB

156

9C

£

220

DC

157

9D

¥

221

DD

158

9E

?

222

DE

?

159

9F

ƒ

223

DF

?

160

A0

á

224

E0

α

161

A1

í

225

E1

ß

162

A2

ó

226

E2

Γ

163

A3

ú

227

E3

π

164

A4

ñ

228

E4

Σ

165

A5

Ñ

229

E5

σ

166

A6

ª

230

E6

µ

167

A7

º

231

E7

τ

168

A8

¿

232

E8

Φ

169

A9

?

233

E9

Θ

170

AA

¬

234

EA

Ω

171

AB

½

235

EB

δ

172

AC

¼

236

EC

173

AD

¡

237

ED

φ

174

AE

«

238

EE

ε

175

AF

»

239

EF

176

B0

?

240

F0

177

B1

?

241

F1

±

178

B2

242

F2

179

B3

243

F3

180

B4

244

F4

?

181

B5

245

F5

?

182

B6

246

F6

÷

183

B7

247

F7

184

B8

248

F8

185

B9

249

F9

?

186

BA

250

FA

·

187

BB

251

FB

188

BC

252

FC

?

189

BD

253

FD

²

190

BE

254

FE

191

BF

255

FF

ÿ

unicode

  1. Unicode 只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储。

  2. UTF-8 就是在互联网上使用最广的一种 Unicode 的实现方式。

  3. 其他实现方式还包括 UTF-16(字符用两个字节或四个字节表示)和 UTF-32(字符用四个字节表示),不过在互联网上基本不用。

  4. UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度。

UTF-8编码

由于ASCII编码表示的字符太少了,所以各个国家都有一套自己的编码标准,比如中国的GB2312、GBK编码等。但是如果每个国家都用自己的标准,那么交流起来就很复杂,所以ISO组织就发明了UNICODE编码,UTF-8(每次传输8位)是UNICODE的一种,向下可兼容ASCII编码。

# 序列0开头表示兼容ASCII编码
00 - 7F:0xxxxxxx# 序列110开头表示是两个字节编码的
80 - 7FF:110xxxxx 10xxxxx# 序列1110开头表示是三个字节编码的
800 - FFFF:1110xxxx 10xxxxxx 10xxxxxx# 序列11110开头表示是四个字节编码的
10000 - 10FFFF:11110xxx 10xxxxxx 10xxxxxx 10xxxxxx序列10开头表示是编码字节的组成部分

实例:utf8转中文

# 给出字节序列如下
11100101 10010000 10001000 11101000 10000010
10100101 11100101 10110111 10100101 11100100
10111000 10011010 11100101 10100100 10100111
11100101 10101101 10100110# 由于开头都是1110组成,所以都是由三个字节编码的
0101 010000 001000
1000 000010 100101
0101 110111 100101
0100 111000 011010
0101 100100 100111
0101 101101 100110# 16进制
0101 0100 0000 1000 -> 0x5408
1000 0000 1010 0101 -> 0x80a5
0101 1101 1110 0101 -> 0x5de5
0100 1110 0001 1010 -> 0x4e1a
0101 1001 0010 0111 -> 0x5927
0101 1011 0110 0110 -> 0x5b66

对应utf8表即可(utf8表过长,不再展示)

utf8ascii编码相关推荐

  1. 计算机存储,数据类型,常量和变量

    计算机存储,数据类型,常量和变量 1.计算机存储 1.1计算机存储常用的数据单位 ``` 计算机当中最小的存储单位 字节 Byte bit 比特 一个字节是 8 个bit 位(二进制) 100M 带宽 ...

  2. Day2-计算机存储,数据类型,常量和变量

    1. 计算机存储 1.1 计算机存储常用的数据单位 计算机当中最小存储单位字节 Byte bit 比特 一个字节是 8个 bit 位(二进制)100M 带宽 ==> 100M 比特率 bit/s ...

  3. 创建数据库,指定数据库的字符集和编码顺序

    创建数据库,指定它的字符集和编码顺序 create database {数据库名称} CHARACTER SET {字符集} COLLATE {排序规则} 举例: create database co ...

  4. Myeclipse中修改项目默认编码还是乱码?一步永久解决!

    在myeclipse中修改默认编码后发现项目还是乱码? 点击Windows选择Preferences 如下图

  5. form表单提交编码的问题

    浏览器在form提交后,会生成一个HTTP的头部信息"content-type",标准规定其形式为Content-type: application/x-www-form-urle ...

  6. vs2012下编码引起的一个神坑

    当前有一个项目里面会报解决该文件不能在当前代码页(936)中表示的字符的warning, 根据这个方法 我修改了编码,发现确实不再报warning了 但是尼玛却报出了error 真是太奇怪了!!

  7. 【JavaScript总结】JavaScript语法基础:JS编码

    运算符 数学:+. -. *. / 逻辑:>. < .>= .<=. == . !=.&&.|| . === .!==(完全等于) 对象相关 new delet ...

  8. shell 批量转换文件编码

    相信大家在平时的跨平台编程中碰到过文件编码问题,比如在Windows代码字符编码方式是GB2312,然而转到Linux却只支持utf-8,虽然对代码部分没啥影响,但是很多中文注释部分,却一片乱码,很让 ...

  9. Linux实现ffmpeg H.265视频编码

    Linux实现ffmpeg H.265视频编码 几乎所有观看的视频,数字地面电视,电缆,卫星或互联网上的压缩.原始的,未压缩的视频太大,会浪费太多的带宽.在DVD和Blu-ray之前,有视频CD(VC ...

最新文章

  1. 处理问题的方法--抽象和特例化
  2. Hibernate QBC 分页
  3. runtime 关联对象objc_setAssociatedObject
  4. Redis五种数据结构详解
  5. 做系统ghost步骤图解_Ghost 博客搭建超全指南
  6. python pip安装pyinstaller报错_pip install pyinstaller (安装过程报错解决)
  7. python中pygame输入换行文字,Pygame:写多行
  8. 2019.08.26关于分页
  9. 两个Listbox的关联(省名 和 该省城市的对应)
  10. PLC可编程控制器的结构和工作原理
  11. 杂题 P1640 [SCOI2010]连续攻击游戏
  12. Windows7 删除双系统引导中的一个
  13. 电脑故障(一)台式电脑看网络直播屏幕黑屏
  14. ThinkPad E545连WiFi教程(系统:ubuntu-20.04.3-live-server,无线网卡:BCM34142)
  15. android 8.1 开机壁纸下半部分黑屏2-3秒的问题解决
  16. 【杭州seo】百度快照关键词不同颜色的代表含义
  17. Python——文档
  18. 1亿美元成为超级富豪新基准,美国、中国、印度亿万富翁数量排全球前三位 | 美通社头条...
  19. Oracle 常见问题1000问(不积跬步,无以至千里)
  20. java学生考勤系统实验报告,程序设计实验报告学生考勤系统).doc

热门文章

  1. 个人计算机和家用计算机的区别,量子计算机和普通计算机的区别
  2. oracle aul 恢复,使用AUL-MyDUL恢复的步骤
  3. Anchor Free检测算法之FCOS
  4. 数据结构入门1(认识数据结构)
  5. excel 显示html标签,POI Excel 上下标处理(sub,sup的HTML标签转化到excel格式)
  6. Eclipse插件6
  7. winform实现拖曳功能
  8. 自媒体、短视频博主都在用这5个免费视频网站
  9. manjaro KDE dell G15 5511 没有声音解决方法
  10. 查找并输出数组中出现频率最高的数字