ASCII码和Unicode字符集
一、ASCII 码
ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言。它是最通用的信息交换标准。ASCII 码可以用来表示大小写英文字母、数字和一些符号,到目前为止共定义了128个字符。
js字符串和 ASCII码的互相转换
// js字符串转 ASCII码
var n = str.charCodeAt(i);
// ASCII码转js字符串
var str = String.fromCharCode(n);
二、Unicode 字符集
不同的国家有不同的语言,显然只用 128 个 ASCII 码来表示是存在很大的局限性,为了统一所有文字的编码,Unicode应运而生。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。
Unicode(又称统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。
1. 一个 Unicode 字符的组成
一个 Unicode 字符,通常由“U+”然后紧接着一组十六进制的数字组成。
在基本多文种平面(简写 BMP,又简称为“零号平面”)里的所有字符,要用四位十六进制数(例如U+4AE0,共支持六万多个字符);在零号平面以外的字符则需要使用五位或六位十六进制数了。
2. Unicode 在 JavaScript 中的使用 - Unicode 转义序列
在有些老旧的计算机硬件和软件里,无法显示或输入 Unicode 字符全集,为了支持那些硬件和软件,JavaScript 定义了一种特殊序列,使用6个 ASCII 字符来代表任意16位 Unicode 内码,这些 Unicode 转义序列均以 \u 为前缀,其后跟随4个十六进制数(例如 \u4e00)。
3. js字符串和 Unicode 的相互转换
js字符串转 Unicode
charCodeAt 获取到的是十进制的 ASCII 码,用 toString(16) 转成十六进制,再加上各种场景不同的前缀就是完整的 Unicode 码。
// js字符串转Unicode
function encodeUnicode(str) { var res = []; for ( var i=0; i<str.length; i++ ) { res[i] = ( "00" + str.charCodeAt(i).toString(16) ).slice(-4); } return "\\u" + res.join("\\u");
}
Unicode 转js字符串
方法一:Unicode直接可以在js字符串中使用,网页渲染时会自动显示对应的字符。
方法二:用 decodeURI(Unicode) 方法。
4. Unicode 官网的使用
Unicode 官网列出了很多特殊符号和表情的 Unicode 编码,平时用 js 开发业务的时候去官网找表情和图标也是一种不错的选择。
把 Unicode 的 U+ 替换成 \u 就能在 js 字符串中使用了。
ASCII码和Unicode字符集相关推荐
- 浅谈ASCII码、unicode码等
文章目录 背景 ASCII码 小结 背景 总是会混淆ASCII码和Unicode码,本文对此进行一个简要的分析 ASCII码 定义:ASCII ((American Standard Code for ...
- 关于Python ord()和chr()返回ASCII码和Unicode码的看法
刚开始学这两个函数的时候,看到书上说的是返回Unicode码, 但是自己去百度之后,发现很多人都说返回是ASCII码 为什么会这样呢? 那么为了不误解 ,我们先介绍下Unicode码和ASCII码 A ...
- ascii码,unicode编码,utf-8编码
我理解的ascii码,unicode编码,utf-8编码: 1.ascii编码: 美国于上个世纪60年代制定了一套字符编码,英语字符与二进制位之间对应关系,做了统一规定.故此诞生了一直沿用至今的ASC ...
- 常见的字符编码(ASCII码,unicode,utf-8,gbk)
常见单位换算 bit 位 计算机的最小表示单位(0,1) bytes 字节 计算机最小的存储单位,缩写B 1 B = 8 bit 1 KB = 1024 B 1 MB = 1024 KB 1 GB = ...
- ASCII码、Unicode编码对照表 —— ASCII控制字符 Unicode编码 字符编码的前世此生
ASCII控制字符 Unicode编码 ASCII(American Standard Code for Information Interchange,美国信息互换标准代码,ASCⅡ)是基于拉丁字 ...
- python基础整理——ASCII码、Unicode、utf-8、gbk
2019独角兽企业重金招聘Python工程师标准>>> 编码的问题其实是各国语言多样性造成的,最初的计算机是美国发明的,而计算机只能处理数据,不能够处理文本文档.因为计算机只能处理数 ...
- Java中的ASCII码与Unicode码
先上代码 后续更新 1 public class Unicode { 2 public static void main(String[] args) { 3 char ch1 = 'c'; 4 ch ...
- ASCII码与Unicode编码
1. ASCII码 我们知道,在计算机内部,所有的信息最终都表示为一个二进制的字符串.每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte). ...
- ascii码和unicode
ASCII码表 Unicode(UTF-8, UTF-16) 我们知道计算机其实挺笨的,它只认识0101这样的字符串,当然了我们看这样的01串时肯定会比较头晕的,所以很多时候为了描述简单都用十进制,十 ...
最新文章
- 你好同窗,我们开始吧,这是我们的第3次见面
- 源码分享,送你一份Google Python class源码
- 如何判断微信内置浏览器(JS PHP)
- 83. 删除排序链表中的重复元素 golang
- SpringBoot 封装返回类以及session 添加获取
- windows php sqlite,如何在Apache 2.4(Windows 7)上为PHP 5.6.14配置SQLite3?
- asp.net mysql 中文乱码_mysql4导入mysql5中文乱码问题
- Codeforces Round #313 (Div. 1) A. Gerald's Hexagon 数学题
- Android系统性能调优工具介绍
- MySQL 优化--持续整理
- WPF:window设置单一开启
- 如何C语言编程二维数组五位学生总分,C语言编程题(有关二维数组的循环的)...
- 阿里中间件-全链路压测 总结
- selenium python怎么断言_请问selenium python 断言怎么写?
- 使用模板快速编写测试用例
- [4G5G专题-78]:流程 - 4G LTE 核心网的Attach流程
- anguarjs 上传图片预览_前端战五渣学前端——FileReader预览本地文件
- 如何通过AppStore变态审核:看同行经验
- 数字信号处理 --- 用离散傅里叶变换(循环卷积)实现线性卷积(个人学习笔记)
- 《趣弹幕-滚动LED显示屏-技术支持》