java处理unicode字符

关注:277  答案:4  mip版

解决时间 2021-01-19 19:19

提问者我不想放过你

2021-01-19 01:06

我的unicode字符存在short数组里,本来在c语言是ushort可是java不支持无符号数,我转过来有些字符的码值过大就变为负数了,变为负数的码值转为java的char后就变成乱码了,怎么能让所有unicode字符转为可以显示的String呢?

比如"用户名或密码错误"这个字串

这几个字符从ushort转为short后

"密"和"误"两个字的码值变成了负数。

而转为String后字串变成了"用户名或ᅥ码错￯!"

没有用,我试过了 本来unsign short就是2个字节 转为int 只是补了两个字节的0,还是显示不了。

最佳答案

二级知识专家你可以浪但我不會等

2021-01-19 02:28

unicode编码简而言之就是将每一个字符用16位2进制数标识。但是通常都用4位的16进制数标识。

例如:

1)中文字符串"你好"的unicode码为:\u60\u597d;

2)英文字符串"ab"的unicode码为:\u0061\u0062;

其中\u是标识unicode码用的,后面的4位16进制数则是对应字符的unicode码。

unicode码在J2EE项目中应用广泛,java对unicode码提供了很好的支持。例如国际化,则是unicode的经典运用。

那么unicode的编码规则具体是什么,如何用程序实现?

1、unicode编码规则

unicode码对每一个字符用4位16进制数表示。具体规则是:将一个字符(char)的高8位与低8位分别取出,转化为16进制数,

如果转化的16进制数的长度不足2位,则在其后补0,然后将高、低8位转成的16进制字符串拼接起来并在前面补上"\u" 即可。

2、转码程序

1)字符串转unicode

public String convert(String str)

{

str = (str == null ? "" : str);

String tmp;

StringBuffer sb = new StringBuffer(1000);

char c;

int i, j;

sb.setLength(0);

for (i = 0; i < str.length(); i++)

{

c = str.charAt(i);

sb.append("\\u");

j = (c >>>8); //取出高8位

tmp = Integer.toHexString(j);

if (tmp.length() == 1)

sb.append("0");

sb.append(tmp);

j = (c & 0xFF); //取出低8位

tmp = Integer.toHexString(j);

if (tmp.length() == 1)

sb.append("0");

sb.append(tmp);

}

return (new String(sb));

}

2)unicode转成字符串,与上述过程反向操作即可

public String revert(String str)

{

str = (str == null ? "" : str);

if (str.indexOf("\\u") == -1)//如果不是unicode码则原样返回

return str;

StringBuffer sb = new StringBuffer(1000);

for (int i = 0; i < str.length() - 6;)

{

String strTemp = str.substring(i, i + 6);

String value = strTemp.substring(2);

int c = 0;

for (int j = 0; j < value.length(); j++)

{

char tempChar = value.charAt(j);

int t = 0;

switch (tempChar)

{

case 'a':

t = 10;

break;

case 'b':

t = 11;

break;

case 'c':

t = 12;

break;

case 'd':

t = 13;

break;

case 'e':

t = 14;

break;

case 'f':

t = 15;

break;

default:

t = tempChar - 48;

break;

}

c += t * ((int) Math.pow(16, (value.length() - j - 1)));

}

sb.append((char) c);

i = i + 6;

}

return sb.toString();

}

全部回答

1楼你哪知我潦倒为你

2021-01-19 05:48

short太短了,unicode码太长,你应该用int数组来存,就没有问题了

2楼三虚那逝的流年

2021-01-19 04:26

short是16位,char也是16位,这个不大可能会有问题吧,况且符号位只有一位,值只能是0或1,即使是这样,也根本不会影响到char的取值,你最好把代码发过来,我可以帮你看看

写了一个程序证明我的推断,结果表明是没有问题的,用short存unicode

String a = "用户名或密码错误";

char[] b = a.toCharArray();

short[] c = new short[b.length];

for(int i=0;i

{

c[i] = (short)b[i];

}

char[] d = new char[b.length];

for(int i=0;i

{

d[i] = (char)c[i];

}

3楼冷月花魂

2021-01-19 04:04

只能一个个处理:

char[] charArray = new char[shortArray.length];

for (int i=0;i

charArray[i] = (char)shortArray[i];

}

String str = new String(charArray);

不过为什么要用short来存unicode字符?java的char本身就是无符号的,用于保存unicode字符的,相当于C中的w_char,而不仅仅只有0~255而已。

所以用short数组来保存字符根本就是错误的。

我要举报

如果感觉以上信息为低俗/不良/侵权的信息,可以点下面链接进行举报,我们会做出相应处理,感谢你的支持!

点此我要举报以上信息!

推荐资讯

大家都在看

java 处理unicode_java处理unicode字符相关推荐

  1. JAVA如何正确处理Unicode字符

    最近在开发输入法程序时遇到一个小问题,就是删除一个emoji时,不能一次删干净,需要执行两次操作才可以.Intuitively,这肯定是java操作unicode字符的问题,于是找了JAVA官方文档参 ...

  2. java 处理unicode_Java与Unicode

    Java与Unicode:Java的class文件采用utf8的编码方式,JVM运行时采用utf16.Java的字符串是unicode编码的.总之,Java采用了unicode字符集,使之易于国际化. ...

  3. java 编码 unicode_java编码-Unicode

    [Unicode介绍] 百度百科:Unicode(统一码.万国码.单一码)是计算机科学领域里的一项业界标准,包括字符集.编码方案等.Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种 ...

  4. java unicode字符串_如何检测Java字符串中的unicode字符?

    "unicode characters"的定义含糊不清,但将被视为标准ISO 8859 charset未涵盖的UTF-8字符.如果在您的情况下这是真的,则循环遍历String中的所 ...

  5. java的unicode_Java中Unicode的中文范围

    若要判断是否是中文 只需要用以下代码: for (int i = 0; i < sentence.length(); i++){ char c = sentence.charAt(i); if ...

  6. java语言用数组接收字符_Java基础——数组应用之字符串String类

    字符串String的使用 Java字符串就是Unicode字符序列,例如串"Java"就是4个Unicode字符J,a,v,a组成的. Java中没有内置的字符串类型,而是在标准J ...

  7. java 转换 unicode_JAVA中最方便的Unicode转换方法

    在命令行界面用native2ascii工具 1.将汉字转为Unicode: C:\Program   Files\Java\jdk1.5.0_04\bin>native2ascii 测试 \u6 ...

  8. Java 原生实现 URL Decode 功能(从 Byte 字节数组转 Unicode 字符)

    Java 实现 URL Decode 背景: ElasticSearch 自定义脚本 Painless 当中可以支持 Java 的部分 API,但 6.x 版本没有对 URLDecode 的支持(发现 ...

  9. 用java SDK/bin目录下的native2ascii.exe把.properties文件中的中文转换成unicode字符,实现国际化...

    需要用到java SDK\\bin 目录下的native2ascii.exe程序,把你写的文本文件转成unicode字符即可,例: native2ascii 源文件名.txt 新文件名.txt 测试 ...

最新文章

  1. 【开源】一键生成各种姿势的火柴人gif:在线录制真人视频即可转换
  2. 去除源文件中的重复行的程序流程及其C代码实现
  3. 鸿蒙os2.0通知栏,网友上手鸿蒙手机OS 2.0公测版:界面与EMUI已有明显不同
  4. 服务器压力测试_魔兽世界怀旧服:美服18日开放安其拉开门测试,P5阶段即将来临...
  5. python3.5安装pygame_python怎么安装pygame
  6. python请输入你的名字_实现《你的名字》同款滤镜,python+opencv
  7. linux下安装dovecot
  8. 序列化(串行化)- 使用BinaryFormatter进行序列化
  9. C++之const关键字探究
  10. 在Windows 10 环境下安装 Hadoop-3.1.2
  11. libpng库的移植与使用
  12. pdf怎么解除限制打印
  13. PHP基础PPT课件,《php基础》PPT课件.ppt
  14. 图像处理系列——图像融合之加权平均(WA)
  15. 2019_Generative Adversarial Networks for Extreme Learned Image Compression
  16. Hi,欢迎大家来到阿毛小猪的博客,分享自己学习中的经验,默默的前行,聆听心的声音...
  17. C1. Simple Polygon Embedding(几何)
  18. 写给自己---我为什么要考研
  19. 【Latex】【插入图片】如何在latex中插入并列图片
  20. 三分钟看懂大数据风控中用户行为数据的采集、分析及应用( 转 )

热门文章

  1. 使用spark-shell从本地读取文件不成功的的操作。
  2. Photoshop怎么实现图片局部马赛克
  3. [日常训练]training
  4. 从零开始学 Java - Spring AOP 拦截器的基本实现
  5. Windows Phone 7 Silverlight控件展示(含34个控件)
  6. 程序员的必杀技——编程全能词典
  7. Mac M1 环境下CV标注工具建设
  8. 软件工程团队项目方案(四):高校申请指南
  9. NetScaler配置只允许某个组访问桌面
  10. 【fabric实战指南二】Fabric v1.0 部署过程原理详解