问题的根源,在于UTF-8这种编码里面,存在一个特殊的字符,其编码是“0xC2 0xA0”,转换成字符的时候,表现为一个空格,跟一般的半角空格(ASCII 0x20)一样,唯一的不同是它的宽度不会被压缩,因此比较多的被用于网页排版(如首行缩进之类)。而其他的编码方式如GB2312、Unicode之类并没有这样的字符,因此如果简单地进行编码转换,生成地GB2312/Unocode字符串中,这个字符就会被替换成为问号(ASCII ox3F)。此时如果进行写库、写文件之类,就会把问号直接写入了。当然此时会有一种山寨方式:直接替换问号为空格。可是这种方法,会把原本真正的问号也枪毙掉。

使用UTF-8进行HTMLDecode的时候,对于语句开头的( ),就会被自动转换成为这个特殊的空格,可能是判断为放在开头的空格,一定是用来排版的。在转换为其他编码之前,这个特殊的空格受到的待遇与普通的半角空格是一致的,甚至也会被trim()去掉。

因此,碰到这个问题的原因有两种:一种是在UTF-8编码下进行了转换,产生了这个字符;还有一种就是网页中直接采用了这个字符进行排版。

知道了具体原因,就有正规的解决方法了。方法就是:在得到UTF-8字符串之后,先进行一个替换,把这个特殊的空格替换为普通的空格,如果是HTML串,建议替换为( )。java代码如下:

  1. byte[] space = new byte[]{(byte) 0xc2,(byte) 0xa0};

  2. String UTFSpace =new String( space,"UTF-8" );

  3. result=result.replaceAll(UTFSpace, " ");

这样做,就不会把串里面本来应该有的问号错误的替换为空格。也不会看到讨厌的问号,能保存原来字符串的真面目了。
       需要强调的是,替换之前不能进行编码转换,一定要继续使用UTF-8编码。如果已经转换成其他编码,那么错误就已经不可逆转了。没有办法再区分这个错误的问号和正常的问号之间的差别了。

空格变成问号的怪问题相关推荐

  1. Java 解决采集UTF-8网页空格变成问号乱码

    http://blog.csdn.net/bob007/article/details/27098875 使用此方法转换后,在列表中看到的正常,但是在详情页的文本框中查看到的就是 了,只好过滤掉所有的 ...

  2. 转载:解决采集UTF-8网页空格变成问号乱码

    昨天发现,用 HtmlDecode() 去解码后," "不是被解码为半角的空格(ASCII码0x20)而是变成半角问号"?"(ASCII码0x3F).而且奇怪的 ...

  3. 步步为营-92-空格变成问号的怪问题

    参考博客http://blog.csdn.net/wuhongyao3/article/details/5834921 问题描述:从百度文档或者别的地方赋值一段文字后,通过生成html保存到数据库,发 ...

  4. 读取EXCEL内容空格或连字符变成问号

    该问题之前已被其他兄弟发现并解决过,具体可参考这两篇文章 1.空格变成问号的怪问题--了解问题是如何产生的 2.该问题在读取EXCEL内容这个场景中的处理 今天我要写的是基于这两篇文章的一点延伸,两篇 ...

  5. perl:正则表达式部分

    使用简单模式匹配 若模式匹配的对象是$_的内容,只要把模式写在一对(/)中就可以了. #$_="yabba dabba doo"; #if (/abba/){ #print &qu ...

  6. php %3cphp用大括号表示,整理HTML5中支持的URL编码与字符编码_html5教程技巧

    URL 编码URL 编码就是将 URLs 中不宜打印的字符或者具有特殊意义的字符转换为 Web 浏览器和服务器明白且普遍接受的表示法. 这些字符包括: ASCII 控制字符 - 不宜打印的字符通常用于 ...

  7. 符号说明表怎么做_教会你的孩子正确使用标点符号

    所谓的标点符号包括点号和标号.使用时,不仅要掌握它们的用法,还要注意它们的规范书写. 1.凡是点号(句号.问号.感叹号.逗号.顿号.分号.冒号),都应该在原稿纸上占一方格,写在空格的左方.①句号.逗号 ...

  8. 【2012年华为校园招聘软开上机-成都】字母转换、统计单词个数

    2013-09-11 15:18:51 1 字串转换 问题描述: 将输入的字符串(字符串仅包含小写字母'a'到'z'),按照如下规则,循环转换后输出:a->b,b->c,-,y->z ...

  9. tool 之gvim 64位安装流程

    1.下载地址:https://github.com/vim/vim-win32-installer/releases/tag/v8.1.0982 如图所示: 2.安装vundle插件(提前安装git) ...

最新文章

  1. 图解Oracle备份方式分类
  2. pycharm 调试错误 Connection to Python debugger failed: Socket operation on nonsocket: configureBlocking
  3. 数字化营销关键点:如何做好深度内容策略
  4. dbda.class.php 下载,DBDA
  5. 浏览器打开域名变成localhost_史上最全微信域名防封API原理及实现方案
  6. 关于MYSQL 的 AUTO-INC Locks
  7. 导入一个android项目需要改什么意思,导入别人的Android Studio项目前要修改的文件...
  8. BOM详解(整个BOM架构体系)
  9. 关于将驱动整合至ESXi镜像过程中的一些小坑
  10. 统计学简介之九——两个总体参数的区间估计
  11. AirSim无人机仿真(Ubuntu18.04)
  12. 怎么把计算机里面的解压到桌面上,电脑桌面怎么加压文件
  13. Python 学习笔记 -- pickle模块,如何腌制泡菜(入门级)
  14. word标尺灰色_如何在Microsoft Word中使用标尺
  15. 使用OpenCV实现Halcon算法(1)亚像素提取边缘,Sub-Pixel Edge Detector
  16. 研一学习生活的总结~
  17. 神武2服务器多少级出拍卖系统,快捷购买物品和角色 神武2拍卖系统详解
  18. 日期计算(一个日期是本年的第几天)
  19. 用matlab弄个按钮怎么来,matlab按钮生按钮
  20. Mac Dock栏显示/隐藏无延迟

热门文章

  1. LIBSVM的FQA
  2. html5 sms短信发送_使用电子邮件免费向手机发送短信(SMS)
  3. 跨越千年的RSA算法
  4. 【软考】2020下半年软件设计师 易错知识点(1)
  5. Unity 用于控制摄像机的旋转、远近
  6. Mac SublimeREPL一点经验
  7. android短信接收处理和发送
  8. 读《解忧杂货店》有感
  9. 装完系统还要装什么_Win7安装完成之后需要优化什么?让win7更加轻快
  10. C# 母版页页面导航