在使用initWithData等方法将NSData转换成NSString时,如果NSData的内容含有非encoding编码的字符,将会返回nil。

----------SDK文档如下-------------

- (instancetype)initWithData:(NSData *)data encoding:(NSStringEncoding)encoding;

Return Value

An NSString object initialized by converting the bytes in data into Unicode characters using encoding. The returned object may be different from the original receiver. Returns nil if the initialization fails for some reason (for example if data does not represent valid data for encoding).

-----------------------------

这个结果在很多时候可能并不是我们所希望的,比如在获取网页源码进行分析等方面,如果页面采用了utf-8编码,只是含有个别非utf-8字符,我们更希望转换NSString成功,抛弃(或替换)那些非法字符。

按照utf8格式标准

Unicode/UCS-4
bit数
UTF-8
byte数
范围(16进制)
0000 ~
007F
0~7
0XXX XXXX
1
0x - 7x
0080 ~
07FF
8~11
110X XXXX
10XX XXXX
2
Cx 8x - Dx Bx
0800 ~
FFFF
12~16
1110XXXX
10XX XXXX
10XX XXXX
3
Ex 8x 8x - Ex Bx Bx
1 0000 ~
1F FFFF
17~21
1111 0XXX
10XX XXXX
10XX XXXX
10XX XXXX
4
F8 8x 8x 8x 8x - FB Bx Bx Bx Bx 
20 0000 ~
3FF FFFF
22~26
1111 10XX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
5
FC 8x 8x 8x 8x 8x - FD Bx Bx Bx Bx Bx
400 0000 ~
7FFF FFFF
27~31
1111 110X
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
6

如果一个字节小于0x80,那么他就是一个字符;

如果大于C0小于E0,表示2个字节组成的utf8字符(第一个是110开头的,第二个是10开头的);

如果大于E0小于F0,表示3个字节组成的utf8字符(第一个是1110开头的,第二个是10开头的,第三个是10开头的);

以此类推,如果不符合utf-8规则,则表示一个非法字符,只要替换这样的字符即可。

实现方法如下(此实现可用但不够严谨,如用于工程中建议进行优化):

[objc] view plaincopy
  1. //替换非utf8字符
  2. //注意:如果是三字节utf-8,第二字节错误,则先替换第一字节内容(认为此字节误码为三字节utf8的头),然后判断剩下的两个字节是否非法;
  3. - (NSData *)replaceNoUtf8:(NSData *)data
  4. {
  5. char aa[] = {'A','A','A','A','A','A'};                      //utf8最多6个字符,当前方法未使用
  6. NSMutableData *md = [NSMutableData dataWithData:data];
  7. int loc = 0;
  8. while(loc < [md length])
  9. {
  10. char buffer;
  11. [md getBytes:&buffer range:NSMakeRange(loc, 1)];
  12. if((buffer & 0x80) == 0)
  13. {
  14. loc++;
  15. continue;
  16. }
  17. else if((buffer & 0xE0) == 0xC0)
  18. {
  19. loc++;
  20. [md getBytes:&buffer range:NSMakeRange(loc, 1)];
  21. if((buffer & 0xC0) == 0x80)
  22. {
  23. loc++;
  24. continue;
  25. }
  26. loc--;
  27. //非法字符,将这个字符(一个byte)替换为A
  28. [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
  29. loc++;
  30. continue;
  31. }
  32. else if((buffer & 0xF0) == 0xE0)
  33. {
  34. loc++;
  35. [md getBytes:&buffer range:NSMakeRange(loc, 1)];
  36. if((buffer & 0xC0) == 0x80)
  37. {
  38. loc++;
  39. [md getBytes:&buffer range:NSMakeRange(loc, 1)];
  40. if((buffer & 0xC0) == 0x80)
  41. {
  42. loc++;
  43. continue;
  44. }
  45. loc--;
  46. }
  47. loc--;
  48. //非法字符,将这个字符(一个byte)替换为A
  49. [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
  50. loc++;
  51. continue;
  52. }
  53. else
  54. {
  55. //非法字符,将这个字符(一个byte)替换为A
  56. [md replaceBytesInRange:NSMakeRange(loc, 1) withBytes:aa length:1];
  57. loc++;
  58. continue;
  59. }
  60. }
  61. return md;
  62. }

转换后的NSData就可以正确转换为NSString了。

*如果是非utf-8编码,请自行对对应照编码协议转换。

解决NSData转NSString返回nil的问题相关推荐

  1. 为什么有时候NSData转换成NSString的时候返回nil

    为什么有时候NSData转换成NSString的时候返回nil 有时候,NSData明明有值,可是,当转换成NSString的时候,却没有值,现在来进行测试:) -现在提供测试用素材- 源码如下: / ...

  2. 解决 pathForResource 返回 nil的问题

    点击(此处)折叠或打开 NSString* path = [[NSBundle mainBundle] pathForResource:@"sample" ofType:@&quo ...

  3. python response.json()报错_Django JsonResponse json格式报错 解决Django响应JsonResponse返回json格式数据报错问题...

    想了解解决Django响应JsonResponse返回json格式数据报错问题的相关内容吗,彭世瑜在本文为您仔细讲解Django JsonResponse json格式报错的相关知识和一些Code实例 ...

  4. php 返回字符串给aja,解决ajax异步请求返回的是字符串问题

    1.返回结果差异 js获取后打印res.code无结果.因为返回数据格式不正确. php文件添加header头: header('Content-Type:application/json;'); 或 ...

  5. Xcode bug: imageNamed:方法返回nil

    使用版本 Xcode 7: p_w_picpathNamed:方法返回nil往往有以下几种情况: 项目不存在该图片: 图片命名不正确: 图片的后缀名有问题(往往使用.png的图片,使用.jpg后缀的图 ...

  6. iOS 解决导航栏pop返回时出现黑块问题!

    iOS 解决导航栏pop返回时出现黑块问题! 问题描述: 导航栏正常从A页面push到B页面,从B页面pop返回A页面时遇到过渡过程中导航栏出现黑块的问题. 如截图所示: 问题原因: A界面导航栏被影 ...

  7. BeginInvoke与EndInvoke方法解决多线程接收委托返回值问题

    BeginInvoke与EndInvoke方法解决多线程接收委托返回值问题 参考文章: (1)BeginInvoke与EndInvoke方法解决多线程接收委托返回值问题 (2)https://www. ...

  8. 解决 Tomcat 下 getInitParameter 返回 null

    解决 Tomcat 下 getInitParameter 返回 null getInitParameter 返回 null config.getInitParameter 返回 null 笔者报错时的 ...

  9. python response.json()报错_解决Django响应JsonResponse返回json格式数据报错问题

    解决Django响应JsonResponse返回json格式数据报错问题,给大家,报错,代码,图书,希望能 解决Django响应JsonResponse返回json格式数据报错问题 易采站长站,站长之 ...

最新文章

  1. linux删除指定创建时间文件(文件夹)脚本
  2. 算法之最近最少使用LRU
  3. VMWare安装Linux系统之CentOS-6.6
  4. 【DIY】光剑(一):炽焰长剑的诞生
  5. MLPrimitive如何添加自定义的Primitive
  6. C# C/S 图片验证码功能源码
  7. 【我所认知的BIOS】— uEFI AHCI Driver(8) — Pci.Read()
  8. 10人以下小团队管理手册-学习笔记
  9. 基于Doxygen的C/C++注释原则
  10. hp服务器安装win7普通系统安装,hp台式电脑安装系统一键安装win7系统
  11. MATLAB 绕轴旋转图像函数 rotate 详解
  12. python线性拟合numpypolyfit_python – 具有适配参数的numpy.polyfit
  13. Java程序员实现完美代码的十大要素
  14. 啊哈算法2伟大思维闪耀时_五分钟学编程:怎样才能学好笔试面试最爱考察的算法...
  15. 【暗恋不可耻但无用】QQ空间爬虫-Python版(pyzone-crawler)
  16. 使用UE4开发VR项目_性能优化(三)_思路和方法
  17. MarkdownPad2 插入数学公式Mathjax
  18. ovftool导出虚拟机报错处理过程!
  19. Wordpress替换Gravatar用户头像,让wordpress会员头像本地化提高加载速度(附代码)
  20. 企业搭建APP怎么正确选择云服务器配置?

热门文章

  1. centos6 安装bbr_Centos 升级内核安装 BBR 简易操作!
  2. 二十五、深入Java中的static静态修饰符
  3. 工程制图 (组合体的视图与尺寸注法)
  4. kaggle(一)训练猫狗数据集
  5. JS判断是否选中的是表格内当前选中的那一行
  6. 文本分类和序列标注“深度”实践
  7. 第二十次CCF计算机软件能力认证总结
  8. Python-面向对象的编程语言
  9. 传智播客python笔记_python传智播客笔记--第十天:隐藏属性,私有属性,私有方法,__del__方法,类的继承,类中方法的重写...
  10. 前端如何让倒计时更准确