NSCharacterSet
NSCharacterSet
,以及它的可变版本NSMutableCharacterSet
,用面向对象的方式来表示一组Unicode字符。它经常与NSString
及NSScanner
组合起来使用,在不同的字符上做过滤、删除或者分割操作。为了给你提供这些字符是哪些字符的直观印象,请看看NSCharacterSet
提供的类方法:
alphanumericCharacterSet
capitalizedLetterCharacterSet
controlCharacterSet
decimalDigitCharacterSet
decomposableCharacterSet
illegalCharacterSet
letterCharacterSet
lowercaseLetterCharacterSet
newlineCharacterSet
nonBaseCharacterSet
punctuationCharacterSet
symbolCharacterSet
uppercaseLetterCharacterSet
whitespaceAndNewlineCharacterSet
whitespaceCharacterSet
与它的名字所表述的相反,NSCharacterSet
跟 NSSet
一点关系都没有。
虽然底层实现不太一样,但是 NSCharacterSet
在概念上跟 NSIndexSet
还有点相似的。NSIndexSet
,之前提到过,表示一个有序的不重复的无符号整数的集合。Unicode字符跟无符号整数类似,大致对应一些拼写表示。所以,一个 NSCharacterSet +lowercaseCharacterSet
字符集与一个包含97到122范围的 NSIndexSet
是等价的。
现在我们对理解 NSCharacterSet
的基本概念已经有了少许自信,让我们来看一些它的模式与反模式吧:
去掉空格
NSString -stringByTrimmingCharactersInSet:
是个你需要牢牢记住的方法。它经常会传入NSCharacterSet +whitespaceCharacterSet
或 +whitespaceAndNewlineCharacterSet
来删除输入字符串的头尾的空白符号。
需要重点注意的是,这个方法 仅仅 去除了 开头 和 结尾 的指定字符集中连续字符。这就是说,如果你想去除单词之间的额外空格,请看下一步。
挤压空格
假设你去掉字符串两端的多余空格之后,还想去除单词之间的多余空格,这里有个非常简便的方法:
NSString *string = @"Lorem ipsum dolar sit amet."; string = [string stringByTrimmingCharactersInSet:[NSCharacterSet whitespaceCharacterSet]]; NSArray *components = [string componentsSeparatedByCharactersInSet:[NSCharacterSet whitespaceCharacterSet]]; components = [components filteredArrayUsingPredicate:[NSPredicate predicateWithFormat:@"self <> ''"]]; string = [components componentsJoinedByString:@" "];
首先,删除字符串首尾的空格;然后用 NSString -componentsSeparatedByCharactersInSet:
在空格处将字符串分割成一个 NSArray
;再用一个 NSPredicate
去除空串;最后,用 NSArray -componentsJoinedByString:
用单个空格符将数组重新拼成字符串。注意:这种方法仅适用于英语这种用空格分割的语言。
现在看看反模式吧。请先看看 the answers to this question on StackOverflow。
在写这篇文章的时候,排行第二的正确答案有 58 个顶和 2 个踩。排行第一的有 84 个顶和 24 个踩。
如今,排名第一的答案却不是正确答案是不太正常的,但是这个问题已经破了不重复答案数(10个)的记录,同时也破了不重复、完全错误的答案数(9个)的记录。
言归正传,这里有 9 个错误答案:
- "Use
stringByTrimmingCharactersInSet
" - 正如你所知道的,它只去掉首尾的空格。 - "Replace ' ' with ''" - 这个去除了所有的空格,劳而无功。
- "Use a regular expression" - 有点用,但它没有处理首尾的空格。用正则表达式有点大材小用了。
- "Use Regexp Lite" - 说真的,正则表达式真心没必要。同时为了这点功能增加第三方库很不值。
- "Use OgreKit" - 同上,添加了第三方库。
- "Split the string into components, iterate over them to find components with non-zero length, and then re-combine" - 很接近了,但是
componentsSeparatedByCharactersInSet:
已经让遍历变得没必要。 - "Replace two-space strings with single-space strings in a while loop" - 错误且浪费计算资源。
- "Manually iterate over each
unichar
in the string and useNSCharacterSet -characterIsMember:
" - 用了一个复杂到让人吃惊的程度的方法,却忘了标准库中已经有方法可以用。 - "Find and remove all of the tabs" - 有谁提到了制表符了?不过还是谢谢了吧。
我个人并不是想责怪回答问题的人——只是指出完成这个功能有多少种不同的方法,而这些方法有多少是完全错误的。
字符串分词
不要用 NSCharacterSet
来分词。 用 CFStringTokenizer
来替代它。
你用 componentsSeparatedByCharactersInSet:
来清理用户输入是可以谅解的,但是用它来做更复杂的事情,你将陷入痛苦的深渊。
为什么?请记住,语言并不是都用空格作为词的分界。虽然实际上以空格分界的语言使用非常广泛。但哪怕只算上中国和日本就已经有十多亿人,占了世界人口总量的 16%。
……即使是用空格分隔的语言,分词也有一些模棱两可的边界条件,特别是复合词汇和标点符号。
以上只为说明:如果你想将字符串分成有意义的单词,那么请用 CFStringTokenizer
(或者enumerateSubstringsInRange:options:usingBlock:
)吧。
从字符串解析数据
NSScanner
是个用以解析任意或半结构化的字符串的数据的类。当你为一个字符串创建一个扫描器时,你可以指定忽略哪些字符,这样可以避免那些字符以各种各样的方式被包含到解析出来的结果中。
例如,你想从这样一个字符串中解析出开门时间:
Mon-Thurs: 8:00 - 18:00
Fri: 7:00 - 17:00
Sat-Sun: 10:00 - 15:00
你会 enumerateLinesUsingBlock:
并像这样用一个 NSScanner
来解析:
let skippedCharacters = NSMutableCharacterSet() skippedCharacters.formIntersectionWithCharacterSet(NSCharacterSet.punctuationCharacterSet()) skippedCharacters.formIntersectionWithCharacterSet(NSCharacterSet.whitespaceCharacterSet()) string.enumerateLines { (line, _) in let scanner = NSScanner(string: line) scanner.charactersToBeSkipped = skippedCharacters var startDay, endDay: NSString? var startHour: Int = 0 var startMinute: Int = 0 var endHour: Int = 0 var endMinute: Int = 0 scanner.scanCharactersFromSet(NSCharacterSet.letterCharacterSet(), intoString: &startDay) scanner.scanCharactersFromSet(NSCharacterSet.letterCharacterSet(), intoString: &endDay) scanner.scanInteger(&startHour) scanner.scanInteger(&startMinute) scanner.scanInteger(&endHour) scanner.scanInteger(&endMinute) }
我们首先从空格字符集和标点符号字符集的并集构造了一个 NSMutableCharacterSet
。告诉 NSScanner
忽略这些字符以极大地减少解析这些字符的必要逻辑。
scanCharactersFromSet:
传入字母字符集得到每项中一星期内的开始和结束(可选)的天数。scanInteger
类似地,得到下一个连续的整型值。
NSCharacterSet
和 NSScanner
让你可以快速而充满自信地编码。这两者真是完美组合。
NSCharacterSet
是基础类库中字符串处理系统中的一员,可能是最容易被用错或是误解的一员。在脑中记住这些模式与反模式,你将不仅能做一些很有用的诸如管理空格及从字符串中读信息之类的事情,更重要的是,你将避免误入歧途。
如果“不出错”对一个 NSHipster 来说不是最重要的事情,那我也不想成为正确的了!
NSCharacterSet相关推荐
- Objective-C语法之字符串NSString去掉前后空格或回车符(可以是NSCharacterSet类型的其它字符)...
main.m 1 #import <Foundation/Foundation.h> 2 #import "NSString+Trim.h" 3 int main(in ...
- NSCharacterSet 简单用法
NSCharacterSet 简单用法 NSCharacterSet其实是许多字符或者数字或者符号的组合,在网络处理的时候会用到 NSMutableCharacterSet *base = [NSMu ...
- iOS 开发经验总结
iOS 开发经验总结http://www.cocoachina.com/ios/20170216/18699.html 1.cocoa pods 常用的framework 1 2 3 4 5 6 7 ...
- iOS开发技巧(系列十八:扩展UIColor,支持十六进制颜色设置)
新建一个Category,命名为UIColor+Hex,表示UIColor支持十六进制Hex颜色设置. UIColor+Hex.h文件, #import <UIKit/UIKit.h> # ...
- swift 和 oc中检测textfield是否输入数字
iOS 开发中用来检测输入框是否输入的是纯数字 Swift 版本 // 代理方法func textField(_ textField: UITextField, shouldChangeCharact ...
- Swift 字符串去除换行符空格符
capitalizedLetters:大写controlCharacters:控制符 whitespacesAndNewlines:空格换行 decimalDigits:小数 letters:文字 l ...
- iOS UIImageView 加载含有汉字的url处理方法
NSString *url = [model.pic stringByAddingPercentEncodingWithAllowedCharacters:[NSCharacterSet URLQu ...
- UIWebView、WKWebView使用详解及性能分析
一.整体介绍 UIWebView自iOS2就有,WKWebView从iOS8才有,毫无疑问WKWebView将逐步取代笨重的UIWebView.通过简单的测试即可发现UIWebView占用过多内存,且 ...
- swift 中跳转web view的两种方法
首先 遵循代理 引入头文件 #import <WebKit/WebKit.h> 第一种情况 直接跳转 了解不含特殊字符的 import UIKit class NewsViewCon ...
最新文章
- python的软件叫什么-Python 是什么软件?
- C++深入理解虚函数
- windows server 2012 初安装体验
- linux安装mysql 5.6.33
- mybatis依赖_这大概就是公司一直用Mybatis的原因!真的太强了
- SSIS Dataflow使用存储过程不能检索列名
- 性能测试、 障碍条件和回滚
- 浅谈欧几里得算法求最大公约数(GCD)的原理及简单应用
- Asp.net页面生命周期详解任我行(3)-服务器处理请求详细过程
- 计算机专业毕业论文参考文献(精选115个最新)
- 如何修复win7蓝牙服务器,高手亲自解决win7卸载蓝牙驱动的修复操作
- 机器学习处理信号分离_【火炉炼AI】机器学习054-用ICA做盲源分离
- 手把手教你用Python创建SQL数据库~
- 没基础,也可一文看懂 python 中的 csv 模块
- 1999.00 php,CBA20周年之1999-00赛季-前卫先合并后解散 八一5连冠
- 做好自媒体需要具备的几个心态?!
- index.tsx:19 Uncaught Error: A <Route> is only ever to be used as the child of <Routes> element, nev
- Xshell7怎么更改字体颜色和标签颜色方法教程
- 怎么ping IP地址,怎么ping域名
- Navicat常用快捷键汇总
热门文章
- 配置多个git账号_一台电脑,两个及多个git账号配置
- python显示日历_python显示日期
- 循环获取另一个php变量,通过引用将多个变量传递给foreach循环(php)
- netty 多个 本地udp端口_如何在SpringBoot中,使用Netty实现远程调用?
- c语言中嵌套循环的作用,C语言中n层循环嵌套实现
- idea打开vue项目后报错ESLint: Expected space or tab after ‘//‘ in comment.(spaced-comment)
- Spark基础学习笔记22:Spark RDD案例分析
- RN学习笔记02:利用WebStorm创建RN项目
- 数据库笔记08:实现索引
- Java案例:汉诺塔问题