中文正则,Notepad++中文正则
转载请注明出处,如果您觉得文章有用,就赏我个鸡腿吧!
中文在unicode的范围如下:
字符集 | 字数 | Unicode 编码 |
---|---|---|
基本汉字 | 20902字 | 4E00-9FA5 |
基本汉字补充 | 74字 | 9FA6-9FEF |
扩展A | 6582字 | 3400-4DB5 |
扩展B | 42711字 | 20000-2A6D6 |
扩展C | 4149字 | 2A700-2B734 |
扩展D | 222字 | 2B740-2B81D |
扩展E | 5762字 | 2B820-2CEA1 |
扩展F | 7473字 | 2CEB0-2EBE0 |
扩展G | 4939字 | 30000-3134A |
康熙部首 | 214字 | 2F00-2FD5 |
部首扩展 | 115字 | 2E80-2EF3 |
兼容汉字 | 477字 | F900-FAD9 |
兼容扩展 | 542字 | 2F800-2FA1D |
PUA(GBK)部件 | 81字 | E815-E86F |
部件扩展 | 452字 | E400-E5E8 |
PUA增补 | 207字 | E600-E6CF |
汉字笔画 | 36字 | 31C0-31E3 |
汉字结构 | 12字 | 2FF0-2FFB |
汉语注音 | 43字 | 3105-312F |
注音扩展 | 22字 | 31A0-31BA |
〇 | 1字 | 3007 |
JS中的中文正则
let str = '你好中国';
/[\u4e00-\u9fa5]+/.test(str);
/[一-龥]+/.test(str);
NotePad++中的中文正则
[\x{4e00}-\x{9fa5}]+
#或者
[一-龥]+
PHP中的中文正则
$str = '你好中国';
preg_match("/^[\x{4E00}-\x{9FA5}]+$/u", $str, $match);
preg_match("/^[一-龥]+$/u", $str, $match);
知识扩展
对于上述正则提到的 一-龥 可以生效,可以看下图:
一表示的是unicode的中文起始编码,
龥表示的是unicode的中文结束编码,明白原因了把
中文正则,Notepad++中文正则相关推荐
- php正则获取标签,PHP通过正则匹配中文字符 过滤html标签 获取文本内容
正则匹配中文汉字根据页面编码不同而略有区别: GBK/GB2312编码:[x80-xff]+ 或 [xa1-xff]+ UTF-8编码:[x{4e00}-x{9fa5}]+/u [php] $str ...
- mysql 替换非中文_mysql中的正则操作 匹配手机号,匹配中文,替换
mysql中的正则操作 匹配手机号,匹配中文,替换 正则匹配hy_user表内tel字段的电话号码: SELECT * FROM hy_user WHERE tel REGEXP "[1][ ...
- Python2和Python3正则匹配中文时的编码问题
Python2和Python3正则匹配中文时的编码问题 我们都会遇到这样的人,他们说话时是中文英文穿插使用的.也就是一句话中有中文也有英文,很多时候没有办法避免,尤其是说一些专业术语时,当然也有纯个人 ...
- php utf-8编码 正则匹配中文
首先unicode里面 中文的区域的0x4e00-0x9fa5 在java或者js这种已unicode编码处理字符串的编程语言中 /^[\u4e00-\u9fa5]+$/就可以判断一个字符串是否全部为 ...
- php 正则匹配中文标点,JavaScript_js实现正则匹配中文标点符号的方法,本文实例讲述了js正则匹配中 - phpStudy...
js实现正则匹配中文标点符号的方法 本文实例讲述了js正则匹配中文标点符号的方法.分享给大家供大家参考,具体如下: 运行效果截图如下: 具体代码如下: js正则匹配中文标点符号 function ch ...
- php正则匹配中文和英文字母,PHP正则匹配中文字母数字正则的表达式
PHP正则匹配中文字母数字正则的表达式 PHP语言是一门实用性很强的语言,下面小编为大家带来了关于PHP正则匹配中文字母数字正则的'表达式,欢迎大家阅读! PHP正则匹配中文字母数字正则的表达式 代码 ...
- re正则匹配中文字符
re正则匹配中文字符 re 匹配中文字符规则 re.compile(u"[\u4e00-\u9fa5]+") 下图是我爬取jd手表的一条数据 在该字典中的title键所对应的值va ...
- Python正则匹配中文与编码总结
###字符串的编码乱码问题由来已久,真的是令人头疼.这不是在做正则匹配中文时候,编码又一次成了拦路虎,在这儿记录两点.第一,字符串编码.第二,正则匹配中文. 早期编码都用ASCII编码,用一个字节来处 ...
- 只能输入中文,及中文标点符号正则/只能输入英文,及英文标点符号正则
//只能输入中文,及中文标点符号正则 var regChina = /^[\u4e00-\u9fa5\s\·\~\!\@\#\¥\%\--\&\*\(\)\--\-\+\=\[\]\{\}\. ...
- php正则匹配标点符号,js实现正则匹配中文标点符号的方法
本文实例讲述了js正则匹配中文标点符号的方法.分享给大家供大家参考,具体如下: 运行效果截图如下: 具体代码如下: js正则匹配中文标点符号 function checkText() { var te ...
最新文章
- Dumpzilla工具第615行bug的解决办法
- 牛客 - 货物种类(差分)
- python中dict转换成list_python里dict变成list实例方法
- 【Python3网络爬虫开发实战】3.1.2-处理异常
- C++:求n以内被3除余余1的所有整数
- ReactOS 对象的结构,创建,使用,删除
- 中国焦磷酸四钾市场趋势报告、技术动态创新及市场预测
- LeetCode 96. Unique Binary Search Trees
- POSIX 信号量和互斥锁
- 技术对游戏公司来讲到底有多重要?
- windows找不到文件gpedit.msc_u盘插入电脑在windows却找不到u盘的解决办法【详解】...
- 华为云MVP朱有鹏:做IoT开发乐趣无穷,年轻开发者更要厚积薄发
- [转]PHP FFI详解 - 一种全新的PHP扩展方式
- Bellman——Ford算法
- CSS中position的relative和absolute.
- vue中文翻译拼音组件_Vue组件可简化文本的翻译方式:通过内联翻译
- 农夫过河(基于C语言)
- Vue3.0尚硅谷(讲师:张天禹)视频学习笔记
- 《每日一记 》网络篇-ARP协议与IP地址MAC地址
- 访问网站时,网站可以进行访问,但使用ping命令,ping域名或ip时发现ping不通原因