判断传入的句子是中文还是英文还是中英混合并分割的函数
public function explode_sens($arr){$type=$this->judge_eg_zh($arr);if($type==1){//判断类型,是英文还是中文还是中英混合$arr = explode(" ", $arr); $words = array_filter($arr);}else if($type==2){$words=$this->arr_split_zh($arr);}else if($type==3){$words=$this->explode_en_zh($arr);}return $words;}
<pre name="code" class="php"> public function judge_eg_zh($word){$str1 = $word;$strA= trim($str1); $lenA= strlen($strA); //检测字符串实际长度$lenB= mb_strlen($strA, "utf-8"); //文件的编码方式要是UTF8 if($lenA=== $lenB) { return "1";//全英文 }else { if($lenA% $lenB== 0) { return "2";//全中文 }else { return "3";//中英混合 } }}
<span style="white-space:pre"> </span>//将汉字分割开一个个字的函数public function arr_split_zh($word){ $tempaddtext=$word;$tempaddtext = iconv("UTF-8", "gb2312", $tempaddtext); $cind = 0; $arr_cont=array(); for($i=0;$i<strlen($tempaddtext);$i++) { if(strlen(substr($tempaddtext,$cind,1)) > 0){ if(ord(substr($tempaddtext,$cind,1)) < 0xA1 ){ //如果为英文则取1个字节 array_push($arr_cont,substr($tempaddtext,$cind,1)); $cind++; }else{ array_push($arr_cont,substr($tempaddtext,$cind,2)); $cind+=2; } } } foreach ($arr_cont as &$row) { $row=iconv("gb2312","UTF-8",$row); } return ($arr_cont) ; } //分割开中文和英文的函数public function explode_en_zh($word){$tempaddtext=$word;$arr = preg_split("/([a-zA-Z0-9]+)/", $tempaddtext, 0, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE); return ($arr);}
判断传入的句子是中文还是英文还是中英混合并分割的函数相关推荐
- python中英文字符和中文字符存储长度不同_Django如何正确截取中英混合字符串及表单中限制中文字符中长度...
中文字符和英文字符所占的字节长度是不一样,一个是2个字节,一个是1个字节,这给我们用英文的web框架开发中文app带来了麻烦.比如Django自带过滤器truncatewords并不支持截取中文,另外 ...
- SQL 判断字段值是否有中文、英文、数字、提取中文、英文、数字
–SQL 判断字段值是否有中文 create function fun_getCN(@str nvarchar(4000)) returns nvarchar(4000) as begin decla ...
- js判断文字长度(区分中文及英文)
方法一: var len = 0;var v = $.trim($(this).val());for(i=0;i<v.length;i++) {if(v.charCodeAt(i)>256 ...
- python 判断字符串是否是纯中文或者英文
#判断是否是纯中文 def is_all_chinese(strs):for i in strs:if not '\u4e00' <= i <= '\u9fa5':return False ...
- Java判断字符串是否是纯中文或者英文
/** 是否是英文字符串*/public static boolean isEnglishStr(String charaString){return charaString.matches(&quo ...
- excel转html中文乱码,英文系统中Excel中文乱码问题
我是先用Gridview导出,然后再转换格式,部分代码如下 StringWriter sw = new StringWriter(); HtmlTextWriter htw = new HtmlTex ...
- java英文字母排序_Java编程实现中英混合字符串数组按首字母排序的方法
在Java中对于字符串数组的排序,我们可以使用Arrays.sort(String[])方法很便捷的进行排序.例如: 输出的结果为:"gyu sdf zf 大同 的人 地方 反对 ...
- C++学习(一三四)中文字体名的中英对照
中文名 英文名 Unicode Unicode 2 Mac OS 华文细黑 STHeiti Light [STXihei] 534E65877EC69ED1 华文细黑 华文黑体 STHeiti 534 ...
- php 判断数组某个值,浅谈PHP检查数组中是否存在某个值 in_array 函数
PHP in_array() 函数检查数组中是否存在某个值,如果存在则返回 TRUE ,否则返回 FALSE . 语法: bool in_array( mixed needle, array arra ...
最新文章
- 负载均衡中的服务器健康检查
- 我错了,有个叫 SelectSingleNode 的可以操作 xml
- CSharpGL(22)实现顺序无关的半透明渲染(Order-Independent-Transparency)
- 「 每日一练,快乐水题 」717. 1比特与2比特字符
- Microsoft Teams:团队Owner离开公司后,我们该怎么做?
- LOJ6053简单的函数(min_25筛)
- Java基本语法(14)--for循环结构
- servlet学习笔记二
- stl源码分析de练习
- android listpreference 自定义,android ListPreference 不显示内容 设置默认值
- 更高速 更智能 WLAN领域H3C再获领先——H3C发布新一代高性能802.11n 无线产品
- 两款免费、好用的数据库连接工具
- Ubuntu上完美运行QQ
- IDEA添加快捷输入
- 写一个最简单的React可配置路由(react-router
- day002-2019-07-30
- 浅谈打开网页速度慢的原因和解决方法
- 170402网摘题目
- 搭建Jpress博客系统,超详细(保姆及教学)
- Vue.js 使用cordova camera插件调取相机