PHP 中英文混合排版中处理字符串常用的函数

更新时间:2007年04月12日 00:00:00   作者:

# 判断某个位置是中文字符的左还是右半部分,或不是中文

# 返回值 -1 左 0 不是中文字符 1 右

# 用法

/*

$a = 'this is 中文';

print is_chinese($a, 1); // 0

print is_chinese($a,8); // -1

print is_chinese($a,9); // 1

*/

function is_chinese(&$str, $location) {

$ch = true;

$i = $location;

while(ord($str[$i])>0xa0 && $i >= 0) {

$ch = !$ch;

$i --;

}

if($i != $location) {

$f_str = $ch ? 1: -1;

}

else {

$f_str = false;

}

return $f_str;

}

# 中文字符串倒置函数

# 如果一个将一个有中文的字符串用strrev倒过来,就会产生乱码

/*

print cstrrev('this is 中文'); // 文中 si siht

*/

function cstrrev(&$str) {

$long = strlen($str);

for($f_str='', $chinese=false, $i=$long-1; $i>=0; $i--) {

if(ord($str[$i]) > 0xa0) {

$chinese = ! $chinese;

if($chinese == false) {

$f_str .= $str[$i].$str[$i+1];

}

}

else {

$f_str .= $str[$i];

}

}

return $f_str;

}

/* 中文字符串截取函数

一些中文字符串截取函数经常有一些问题,例如在一些自动换行程序中

$a=“1中2”;

经两次截取后,

csubstr($str,$a,0,2);

csubstr($str, $a, 2,2)

由于载取位置指向“中”的右字节,可能会是这样的结果

1, 2

用本函数会产生正确的结果

1中, 2

*/

# start 开始位置,从0开始

# long = 0 则从start 一直取到字符串尾

# ltor = true 时从左到右取字符,false 时到右到左取字符

# $cn_len 中文字符按字节取还是字数取,如果按字数取,则一个中文当一个字节计算

function csubstr(&$str, $start=0, $long=0, $ltor=true, $cn_len=2) {

if($long == 0) $long = strlen($str);

if($ltor == false) $str = cstrrev($str);

if($cn_len == 1) {

for($i=0, $fs=0; $i

$i += (ord($str[$fs]) <= 0xa0) ? 1 : 0.5;

for($i=0, $fe=$fs; $i

$i += (ord($str[$fe]) <= 0xa0) ? 1 : 0.5;

$long = $fe - $fs;

}

else {

$fs = (is_chinese($str, $start) == 1) ? $start - 1 : $start;

$fe = $long + $start - 1;

$end = ( is_chinese($str, $fe) == -1 ) ? $fe -1 : $fe;

$long = $end - $fs + 1;

}

$f_str = substr($str, $fs, $long);

if($ltor == false) $f_str = cstrrev($f_str);

return $f_str;

}

# 取左字符串

# 当cn_len == 2 时 $long 取左边多少个字,反之则取左边多少个字节

function cleft(&$str, $long, $cn_len=2) {

$f_str = csubstr($str, 0, $long, true, $cn_len);

return $f_str;

}

# 取右字符串

function cright(&$str, $long, $cn_len=2) {

$f_str = cstrrev($str);

$f_str = csubstr($f_str, 0, $long, true, $cn_len);

$f_str = cstrrev($f_str);

return $f_str;

}

# 对含有中文字符的文章分行格式化

# 再也不会发生因换行问题而产生的种种问题啦!!!

# 注:文章的每一行必须用 n (chr(13))进行分行

# $width 每行多少字符

# $br 将 每行用什么字符当结束符

function ctext_wrap(&$text, $width=60, $br="
") {

$lines = explode("n",$text);

$rows = count($lines);

for($i=0; $i

$len = strlen($lines[$i]);

for($j=0; $j

$p = $j + $width - 1;

$k = 0;

if($p

while(!is_chinese($lines[$i], $p) && $lines[$i][$p] != ' ' && $p>$j) {

$k ++;

$p --;

}

if($p == $j) $k = 0;

}

$f_str .= csubstr($lines[$i], $j, $width-$k) . $br;

$j -= $k;

}

}

return $f_str;

}

相关文章

在php里当需要判断一个字符串长度时,我们首先想到的是strlen()函数,不错,strlen()返回的就是字符串的长度,这样使用没有任何问题。不过,如果要从php程序优化的角度来看,使用strlen()判断字符串长度未免是最好的写法2014-03-03

skymvc是一款轻量、简单的php mvc框架,借鉴了各大框架的设计,采纳了很多优秀的函数及类,skymvc不鼓励傻瓜式的开发,更注重给予开发者更多的思考空间。2011-06-06

这篇文章主要为大家详细介绍了ThinkPHP发送邮件示例代码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下2016-10-10

这篇文章主要介绍了PHP move_uploaded_file() 函数,其实就是将上传的文件移动到新位置,需要的朋友可以参考下2018-03-03

最近看到一篇文章:《PHP开发者常犯的10个MySQL错误》,发现文中不少内容陈旧,随着时间推移技术发展变化而变得不适用。为了防止误导新手,特本着与时俱进的精神写出此文,绝非对原文作者的不尊重2012-01-01

这篇文章主要介绍了PHP的Yii框架中对前端资源包的使用,列举了Yii中一些JavaScript和CSS常用资源,需要的朋友可以参考下2016-03-03

这篇文章主要介绍了PHP+jquery实时显示网站在线人数的方法,较为详细的分析了实时显示在线人数的原理与代码实现技巧,具有一定参考借鉴价值,需要的朋友可以参考下2015-01-01

这篇文章主要介绍了PHP实现二维数组按指定的键名排序的方法,这里以数组记录三个人信息中的年龄age字段值进行排序为例,分析了php二维数组排序的操作技巧,需要的朋友可以参考下2017-08-08

这篇文章主要介绍了PHP实现CSV文件的导入和导出类,实例分析了php针对csv文件的操作技巧,非常具有实用价值,需要的朋友可以参考下2015-03-03

在php中有时为了控制程序的输出显示顺序,提供了output buffering缓存(php自身缓存机制)。若Ob缓存开启,需要输出的就先存在ob缓存里,再到程序缓存里。若没有开启,则直接进入程序缓存,程序执行完毕,按照顺序从程序缓存里输出2013-07-07

最新评论

php中英文章,PHP 中英文混合排版中处理字符串常用的函数相关推荐

  1. PHP 中英文混合排版中处理字符串常用的函数

    # 判断某个位置是中文字符的左还是右半部分,或不是中文 # 返回值 -1 左 0 不是中文字符 1 右 # 用法 /* $a = 'this is 中文'; print is_chinese($a, ...

  2. Python中字符串常用处理函数

    ** Python中字符串常用处理函数 ** 1.len( )函数 用len( )函数计算字符串的长度 2.strip( )函数 删除字符串两边的空白符(包括:'\n'.'\t'.'\r') 注:只能 ...

  3. SQL Server 中截取字符串常用的函数

    SQL Server 中截取字符串常用的函数:1.LEFT ( character_expression , integer_expression ) 函数说明:LEFT ( '源字符串' , '要截 ...

  4. php中英文章,php统计中英文混合的文章字数

    function ccStrLen($str) #计算中英文混合字符串的长度 { $ccLen=0; $ascLen=strlen($str); $ind=0; $hasCC=ereg("[ ...

  5. BertTokenizer在处理中英文混合序列中遇到的问题

    直接上代码: from transformers import BertTokenizerpath = '../PTM/bert-base-zh'tokenizer = BertTokenizer.f ...

  6. 中英网站建设有哪些区别 中英网站建设需要注意什么

    随着经济的全球化发展,很多国内的企业都在寻找海外渠道的扩展,而中英网站建设就是其中一种渠道.那你知道中英网站建设有哪些区别吗? 中英网站建设需要注意什么呢?下面随我们看看吧! 中英网站建设有哪些区别 ...

  7. 计算机组成原理知识点白中英,计算机组成原理重点整理(白中英版) 考试必备

    计算机组成原理重点整理(白中英版) 考试必备 一. 浮点存储:1.若浮点数 x 的 754 标准存储格式为(41360000)16,求其浮点数的十进制数值.解:将 16 进制数展开后,可得二制数格式 ...

  8. 实体对齐 算法_中英命名实体识别及对齐中的中文分词优化 论文笔记

    1.计算命名实体词汇对齐的置信度:对一个中英双语句对,中文在初始分词的基础上进行命名实体识别. 2.分词工具:采用中科院分词工具ICTCLAS.Stanford分词工具对中文句子进行分词,其中Stan ...

  9. python字符串三种常用的方法或函数_python中字符串常用的函数

    s ="hello world" s[2] >>> "l" 索引 s.index("l") >>> 2 ...

最新文章

  1. HBase - Phoenix剖析
  2. sas univariate 结果解释_PROC UNIVARIATE过程
  3. designpatterns -- strategy
  4. Java 8里的Predicate学习笔记
  5. Hadoop + Amazon EC2 –更新的教程
  6. 超完整的 Chrome 浏览器客户端调试大全
  7. FastDFS的介绍
  8. ZT云流量软件官网响应式HTML模板
  9. 【干货】卷积神经网络Alex-Net、VGG-Nets、Network-In-Network案例分析
  10. 线性表:5.约瑟夫环,循环链表及其C语言实现
  11. 常见地理知识总结的连接
  12. 未来五年,iOS 开发如何前行?
  13. python在windows上创建虚拟环境
  14. FREESPACE 发布 logo v1.1
  15. 英语常用九种时态记忆要点
  16. Wi-Fi 无线网二维码生成 API 接口
  17. 服务器状态监控,LOL服务器状态监控
  18. 为什么阿里 P7 都找不到工作了?
  19. 相关系数与相关指数区别
  20. 每天一篇论文 365/365 Visual Odometry Revisited: What Should Be Learnt?

热门文章

  1. 华为OD机试用Python实现 -【寻找关键钥匙】 2023Q1A
  2. hive中如何判断字符串是否是数字
  3. python中表示绝对值的函数_用于获取绝对值的用户定义函数
  4. 标题党 数据抓取与管理
  5. 虚拟机Linux系统忘记密码修改root或其他用户密码的方法
  6. Oracle Clob类型和Blob类型之间的转换
  7. 移动适配-vw/wh
  8. 大数据系统开发综合实践(淘宝双11大数据批处理分析系统、NBA 、淘宝购物大数据实时展示、Spark GraphX)
  9. Python正则表达式及常用匹配
  10. IntelliJ Idea列操作高效解决批量操作(生成枚举类实例)