项目中需要搜索简体字或者繁体字 都能够搜到相应的内容,搜索用的又是SPHINX,没法在搜索中修改程序,只能在搜索之前的关键字做出修改了。

于是想到将搜索的关键字不论是简体还是繁体 一律转换成繁体 ,然后在对内容进行搜索。

由于项目网站是繁体的,所以这样做,但如果真要搜简体的内容,就搜不到了~

网上大多数的函数都需要一个TABLE转换表,但没有找到。。不过还是通过坚持不懈的努力找到了一个:

地址:https://github.com/grick/auto-tag-slug/blob/master/class.Chinese.php

使用起来还是很方便的,里面有DEMO。

不过我需要使用的是 UTF8中文字转换为BIG5繁体字再转换为UTF8繁体字

这个过程中 ,直接将 UTF8转换成BIG5会出错。。可能简繁转换还是GB2312到BIG5会好些吧

于是我的流程是这样的:


private function iconvKey($wd){if (empty($wd))  return '';# 加载转换类if (!class_exists('Chinese')) {loader::lib('Chinese', 'search');}if ( is_dir( dirname(__FILE__) . '/../lib/chinese/config/') ) {$table = dirname(__FILE__) . '/../lib/chinese/config/';}$chs = new Chinese('UTF8', 'GB2312', $wd, $table );$str = $chs -> ConvertIT(); # GB2312$chs = new Chinese( 'GB2312', 'BIG5', $str, $table );$str = $chs -> ConvertIT(); # BIG5$chs = new Chinese( 'BIG5', 'UTF8', $str, $table );return $chs -> ConvertIT(); }

要是有更好更简便的方式来转换、求赐教~

PHP中文繁简转换-繁体-简体相关推荐

  1. PHP类UTF8编码内的繁简转换-繁体-简体

    js网页繁体简体转换 均只支持 UTF8 文本,所以如果获得的来源是 $_GET 的话, 就有必要转换一下编码了.用到的函数是: $str = $_GET['str']; // 简体到utf8 $st ...

  2. linux 繁体中文转为简体,中文繁简转换及其转换工具.pdf

    ·计算机教育·· 本栏目贲任编辑:主力 中文繁简转换及其转换工具 冯 霞 (北京师范大学中文信息处理研究所,北京100875) 摘要:简体中文和繁体中文是现代汉语并存的两种书面形式.它们在语音.词汇. ...

  3. 使用.NET进行中文繁简转换的两种方法

    方法一:调用VB.NET的类库. 引用Microsoft.VisualBasic.dll. 中文繁体 = Microsoft.VisualBasic.Strings.StrConv(中文简体,  Mi ...

  4. java实现字符串中的中文繁简转换

    1.使用的jar包heaven-0.1.129.jar.nlp-common-0.0.3.jar.opencc4j-1.6.0.jar 2.写成工具方法 /*** 转换字符串中的繁体中文为简体中文*/ ...

  5. linux给文本繁简转换,linux - 安装OpenCC(简体繁体转换)

    最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...

  6. java 中文分词转拼音_pyhanlp 繁简转换之拼音转换与字符正则化

    繁简转换 HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合.这里我们不再做过多描述. ·说明 · Han ...

  7. pyhanlp 繁简转换之拼音转换与字符正则化

    繁简转换 HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合.这里我们不再做过多描述. ·说明 · Han ...

  8. 繁简转换的实现方式。

    当网站遇到国际化问题时,会考虑将网站的文字转换语言形式.通常涉及这种国际化问题时会有多种实现方式.首先要将网站的编码格式设置成支持多种语言的UTF-8编码,然后对页面进行本地化翻译工作.本地化翻译分为 ...

  9. 繁简转换OpenCC,autogb 和 autob5,iconv,python的jianfan包

    OpenCC OpenCC 是跨平台.多语言的开放中文转换库,除了基本的简繁转换功能外,用户还可以选择对不同用词习惯和异体字的处理方式. OpenCC 还提供方便的网页转换界面. OpenOffice ...

最新文章

  1. 解决com.mysql.jdbc.PacketTooBigException: Packet for query is too large (3158064)问题
  2. 32位程序调用64位dll_电脑系统怎样区分32位和64位
  3. Python列表解析式,还支持异步?你知道吗?
  4. php.ini-dist和php.ini区别,php.ini-dist 和 php.ini-recommended 的区别介绍(方便开发与安全的朋友)...
  5. 遥感图像数据类型的区别
  6. Hadoop系列之Reporter,Partitioner,JobConf, JobClient
  7. 关于CMS的那点事 I
  8. 技能Get·手动更新HP笔记本BIOS过程记录
  9. sig值怎么计算_T检验、sig.值
  10. 【Kaggle Quick, Draw!】涂鸦识别,AI与你同在
  11. 即将“再次”免费的JDK
  12. android俄罗斯方块报告,Android 俄罗斯方块
  13. EXSI虚拟机备份—ikuai和OPenWRT
  14. 【Matlab】基于皮肤概率建模的人脸检测算法雏形
  15. thinkphp5调用shell脚本_ThinkPHP 5.x远程命令执行测试工具(可getshell)
  16. Unity 渲染教程(一):矩阵
  17. python验证身份证最后一位数字代表什么_身份证号最后一位是“X”,代表什么意思?...
  18. SQLyog 最新版本12.5-64bit 完美破解,亲测可用!
  19. Presto (二) --------- Presto 安装
  20. 基于stm32的智能药盒

热门文章

  1. 中专学计算机维修,《计算机维修与网络工程》中专学历班
  2. mysql查询where后面索引失效_where条件索引失效情况
  3. 高效的CSS代码(1)
  4. 优漫动游初学者如何学习UI设计?
  5. 表单-员工信息登记表
  6. Windows 7下可以使用的各个命令语句+C#打开
  7. RTL8192EU驱动程序编译步骤
  8. IDC机房架构设备选购案例
  9. Mac 中文乱码解决笔记
  10. Unity人工智能编程精粹学习笔记 寻找最短路径并避开障碍物——A*寻路