PHP中文繁简转换-繁体-简体
项目中需要搜索简体字或者繁体字 都能够搜到相应的内容,搜索用的又是SPHINX,没法在搜索中修改程序,只能在搜索之前的关键字做出修改了。
于是想到将搜索的关键字不论是简体还是繁体 一律转换成繁体 ,然后在对内容进行搜索。
由于项目网站是繁体的,所以这样做,但如果真要搜简体的内容,就搜不到了~
网上大多数的函数都需要一个TABLE转换表,但没有找到。。不过还是通过坚持不懈的努力找到了一个:
地址:https://github.com/grick/auto-tag-slug/blob/master/class.Chinese.php
不过我需要使用的是 UTF8中文字转换为BIG5繁体字再转换为UTF8繁体字
这个过程中 ,直接将 UTF8转换成BIG5会出错。。可能简繁转换还是GB2312到BIG5会好些吧
private function iconvKey($wd){if (empty($wd)) return '';# 加载转换类if (!class_exists('Chinese')) {loader::lib('Chinese', 'search');}if ( is_dir( dirname(__FILE__) . '/../lib/chinese/config/') ) {$table = dirname(__FILE__) . '/../lib/chinese/config/';}$chs = new Chinese('UTF8', 'GB2312', $wd, $table );$str = $chs -> ConvertIT(); # GB2312$chs = new Chinese( 'GB2312', 'BIG5', $str, $table );$str = $chs -> ConvertIT(); # BIG5$chs = new Chinese( 'BIG5', 'UTF8', $str, $table );return $chs -> ConvertIT(); }
要是有更好更简便的方式来转换、求赐教~
PHP中文繁简转换-繁体-简体相关推荐
- PHP类UTF8编码内的繁简转换-繁体-简体
js网页繁体简体转换 均只支持 UTF8 文本,所以如果获得的来源是 $_GET 的话, 就有必要转换一下编码了.用到的函数是: $str = $_GET['str']; // 简体到utf8 $st ...
- linux 繁体中文转为简体,中文繁简转换及其转换工具.pdf
·计算机教育·· 本栏目贲任编辑:主力 中文繁简转换及其转换工具 冯 霞 (北京师范大学中文信息处理研究所,北京100875) 摘要:简体中文和繁体中文是现代汉语并存的两种书面形式.它们在语音.词汇. ...
- 使用.NET进行中文繁简转换的两种方法
方法一:调用VB.NET的类库. 引用Microsoft.VisualBasic.dll. 中文繁体 = Microsoft.VisualBasic.Strings.StrConv(中文简体, Mi ...
- java实现字符串中的中文繁简转换
1.使用的jar包heaven-0.1.129.jar.nlp-common-0.0.3.jar.opencc4j-1.6.0.jar 2.写成工具方法 /*** 转换字符串中的繁体中文为简体中文*/ ...
- linux给文本繁简转换,linux - 安装OpenCC(简体繁体转换)
最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...
- java 中文分词转拼音_pyhanlp 繁简转换之拼音转换与字符正则化
繁简转换 HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合.这里我们不再做过多描述. ·说明 · Han ...
- pyhanlp 繁简转换之拼音转换与字符正则化
繁简转换 HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合.这里我们不再做过多描述. ·说明 · Han ...
- 繁简转换的实现方式。
当网站遇到国际化问题时,会考虑将网站的文字转换语言形式.通常涉及这种国际化问题时会有多种实现方式.首先要将网站的编码格式设置成支持多种语言的UTF-8编码,然后对页面进行本地化翻译工作.本地化翻译分为 ...
- 繁简转换OpenCC,autogb 和 autob5,iconv,python的jianfan包
OpenCC OpenCC 是跨平台.多语言的开放中文转换库,除了基本的简繁转换功能外,用户还可以选择对不同用词习惯和异体字的处理方式. OpenCC 还提供方便的网页转换界面. OpenOffice ...
最新文章
- 解决com.mysql.jdbc.PacketTooBigException: Packet for query is too large (3158064)问题
- 32位程序调用64位dll_电脑系统怎样区分32位和64位
- Python列表解析式,还支持异步?你知道吗?
- php.ini-dist和php.ini区别,php.ini-dist 和 php.ini-recommended 的区别介绍(方便开发与安全的朋友)...
- 遥感图像数据类型的区别
- Hadoop系列之Reporter,Partitioner,JobConf, JobClient
- 关于CMS的那点事 I
- 技能Get·手动更新HP笔记本BIOS过程记录
- sig值怎么计算_T检验、sig.值
- 【Kaggle Quick, Draw!】涂鸦识别,AI与你同在
- 即将“再次”免费的JDK
- android俄罗斯方块报告,Android 俄罗斯方块
- EXSI虚拟机备份—ikuai和OPenWRT
- 【Matlab】基于皮肤概率建模的人脸检测算法雏形
- thinkphp5调用shell脚本_ThinkPHP 5.x远程命令执行测试工具(可getshell)
- Unity 渲染教程(一):矩阵
- python验证身份证最后一位数字代表什么_身份证号最后一位是“X”,代表什么意思?...
- SQLyog 最新版本12.5-64bit 完美破解,亲测可用!
- Presto (二) --------- Presto 安装
- 基于stm32的智能药盒