当网站遇到国际化问题时,会考虑将网站的文字转换语言形式。通常涉及这种国际化问题时会有多种实现方式。首先要将网站的编码格式设置成支持多种语言的UTF-8编码,然后对页面进行本地化翻译工作。本地化翻译分为:

  • 机器自动翻译,类似于Google翻译或者Office繁简转换;
  • 人工翻译,网站开发的页面模板直接由人工翻译成多种语言。

这两种方式各有利弊:前一种技术难度高,尤其是对一些语义难以翻译准确的;后一种可以保证翻译准确,但是系统维护比较麻烦,例如文案在更新时又要重新翻译,而且对多模板配置还会涉及数据库多份存储。
    综合以上利弊,针对繁简转换我们实现了一种简化的处理方式,即人工加机器自动处理的方式:由人工翻译好文字,再由机器自动做替换工作。
    首先由人工翻译将简体中文的GBK编码汉字转换成繁体的Big5编码汉字,形成一个码表。由于汉字字符的字节特征,在两个连续的字节中最高位都大于1时,用这两个连续字节组合起来从码表查找,进行对照翻译。这个查找和翻译的工作在前端的Web服务器上动态完成,自动将后端输出的简体中文转换成繁体中文,这样服务端就不用考虑简体繁体的问题了。
    这个原理比较简单,实现起来也比较容易,但是也有一些缺点:

  • 有一些词组翻译不好,例如繁体中的“皇后”不应该翻译成“皇後”;
  • 这种办法很难解决跨语言问题,例如很难用这个办法翻译英文,涉及句子时更难翻译。

所以如果有跨语言这种情况,还是要结合人工翻译成原始页面模板的方式才比较可靠。

繁简转换的实现方式。相关推荐

  1. SEO批量文章繁简转换,同义词替换

    网站建设如何批量将繁体字转成简体字,繁简互转的方式很多,怎么将多篇繁体字文章转化为对应的简体字文章?SEO内容处理工具可以对在线或本地Word.Excel.TXT.HTML等繁体文章批量转化为简体文章 ...

  2. java 中文分词转拼音_pyhanlp 繁简转换之拼音转换与字符正则化

    繁简转换 HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合.这里我们不再做过多描述. ·说明 · Han ...

  3. Android多语言支持以及繁简转换

    Android多语言支持以及繁简转换 Android自身就带有多语言支持.前一段时间需要做一个同时支持繁简体的APP,经过简单的搜索和探索,轻松解决了问题.并且写了一个简单的繁体到简单的转换类.分享给 ...

  4. pyhanlp 繁简转换之拼音转换与字符正则化

    繁简转换 HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合.这里我们不再做过多描述. ·说明 · Han ...

  5. 繁简转换OpenCC,autogb 和 autob5,iconv,python的jianfan包

    OpenCC OpenCC 是跨平台.多语言的开放中文转换库,除了基本的简繁转换功能外,用户还可以选择对不同用词习惯和异体字的处理方式. OpenCC 还提供方便的网页转换界面. OpenOffice ...

  6. linux给文本繁简转换,linux - 安装OpenCC(简体繁体转换)

    最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...

  7. 程序员的用户界面设计手册1-9章(作者: Joel Spolsky 译: 梅普华 MSWord繁简转换)

    程序员的用户界面设计手册1-9章(作者: Joel Spolsky 译: 梅普华 MSWord繁简转换) http://chinesetrad.joelonsoftware.com/uibook/ch ...

  8. 用ASP实现简单的繁简转换

    用ASP实现简单的繁简转换 国际化似乎是一个很流行的口号了,一个站点没有英文版至少也要弄个繁体版,毕竟都是汉字,翻译起来不会那么麻烦:P 一般的繁简转换是使用字典,通过GB的内码算出BIG5字符在字典 ...

  9. linux 繁体中文转为简体,中文繁简转换及其转换工具.pdf

    ·计算机教育·· 本栏目贲任编辑:主力 中文繁简转换及其转换工具 冯 霞 (北京师范大学中文信息处理研究所,北京100875) 摘要:简体中文和繁体中文是现代汉语并存的两种书面形式.它们在语音.词汇. ...

最新文章

  1. 利用钥匙串,在应用里保存用户密码的方法
  2. 简单三步搭建一对一直播源码系统
  3. 《极速切水果游戏》有Python版了,曾风靡一时的手游能否富过“二代”?
  4. c#結合正則表達式驗證輸入的字符串
  5. loj#2143. 「SHOI2017」组合数问题
  6. 【STL学习】优先级队列Priority Queue详解与C++编程实现
  7. redis-启动服务端-客户端连接服务端
  8. SAP的十年豪赌:不成HANA 便成仁
  9. 实战分享声卡效果调试都用那些效果器插件
  10. iOS录音方法实用详解(配Demo下载)
  11. XPS Viewer 无法设置权限账户 - 无法激活此计算机上的任何权限管理账户
  12. java解析json字符串数据
  13. 英语知识点整理day03
  14. 安卓第十二天笔记-广播
  15. Android 源代码分享
  16. 抖音数据 - 网民评论数据采集,分析
  17. 解决无线路由器wds桥接频繁掉线的办法
  18. MAC OS下免费下载YouTube
  19. 只有失去的时候,才知道它的珍贵,QQ成为不明真相的群众发泄怒火的最大牺牲品...
  20. ps中解决标点符号在行开头的问题

热门文章

  1. python pandas 去重
  2. 【硬件调试-2】flir灰点相机usb设备权限设置,无法检测到设备
  3. blogs博客系统项目介绍
  4. Latex术语表加边框
  5. this application requires.net framework4.0,please install the.net framework then run this installer
  6. iOS系统中判断设备类型
  7. openfeign调用excel导出接口
  8. 打开印能捷服务器怎么修改ip,印能捷服务器主机
  9. Zxing生成二维码(可带图标)
  10. 下载****Hash校验和不符失败