From: http://xbeta.info/gvim-unicode.htm

一、两项要点

gvim处理多国文字(unicode)有两项要点:一是编码环境:set enc=utf-8;二是正确的字体,比如要正确显示韩文可选择GulimChe、DotumChe字体。

上图中9-12行字符未能正常显示(同样的字体,notepad可以正确显示更多)。对应的设定为:
set lm=none
set enc=utf-8
let $LANG=’en’
set ambiwidth=double
set guifont=DotumChe:h12:cANSI

二、备注

0.
多数情况下,我用gvim处理中文,因此,默认enc是prc而非utf-8。临时有需要往往改enc,相对不太关注fenc。[参见]

1.测试文本

日语(にほんご、にっぽんご)朝鲜语(조선어)或称韩国语(한국어)
代码 字符标准名称 显示
A 大写拉丁字母”A” A
ß 小写拉丁字母”Sharp S” ß
þ 小写拉丁字母”Thorn” þ
Δ 大写希腊字母”Delta” Δ
Й 大写斯拉夫字母”Short I” Й
ק 希伯来字母”Qof” ק
م 阿拉伯字母 “Meem” م
๗ 泰文数字 7 ๗
ቐ 埃塞俄比亚音节文字”Qha” ቐ
あ 日语平假名 “A” あ
ア 日语片假名 “A” ア
叶 简体汉字 “叶” 叶
葉 正体汉字 “葉” 葉
엽 韩国音节文字 “Yeob” 엽

2.
中文简体Win XP下,不设定encoding时,相当于cp936: simplified Chinese (Windows only),支持别名prc, chinese。也就是说,中文简体Win XP下,不设定enc与
se enc=prc
se enc=cp936
se enc=chinese
是等同的。

3.
此环境下,保存txt相当于notepad.exe的ansi。

4.
enc=prc下,处理unicode字符能力当然比较弱:默认开一个新文件复制韩文过来,它根本不认识;打开一个utf-8编码多语言的文件,也可能转换出错。

5.
所以,处理unicode字符时,一定要(临时)设为enc=utf-8

6.
直接切换到enc=utf-8,GVIM界面会显示乱码,韩文仍无法显示。前者是GVIM调用资源的问题,后者是当前字体不支持韩文(多数中文字体都支持日文)。
这时,虽显示异常,但不影响实际使用。比如,你仍可以复制/粘贴。

7.
如果看起来不舒服,则可以更改显示字体为韩文(代价是中文丑陋)。
se guifont=* 选择 GulimChe或DotumChe,字符集选韩文(不选似乎也可以)。

8.
曾有一段时间,我倾向于选择utf-8,让它成为gvim的enc、文本文件的保存格式、html的编码格式。
但这种“高”标准化对其他程序并不友好。比如:TC中ctrl+q或F3显示txt文件,进行文件内容比较。另外,对中文而言utf-8编码体积是原默认编码的1.5倍,如果是一篇长网页,差异还是难以忽视的。
因此,后来我又改回了ansi/gb-2312,除非遇到问题,才选择utf-8。

9.
对开发者或应用而言,应支持高标准;对用户或数据而言,采用低标准更为有利。此合于老子“知其雄,守其雌”之道。(完)

gvim同时处理中日韩文相关推荐

  1. 吴军:Google 中日韩文搜索算法的主要设计者,因《浪潮之巅》享誉业界 | CNCC 2018...

    雷锋网(公众号:雷锋网) AI 科技评论按:作为一位计算机科学家,吴军博士有两个最为人所知的身份,一是他是当前 Google 中日韩文搜索算法的主要设计者,曾一度为 Google 贡献了整个代码库 0 ...

  2. wxpython 如何在windows下同时显示unicode中日韩文

    周海汉 /文 2010.1.6 python版本,python 2.6+,wxpython 2.8+ 问题提出 遇到wxpython 如何在windows下同时显示中文日文韩文越南拼音的问题. win ...

  3. web项目-中日韩文通用UTF-8处理流程

    文档说明: 接了个韩国项目,预计整体使用UTF-8编码,从页面到数据库,应该能全部处理.(对应的韩文编码是euc-kr,应该相当于我们的gbk) 使用原来处理日文的时候的经验,发现很多郁闷的问题,中文 ...

  4. 利用iTextSharp填写中文(中日韩)PDF表单(完整解决方案)

    或者说中日韩文)表单填写的问题,本不想回答这类问题,因为相关的注意事项都已经在我的博客里说了,但现在看来还是有必要再啰唆下了,如果再有问题的话,希望带着Money来问,拜托了. 下面这段代码根据iTe ...

  5. php 正则表达式 匹配中日韩字符(GBK)

    转载链接:http://www.cnblogs.com/ITEagle/archive/2013/01/14/2859775.html 首先是这些非英文字符的编码范围: 这里是几个主要非英文语系字符范 ...

  6. 中日韩大字符集文字编码的比较研究

    http://www.yyxx.sdu.edu.cn/content/guojihuiyi/guojhy-yinbs.htm 中日韩大字符集文字编码的比较研究 尹宝生 潘峰 徐立军 年新 汤蓉 沈阳航 ...

  7. 中日韩统一表意文字(CJK Unified Ideographs)[转]

    中日韩统一表意文字 中日韩统一表意文字 中日韩统一表 意文字(英语:CJK Unified Ideographs),目的是要把分别来自中文.日文.韩文.越文中,本质相同.形状一样或稍异的表意文字(主要 ...

  8. Unicode中日韩统一表意文字列表

    今天连续转载了好多篇文章,上网发现了很多好文,呵呵!这不又有一个网站似乎是台湾的,"闲着没事"把中日韩所有Unicode字符表给张贴出来了,看着蛮长的其实还是很实用的呀,现在转载到 ...

  9. 中科罗伯特工业机器人_「聚焦中日韩产业博览会」丈夫看机器人,妻子忙采购...

    9月22日是第五届中日韩产业博览会的最后一天, 前来鲁台会展中心参观的市民依旧络绎不绝. 记者在一楼展厅看到, 各类机器人受到专业人员以及家长. 小朋友的追捧:二楼展厅内,美食. 美妆等充分满足市民的 ...

最新文章

  1. 基于Pyhton的图像隐写术--如何隐藏图像中的数据
  2. Python使用sklearn构建广义线性模型:gamma回归(Gamma regression)实战
  3. 将svn设置开机启动linux,ubuntu安装SVN并设置开机启动
  4. 倒计时2天,WebRTCon 2018有哪些有趣有料分享与活动?
  5. Docker最全教程——数据库容器化(十一)
  6. Could not link against boost_system 解决办法
  7. linux 反汇编目标文件,用于查看目标文件或可执行文件的组成信息的命令:objdump命令...
  8. 怎么快速搭建属于自己的博客
  9. SAP ALV 负号前置
  10. python学习笔记(52周存钱挑战)
  11. 按GB 11643标准对大陆身份证号码分析验证
  12. 计算机系学霸情书,大学生“学霸情书”火了,各专业表达浪漫!网友:教科书级别!...
  13. rm命令删除特定文件或目录或不删除特定文件或目录
  14. 第五章 系统方法---------基于业务驱动的企业安全架构(翻译,原作者John Sherwood)----仅学习使用
  15. 滑动验证码--前端部分
  16. UE4 自建基础玩家时重力的设置
  17. 实现字典树(前缀树、Trie树)并详解其应用
  18. 后端程序员学习前端篇(一)
  19. Day114.尚医通:用户认证、阿里云OSS、就诊人管理
  20. xshell工具将服务器文件下载到本地

热门文章

  1. 两块网卡实现多台机器共享上网
  2. Request 对象 错误 'ASP 0104 : 80004005' 解决方法
  3. MS SQL入门基础:系统数据库
  4. 北大青鸟c语言课后答案,北大青鸟C语言教程--第一章 C语言基础.ppt
  5. 虚拟dom添加虚拟dom_虚拟DOM缓慢。 认识记忆化的DOM
  6. Pycharm社区版配置Django
  7. 记一次Java AES 加解密 对应C# AES加解密 的一波三折
  8. Flask基础(03)--创建第一个Flask程序
  9. 设定Word段落的背景色
  10. 7.中文输入验证-原生JS