关于各大输入法词库格式之间的转换
今天想把自己手机里面的词库导入到电脑里面,因为自己手机的输入法是百度输入法,然后电脑配置比较低,就用了QQ输入法纯净版,然后遇到了不同输入法词库格式不是一样的,也就导致了不兼容。在网上找了一圈,发现一款很好用的软件。贴出软件作者的博客:http://www.cnblogs.com/studyzy/archive/2013/01/10/2855403.html。
在手机导出的文本文件,其格式是“ 曾经(ceng|jing) 55000”,而QQ输入法的格式则是“ceng'jing 曾经 55000”,我们会发现,编码和汉字的顺序不同,然后每个编码之间的分隔符也是不同。这是我们就需要使用这款软件进行相应的转换。针对大部分主流的输入法都已经覆盖,所以只需要一键转换就好。如下图
只需要导入你所想要转换的词库文本,然后选择好原文件的输入法选项,选择好目标文件的输入法选项,点击右边的转换按钮便好。
支持转换文件文本另存为等操作。
今天我们要用的工作,常规的转换不能转换,会提示输入格式不对。然后我们对源文件进行相应的处理。
“ 曾经(ceng|jing) 55000”--->>>“ceng'jing 曾经 55000”
从上一行我们可以看到,对比两者的差别,
1、汉字和编码的顺序不对
2、编码括号问题
3、编码每个字的间隔符不同
我们的软件的自定义可以完成哪些工作呢?我们看一下
选择自定义选项
弹出自定义词库编码,选择匹配规则
我们会发现,自定义功能能够帮助我们
1、选择我们的源文件是不是都有编码、词频、拼音编码,如果没有的话,可以勾掉相应项;
2、每个编码之间的分隔符,也可以选择相应的分隔符;
3、编码汉字词频之间的分隔符
4、可以调整词条排序
5、可以选择词库格式;
知道软件自定义可以做的工作后,我们可以发现,我们的源文件有括号无法通过自定义除去。所以我们要通过自己先把括号除去
打开词库---》》》
使用替换功能,查找内容填写“(”,替换为“ ”(空格)
查找内容填写“)”,替换为“”(不填)
变成下图的格式
处理到这里就符合软件转换的需求了
我们把文件导入到软件中,选好自定义格式
点击转换按钮
此时转换就完成了,弹窗提示是否导出词库到本地硬盘,选择是。
此时就完成了文件格式的转换。
再导入到相应的输入法就可以了。
以上。
参考: 作者博客:http://www.cnblogs.com/studyzy/archive/2013/01/10/2855403.html
知乎留雁:http://www.zhihu.com/question/23210271
关于各大输入法词库格式之间的转换相关推荐
- 解决搜狗输入法 windows广告弹窗问题macOS系统cleanMyMac提示威胁输入法词库迁移问题
不黑不吹,笔者算是搜狗输入法的忠实粉丝,有三十多万的词库和百万以上的输入字数,但是近两年,发现搜狗做的比较过分了,windows弹窗广告巨多,小弹窗通过baidu查方法隐藏了,但是大弹窗广告一直没有办 ...
- Linux下ibus输入法词库扩展
文章目录 一.骡子 二.直接上教程 三.目前支持的词汇(如果你找到了比较全的词库,希望能够得到你的分享) 四.补充:自己添加词库 Linux下ibus输入法词库扩展 一.骡子 面向百度编程已经给出了很 ...
- bat 等待输入_深蓝词库转换 - 简单的输入法词库转换工具
深蓝词库转换 是一款 输入法词库转换 软件,支持包括 搜狗拼音.QQ拼音.Windows 10 微软拼音 在内的超过 20 种的输入法工具和词库.该程序支持 批量转换(一次拖拽多个词库文件,或者按住 ...
- 搜狗拼音输入法词库是怎样炼成的
搜狗输入法小组词库开发工程师 吕杰勇 转载此文请注明来自搜狗输入法官方博客,务必保留原始链接:http://pinyin.blog.sohu.com/41063494.html 众所周知,搜狗输入法在 ...
- 搜狗细胞词库-fcitxibus拼音输入法词库
http://code.google.com/p/hslinuxextra/downloads/list 上面的地址中,增加了三个词库文件和工程的源代码,有兴趣的同学可以自己去搞搞. 三个词库文件分别 ...
- MiniGUI输入法词库更新
前言 MiniGUI中的输入法libmgi支持拼音输入,但是怎么进行个性化定制呢,比如想更换键盘皮肤,往词库里添加一些新的词组,下面这篇文章详细描述怎么添加新词 1. 词库文件构成 在libmgi中, ...
- 证书格式简介及不同格式之间的转换方式
1.证书格式 PEM 格式 PEM格式通常用于数字证书认证机构(Certificate Authorities,CA),扩展名为.pem, .crt, .cer, and .key.内容为Base64 ...
- 3.13. Notepad++中Windows,Unix,Mac三种格式之间的转换
由于历史原因,导致Windows,Unix/Linux,Mac三者之间,对于文件中所用回车换行符,表示的方法,都不一样. 这就导致了很多人都会遇到回车换行符的困惑,和需要在不同格式间进行转换. 其中, ...
- Win10自带输入法词库的导入导出以及其他设置
Win10自带输入法的设置页面比较隐蔽,而且搜不到"微软拼音"这项设置. 设置方法如下: 即可找到输入法的设置.
最新文章
- html5之通讯API
- c语言二叉树最小值,C语言递归之二叉树的最小深度
- Python数据结构——tuple
- html的input的id,请求[“inputId”]不能在cshtml上工作
- Java常用API(六)Date 日期类介绍及使用
- Spring Boot + JPA +MySQL 数据操作及示例环境搭建(自动建表)
- 房友系统服务器地址,房友系统的那些功能,你都知道吗?
- 微信小程序开发系列 (三) :微信小程序如何响应用户点击事件和微信平台 API 的使用方法介绍
- CCFCSP非零段划分
- vite.config 配置文件
- Data Structure - Doubly Linked List (Java)
- 企鹅CMS开源影视系统
- 360周鸿祎:互联网好产品六字法则——刚需、痛点、高频
- java编写小游戏大球吃小球
- 关于python使用pandas导入dat数据文件的方法(可导入任意dat数据文件和csv数据文件)
- android平板2018,2018 Android平板电脑推荐三星或华为更好
- gyp ERR! stack Error: EACCES: permission denied, mkdir
- FZU-1892(bfs)接水管游戏
- Android的显示色彩位数
- kali双系统安装(超详细)