最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了。这时候就知道OpenCC的强大了。哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编译opencc时遇到了各种错误。花费了很长时间,终于安装成功,但是文本处理起来效率很低。最终选择了直接在linux下安装OpenCC,处理的效率着实安慰了我受伤的心 -- 很快,特别快。

好啦,接下来总结下OpenCC的安装方法,万一以后又用到它了呢?主要参考这篇博客:

检查下linux环境下是否已经安装cmake以及git,如果没有,那就通过yum安装好。

$ yum install cmake

$ yum install git

克隆下OpennCC开源项目OpennCC开源项目。

$ git clone https://github.com/BYVoid/OpenCC

编译OpenCC

$ cd OpenCC

$ make

$ make install

创建libopencc.so.2链接

如果不知道libopencc.so.2的路径,可以通过find / -name libopencc.so.2查找。

$ ln -s /usr/lib/libopencc.so.2 /usr/lib64/libopencc.so.2

通过查看 OpenCC 版本,检查OpenCC是否已经安装成功

$ opencc --version

测试用例

# 繁体转简体

$ echo '歐幾里得 西元前三世紀的希臘數學家' | opencc -c t2s

欧几里得 西元前三世纪的希腊数学家

# 简体转繁体

$ echo '欧几里得 西元前三世纪的希腊数学家' | opencc -c s2t

歐幾里得 西元前三世紀的希臘數學家

# 可以通过以下方式直接对文件进行繁简转换

$ opencc -i zhwiki_raw.txt -o zhwiki_t2s.txt -c t2s.json

opencc在linux环境中,linux - 安装OpenCC(简体繁体转换)相关推荐

  1. opencc在linux环境中,linux – 安装OpenCC(简体繁体转换)

    依赖:yum install doxygen 最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用pyt ...

  2. opencc在linux环境中,android-opencc,中文简繁转换项目OpenCC的安卓版

    android-opencc,中文简繁转换项目OpenCC的安卓版 发布时间:2016-05-12 11:59:43来源:红联作者:baihuo android-opencc基于OpenCC的源代码, ...

  3. linux命令界面下载kettle,kettle在linux环境中打开图形界面-Go语言中文社区

    kettle在linux环境中打开图形界面 kettle数据转换的时候需要图形界面 当运行./spoon.sh时,如果没有图形界面,会出现下面的结果 ./spoon.sh [root@localhos ...

  4. Linux环境中Visual Studio Code 安装配置及其卸载(详细教程)

    两篇相关博文: 在VMware15中创建虚拟机安装ubuntu系统(超详细教程) Linux环境编译运行C/C++语言程序----配置gcc.g++(详细教程) 此篇分享我在linux环境下安装VS ...

  5. linux环境中nagios(nagios core)安装?nagios安装?

    linux环境中nagios(nagios core)安装?nagios安装? 需求描述: 最近准备给线上生产环境部署监控平台,对各个系统的资源使用情况,服务进行监控,采用nagios core版本进 ...

  6. 在linux环境中安装jieba模块

    最近在linux环境中发布python脚本的时候,发现环境中的jieba模块不存在. 这时候为了在linux环境中安装jieba模块,先下载压缩包:jieba-0.39.zip 1.本地解压后得到以下 ...

  7. python27怎么安装thrift解压包_Python在Linux环境中安装Thrift

    1.文件下载:thrift-0.11.0.tar.gz 个人网盘下载:链接:https://pan.baidu.com/s/1MXgx8LuN4wk7ssVUD9Wzaw  提取码:xw85 2. 将 ...

  8. Linux环境中安装c编译器并测试

    安装c编译器在Linux环境中 以下基于centos7系统 首先安装编译代码所需的包 1.yum -y install make gcc-c++ cmake bison-devel ncurses-d ...

  9. Linux环境中Visual Studio Code的配置使用----编译运行C/C++(良心教程)

    之前的博文分享了下载安装[VS code]的详细教程, 有需要速戳–>Linux环境中Visual Studio Code 安装配置及其卸载(详细教程) 本篇博文分享本人初次使用[VS code ...

最新文章

  1. Spring Boot导出jar包发布
  2. 1.7 截取(提取)子字符串(substring())
  3. mysql 5.5 压力测试,mysql 压力测试
  4. Matlab xlim ylim zlim函数
  5. 首批共享单车死于2019
  6. android textview doubleclick,Android的TextView的双击事件监听
  7. 程序员如何搞定前端高频面试难题?附答案汇总 | 技术头条
  8. 二项分布的期望方差证明
  9. Coursera ML 逻辑回归与正则化
  10. [C#] readonly vs const
  11. java中普通变量、静态变量、静态代码块初始化的顺序辨析
  12. 网络安全05_VMware 虚拟机软件安装_准备Kali- Linux虚拟机_Windows Server 2003 Enterprise 虚拟机下载和安装
  13. 【转】书上的字快速弄到电脑上
  14. 鼎捷易飞ERP视频教程-金速鹏-专题视频课程
  15. 激光雷达的障碍物检测
  16. thinkpad重装系统不引导_thinkpad系统重装教程
  17. 过滤百度广告+搜索热点+adblock规则快速入门
  18. 【IOS自动化解放双手系列一】unity3D导出xcode 工程并配置各种权限
  19. 教师资格证面试 计算机应用,2019下半年初中信息技术教师资格证面试真题及答案汇总...
  20. Linux下Firefox中配置Jre

热门文章

  1. iOS语音消息功能实现,录音/播放录音
  2. c++ 内存映射文件进程间共享数据
  3. EF框架-SQL语句 查询与修改
  4. java解压zip文件
  5. TF/SF源TM波在UPML条件下的2D-FDTD中的圆柱散射(一)
  6. 我的世界java无限水_我的世界:一桶水=无限水?老MC才会的5种玩法,看看你做过几个?...
  7. mysql limit 动态参数_MySQL中limit使用动态参数的解决方法(拼接SQL字符串语句来执行SQL)...
  8. 新乡学院计算机实验室,公共计算机实验室简介
  9. Delphi例程-文件管理例程
  10. 新传工作运用计算机吗,广播电视中计算机技术的运用