依赖:yum install doxygen

最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了。这时候就知道OpenCC的强大了。哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编译opencc时遇到了各种错误。花费了很长时间,终于安装成功,但是文本处理起来效率很低。最终选择了直接在linux下安装OpenCC,处理的效率着实安慰了我受伤的心 — 很快,特别快。

好啦,接下来总结下OpenCC的安装方法,万一以后又用到它了呢?主要参考这篇博客:

检查下linux环境下是否已经安装cmake以及git,如果没有,那就通过yum安装好。

$ yum install cmake

$ yum install git

克隆下OpennCC开源项目OpennCC开源项目。

$ git clone https://github.com/BYVoid/OpenCC

编译OpenCC

$ cd OpenCC

$ make

$ make install

创建libopencc.so.2链接

如果不知道libopencc.so.2的路径,可以通过find / -name libopencc.so.2查找。

$ ln -s /usr/lib/libopencc.so.2 /usr/lib64/libopencc.so.2

通过查看 OpenCC 版本,检查OpenCC是否已经安装成功

$ opencc –version

测试用例

繁体转简体

$ echo ‘歐幾里得 西元前三世紀的希臘數學家’ | opencc -c t2s

欧几里得 西元前三世纪的希腊数学家

简体转繁体

$ echo ‘欧几里得 西元前三世纪的希腊数学家’ | opencc -c s2t

歐幾里得 西元前三世紀的希臘數學家

可以通过以下方式直接对文件进行繁简转换

$ opencc -i zhwiki_raw.txt -o zhwiki_t2s.txt -c t2s.json

作者:xiao蜗牛

链接:https://segmentfault.com/a/1190000010122544

来源:SegmentFault 思否

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

喜欢 (2)or分享 (0)

opencc在linux环境中,linux – 安装OpenCC(简体繁体转换)相关推荐

  1. opencc在linux环境中,linux - 安装OpenCC(简体繁体转换)

    最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...

  2. opencc在linux环境中,android-opencc,中文简繁转换项目OpenCC的安卓版

    android-opencc,中文简繁转换项目OpenCC的安卓版 发布时间:2016-05-12 11:59:43来源:红联作者:baihuo android-opencc基于OpenCC的源代码, ...

  3. linux命令界面下载kettle,kettle在linux环境中打开图形界面-Go语言中文社区

    kettle在linux环境中打开图形界面 kettle数据转换的时候需要图形界面 当运行./spoon.sh时,如果没有图形界面,会出现下面的结果 ./spoon.sh [root@localhos ...

  4. Linux环境中Visual Studio Code 安装配置及其卸载(详细教程)

    两篇相关博文: 在VMware15中创建虚拟机安装ubuntu系统(超详细教程) Linux环境编译运行C/C++语言程序----配置gcc.g++(详细教程) 此篇分享我在linux环境下安装VS ...

  5. linux环境中nagios(nagios core)安装?nagios安装?

    linux环境中nagios(nagios core)安装?nagios安装? 需求描述: 最近准备给线上生产环境部署监控平台,对各个系统的资源使用情况,服务进行监控,采用nagios core版本进 ...

  6. 在linux环境中安装jieba模块

    最近在linux环境中发布python脚本的时候,发现环境中的jieba模块不存在. 这时候为了在linux环境中安装jieba模块,先下载压缩包:jieba-0.39.zip 1.本地解压后得到以下 ...

  7. python27怎么安装thrift解压包_Python在Linux环境中安装Thrift

    1.文件下载:thrift-0.11.0.tar.gz 个人网盘下载:链接:https://pan.baidu.com/s/1MXgx8LuN4wk7ssVUD9Wzaw  提取码:xw85 2. 将 ...

  8. Linux环境中安装c编译器并测试

    安装c编译器在Linux环境中 以下基于centos7系统 首先安装编译代码所需的包 1.yum -y install make gcc-c++ cmake bison-devel ncurses-d ...

  9. Linux环境中Visual Studio Code的配置使用----编译运行C/C++(良心教程)

    之前的博文分享了下载安装[VS code]的详细教程, 有需要速戳–>Linux环境中Visual Studio Code 安装配置及其卸载(详细教程) 本篇博文分享本人初次使用[VS code ...

最新文章

  1. springboot打Jar包和War包
  2. mongodb一致性协议_mongo的怎么保持事物的一致性-问答-阿里云开发者社区-阿里云...
  3. 判断一个字符串是否另一个字符串的右移后的
  4. 三星:Android之外,技术为王
  5. 【剑指offer】面试题24:反转链表(Java 实现)
  6. springmvc 传对象报400_springmvc 通过对象来接收参数,为什么默认会返回该对象?
  7. TF-tf.keras.layers.Dense
  8. mysql查询每个表占用空间,【MySQL】查询所有数据库占用磁盘空间大小和单个库中所有表的大小...
  9. Ubuntu 16.04重启Nautilus
  10. Atitit 图像资料文档分类器 netpic image 网络图片与人像图片分类 微信图片分类 D:\0workspace\atiplat_img\src\com\attilax\img\ut
  11. Ceph添加、删除osd及故障硬盘更换
  12. linux下海康威视MVS以及库的安装
  13. 挣值最常用的计算公式
  14. 修复移动硬盘坏道计算机睡眠了,硬盘坏道屏蔽工具DiskGenius,教您如何修复硬盘坏道...
  15. 如何进入bios设置U盘启动的教程,如何在bios设置u盘启动项
  16. JAVA把日期转换为年月日_在Java中将每年的日期转换为每月的日期
  17. 在 HBuilder X 创建Uni-app项目运行时报错
  18. 服务器上传excel文件并读取数据,asp.net上传Excel文件并读取数据的实现方法
  19. 射频卡读写原理及实现
  20. 如何提取视频中的音频,这个方法真的很简单

热门文章

  1. 2021年年终总结 2022年计划
  2. 共享内存实现进程间大数据的交换
  3. Vue3 服务端渲染
  4. Excel公式的常见应用(一)——动态图表
  5. virtualbox的下载和安装详细过程
  6. js 数组 删除数组中指定下标返回新数组
  7. 关于乐优商城登录后不显示用户名的解决方式
  8. Python中map函数以及输出其返回的值
  9. mybatis入门例子
  10. C++Easyx教程(一)——如何在DEV-C++里安装Easyx库