opencc在linux环境中,linux – 安装OpenCC(简体繁体转换)
依赖:yum install doxygen
最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了。这时候就知道OpenCC的强大了。哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编译opencc时遇到了各种错误。花费了很长时间,终于安装成功,但是文本处理起来效率很低。最终选择了直接在linux下安装OpenCC,处理的效率着实安慰了我受伤的心 — 很快,特别快。
好啦,接下来总结下OpenCC的安装方法,万一以后又用到它了呢?主要参考这篇博客:
检查下linux环境下是否已经安装cmake以及git,如果没有,那就通过yum安装好。
$ yum install cmake
$ yum install git
克隆下OpennCC开源项目OpennCC开源项目。
$ git clone https://github.com/BYVoid/OpenCC
编译OpenCC
$ cd OpenCC
$ make
$ make install
创建libopencc.so.2链接
如果不知道libopencc.so.2的路径,可以通过find / -name libopencc.so.2查找。
$ ln -s /usr/lib/libopencc.so.2 /usr/lib64/libopencc.so.2
通过查看 OpenCC 版本,检查OpenCC是否已经安装成功
$ opencc –version
测试用例
繁体转简体
$ echo ‘歐幾里得 西元前三世紀的希臘數學家’ | opencc -c t2s
欧几里得 西元前三世纪的希腊数学家
简体转繁体
$ echo ‘欧几里得 西元前三世纪的希腊数学家’ | opencc -c s2t
歐幾里得 西元前三世紀的希臘數學家
可以通过以下方式直接对文件进行繁简转换
$ opencc -i zhwiki_raw.txt -o zhwiki_t2s.txt -c t2s.json
作者:xiao蜗牛
链接:https://segmentfault.com/a/1190000010122544
来源:SegmentFault 思否
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
喜欢 (2)or分享 (0)
opencc在linux环境中,linux – 安装OpenCC(简体繁体转换)相关推荐
- opencc在linux环境中,linux - 安装OpenCC(简体繁体转换)
最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...
- opencc在linux环境中,android-opencc,中文简繁转换项目OpenCC的安卓版
android-opencc,中文简繁转换项目OpenCC的安卓版 发布时间:2016-05-12 11:59:43来源:红联作者:baihuo android-opencc基于OpenCC的源代码, ...
- linux命令界面下载kettle,kettle在linux环境中打开图形界面-Go语言中文社区
kettle在linux环境中打开图形界面 kettle数据转换的时候需要图形界面 当运行./spoon.sh时,如果没有图形界面,会出现下面的结果 ./spoon.sh [root@localhos ...
- Linux环境中Visual Studio Code 安装配置及其卸载(详细教程)
两篇相关博文: 在VMware15中创建虚拟机安装ubuntu系统(超详细教程) Linux环境编译运行C/C++语言程序----配置gcc.g++(详细教程) 此篇分享我在linux环境下安装VS ...
- linux环境中nagios(nagios core)安装?nagios安装?
linux环境中nagios(nagios core)安装?nagios安装? 需求描述: 最近准备给线上生产环境部署监控平台,对各个系统的资源使用情况,服务进行监控,采用nagios core版本进 ...
- 在linux环境中安装jieba模块
最近在linux环境中发布python脚本的时候,发现环境中的jieba模块不存在. 这时候为了在linux环境中安装jieba模块,先下载压缩包:jieba-0.39.zip 1.本地解压后得到以下 ...
- python27怎么安装thrift解压包_Python在Linux环境中安装Thrift
1.文件下载:thrift-0.11.0.tar.gz 个人网盘下载:链接:https://pan.baidu.com/s/1MXgx8LuN4wk7ssVUD9Wzaw 提取码:xw85 2. 将 ...
- Linux环境中安装c编译器并测试
安装c编译器在Linux环境中 以下基于centos7系统 首先安装编译代码所需的包 1.yum -y install make gcc-c++ cmake bison-devel ncurses-d ...
- Linux环境中Visual Studio Code的配置使用----编译运行C/C++(良心教程)
之前的博文分享了下载安装[VS code]的详细教程, 有需要速戳–>Linux环境中Visual Studio Code 安装配置及其卸载(详细教程) 本篇博文分享本人初次使用[VS code ...
最新文章
- springboot打Jar包和War包
- mongodb一致性协议_mongo的怎么保持事物的一致性-问答-阿里云开发者社区-阿里云...
- 判断一个字符串是否另一个字符串的右移后的
- 三星:Android之外,技术为王
- 【剑指offer】面试题24:反转链表(Java 实现)
- springmvc 传对象报400_springmvc 通过对象来接收参数,为什么默认会返回该对象?
- TF-tf.keras.layers.Dense
- mysql查询每个表占用空间,【MySQL】查询所有数据库占用磁盘空间大小和单个库中所有表的大小...
- Ubuntu 16.04重启Nautilus
- Atitit 图像资料文档分类器 netpic image 网络图片与人像图片分类 微信图片分类 D:\0workspace\atiplat_img\src\com\attilax\img\ut
- Ceph添加、删除osd及故障硬盘更换
- linux下海康威视MVS以及库的安装
- 挣值最常用的计算公式
- 修复移动硬盘坏道计算机睡眠了,硬盘坏道屏蔽工具DiskGenius,教您如何修复硬盘坏道...
- 如何进入bios设置U盘启动的教程,如何在bios设置u盘启动项
- JAVA把日期转换为年月日_在Java中将每年的日期转换为每月的日期
- 在 HBuilder X 创建Uni-app项目运行时报错
- 服务器上传excel文件并读取数据,asp.net上传Excel文件并读取数据的实现方法
- 射频卡读写原理及实现
- 如何提取视频中的音频,这个方法真的很简单