由于项目需求,要将繁体字转成简体字。网上一直没有头绪,有些说用opencc-python,有些则说用OpenCC。我也找了很久,最后才实现,这里记录一下。

输入图片说明

OpenCC的github地址在这里

根据说明,先将OpenCC项目git clone下来,然后cd进入OpenCC项目目录内,进行编译

make PREFIX=/usr/local
sudo make PREFIX=/usr/local install

如果编译过程当中报错,就应该是gcc-c++之类的问题,通过mac的brew来安装gcc或者其他环境即可。

centos则通过yum install gcc-c++和yum install opencc来解决

brew install gcc

代码实现

当时在python虚拟环境安装了opencc和opencc-python

然后实际的代码是:

import opencccc = opencc.OpenCC('t2s')
print(cc.convert('Open Chinese Convert(OpenCC)「開放中文轉換」,是一個致力於中文簡繁轉換的項目,提供高質量詞庫和函數庫(libopencc)。'))

其中的t2s来自于不同作用的json包

输入图片说明

也就是说代表了不同的字体转换方式和结果
最后,上面的代码输出结果为:

Open Chinese Convert(OpenCC)「开放中文转换」,是一个致力于中文简繁转换的项目,提供高质量词库和函数库(libopencc)。

这算是质量很高的转换结果了。

MacOSX安装OpenCC实现繁体字转简体字相关推荐

  1. 【Python】用OpenCC将繁体字转为简体字

    官方GitHub:BYVoid/OpenCC 相关文章:python实现中文的繁简转换 一.安装 pip install opencc-python-reimplemented 二.使用 1. 繁体字 ...

  2. linux 繁体中文转为简体,linux - 安装OpenCC(简体繁体转换)

    最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...

  3. python-10-爬虫selenium繁体字转换为简体字和NCR字符处理

    1 将NCR字符转换成真实字符 以 &# 或 &#x 开头的字符串叫做 NCR 字符,在浏览器中查看会直接转换成中文. 一个Numeric Character Reference编码是 ...

  4. linux给文本繁简转换,linux - 安装OpenCC(简体繁体转换)

    最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...

  5. opencc在linux环境中,linux - 安装OpenCC(简体繁体转换)

    最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用python里面的opencc模块的,但是在安装,编 ...

  6. opencc在linux环境中,linux – 安装OpenCC(简体繁体转换)

    依赖:yum install doxygen 最近使用中文维基百科数据训练Word2Vec时,发现数据里面包含了很多繁体字,这就很尴尬了.这时候就知道OpenCC的强大了.哈哈,本来打算直接使用pyt ...

  7. 基于Windows安装langconv实现繁体和简体字的转换

    基于Windows安装langconv实现繁体和简体字的转换 在学习自然语言处理的时候,大家可能已经发现有些中文数据集是繁体字,那么当我们的任务需求是输出简体字时就需要对原始中文数据集进行字体转换,达 ...

  8. 学点实用工作小技巧【Python】汉字转拼音、繁体字和简体字互转、提取字符串中的中文(英文)、判断是否纯中文(英文)

    大家早上好,本人姓吴,如果觉得文章写得还行的话也可以叫我吴老师.欢迎大家跟我一起走进数据分析的世界,一起学习! 感兴趣的朋友可以关注我或者我的数据分析专栏,里面有许多优质的文章跟大家分享哦. 前言 又 ...

  9. 裴钰:从17个角度看汉字繁体字和简体字之争

    17个角度,看汉字繁体字和简体字之争 作者:裴钰 近期,部分学者.文化人士陆续提出要废除简体字,全面恢复繁体字,同时,还有一部分学者主张要继续汉字的简化,不必恢复 繁体字,"繁简汉字&quo ...

最新文章

  1. 水晶报表左侧树不显示属性设置
  2. MySql General error:2006
  3. 程序员 - 爱的表白
  4. 李开复:AlphaGo 若打败了世界冠军,意味着什么?
  5. javaone_代理的JavaOne 2014观察
  6. 网站运营需要注意什么?
  7. CCNA初认识——ACL命令
  8. oracle rac openstack,利用 Chef 实现 OpenStack 块存储多节点的自动化部署
  9. 考虑云计算来降成本:良药或毒药?
  10. 10个最新优秀手机应用界面设计实例
  11. 基于visual Studio2013解决C语言竞赛题之0405阶乘求和
  12. SPI驱动之南瑞NRSEC3000加密芯片驱动开发总结
  13. JS文本中间显示省略号
  14. 关闭防火墙步骤(详细)
  15. Android 9.0 flash播放器播放swf源码讲解
  16. python爬取股票数据,以上证指数为例,可以爬取任何股票,保存为temp.csv文件
  17. 各种品牌的PLC协议转换网关介绍
  18. Pytorch中的DDP
  19. GC8871一款带内部电流感测功能的刷式直流电机驱动芯片(可替代DRV8871)
  20. 【盘点】值得推荐的优质文章!

热门文章

  1. 为什么写技术博客对新人如此重要
  2. app调起支付宝-后端预支付
  3. 人工智能 —— 语义网络推理
  4. 3种方式获取Wifi名称 兼容获取Wifi名字为空 WifiInfo.getSSID为空的情况
  5. 付出不亚于任何人的努力
  6. iTween之iTweenPath的使用
  7. Cat4模块SIM7600CE介绍
  8. 美国计算机研究生最好的大学排名,美国大学计算机信息系统专业研究生排名
  9. 前端批量生成二维码并打包下载
  10. python中时间模块datetime总结