opencc-python使用

需求:有个7G的语料库,希望将其中的繁体字转换为简体;
思路:采用opencc进行逐行转换;
坑来了:
1、opencc-python模块安装:
安装存在各种问题,放弃了使用pip方式的安装;在其官网找了个exe安装包(我的环境是windows),直接傻瓜安装,成功!
2、运行:
应用opencc模块时候会报version错误,根据提示找到相应的代码,直接删除——解决了问题,至此可以正常运行;
3、放弃:
代码段——
import opencc
cc = opencc.OpenCC(‘t2s‘)
print cc.convert(‘高質量詞‘)
结果是正常转换为简体字,欣喜若狂,开始解决我的需求吧~~~~~~~~
这是咋了,程序半天没有输出???代码写错了?死循环了????
…磨叽半天…
原来是每句话的长度较长,导致转换太慢了,这样操作还是应用在逐个单词的转换,词汇量比较少的场景比较合适啊,像这种上亿条数据还是等不起,所以,你懂的,放弃了…
<如若小伙伴有较好的推荐,记得留言哦,3Q!>

opencc-python使用相关推荐

  1. 【Python】用OpenCC将繁体字转为简体字

    官方GitHub:BYVoid/OpenCC 相关文章:python实现中文的繁简转换 一.安装 pip install opencc-python-reimplemented 二.使用 1. 繁体字 ...

  2. 繁简转换OpenCC,autogb 和 autob5,iconv,python的jianfan包

    OpenCC OpenCC 是跨平台.多语言的开放中文转换库,除了基本的简繁转换功能外,用户还可以选择对不同用词习惯和异体字的处理方式. OpenCC 还提供方便的网页转换界面. OpenOffice ...

  3. opencc解决简体中文与繁体中文转换问题【python】

    1.Opencc-python 今天学习文本分析中偶然想到繁体中文要如何分割的问题,于是联想到将繁体中文先转换为简体中文,查过网上的资料后发现比较好用的是opencc-python,以及下载zh_wi ...

  4. 【Python】opencc库简单使用

    opencc库用于转换中文到繁体等. 注明: """ s2t.json简体中文到繁体中文 简体到繁体 t2s.json繁体中文转简体中文 繁体到简体 s2tw.json简 ...

  5. windows python opencc使用方法

    windows环境下python使用pip直接安装opencc是不行的,会直接报错无法安装. 正确安装步骤是: 1. 首先下载opencc的文件包,将其解压到电脑上某个位置: 2. 将opencc的b ...

  6. python安装opencc包失败

    安装 正常安装出错,然后参考这里:https://www.jianshu.com/p/a2a81c201a3f pip install opencc-python-reimplemented 亲测有效 ...

  7. Python使用opencc工具进行繁简转换

    首先安装好opencc 可以百度到很多具体教程,安装好后可以看到share文件夹中的s2t和t2s就是简体转繁体和繁体转简体的json.在使用opencc时,有时提示找不到文件,就需要在代码后加上这两 ...

  8. Python安装opencc

    近期因为项目需求,需要将文本中的繁体中文转换成简体,查了些资料,发现opencc是个很好的库,但却遇到了无法安装的问题. 解决方案 pip install opencc-python-reimplem ...

  9. opencc安装for python

    在win10+python3.6环境下安装opencc简繁转换器,一开始直接输入命令 pip install opencc-python,但是不停地出现问题,最后采用了以下方法,亲测有效!! 输入命令 ...

  10. vs2015编译linux源码,使用Visual Studio 2017(VS2017)编译OpenCC 1.0.4 (Open Chinese Convert)源代码...

    摘要:本文介绍了Win7 64位环境下OpenCC(Open Chinese Convert) 1.0.4源码编译全过程,除VS2017外,VS2013以上版本也应该基本同样适用,其他版本的Windo ...

最新文章

  1. 2022-2028年中国铅锌精矿粉行业市场研究及前瞻分析报告
  2. linux简单目录,Linux下各目录简单整理
  3. 加密解密php,PHP实现的加密解密处理类
  4. centos rpm安装mysql5.5_CentOS 5.5下RPM方式安装MySQL 5.5 详解
  5. jenkin系列_调度jmeter实现分布式测试
  6. 钱穆的中学读书事(作者王国华)
  7. POJ2255Tree Recovery
  8. pandas 如何把时间转成index_pandas将字段中的字符类型转化为时间类型,并设置为索引...
  9. 电脑软件:5个实用的Windows软件,大幅度提高你的工作效率!
  10. 【ArcGIS遇上Python】Python实现点转栅格(PointToRaster)
  11. Python机器学习:线型回归法05衡量线性回归法的指标MES,RMS,MAE
  12. 【Python】setup-转载
  13. java拓扑圆形布局算法
  14. 计算机硬件技术基础教程mcs-51单片机原理及应用,mcs51单片机原理及应用
  15. 学习Java必看的Java书籍(本本经典实用)
  16. Jlink接口引脚定义
  17. 【每日一练:逻辑题】使用一个天平找8个球中其中一个重量不一致的球
  18. 异地驾驶证转入(+到期换证)——赞深圳交警!
  19. *.LDB文件介绍(转)
  20. 下载图片 getInputStream、available()问题

热门文章

  1. 区块链技术将如何改变金融业
  2. transformer算法解析
  3. 初级运维工程师面试题
  4. 【会议邀请】第二十届中国计算语言学大会(CCL 2021)早鸟票倒计时8天!
  5. 绝对干货!论文图表基本规范大全
  6. 大学生计算机协会举办的比赛和活动,计算机协会“英雄联盟”赛事活动总结
  7. 第一届赣网杯网络安全大赛 2020GW-CTF Web_Writeup
  8. 阿里、字节面试必撸,阿里大能总结 410 页 Java 并发编程手册全彩版,附录高并发面试真题及答案详解
  9. 怎么求矩阵行列式?工作之后的复习
  10. 温湿度对养殖场有多重要?看看这个案例你就懂了