中文繁体与简体字转换
在Win10、Python3.6环境下,调用包,将繁体中文字转为简体字。
方法一:
pip install snownlp
调用snownlp包进行转换。
from snownlp import SnowNLP
s = SnowNLP('環境很惡劣')
s.han
Out: '环境很恶劣'
方法二:
下载 zh_wiki.py 和 langconv.py 两个文件,放到python代码目录下。
文件下载地址:
链接:https://pan.baidu.com/s/1X8MWZi9sab9XVATwiaDgZw
提取码:qe31
1.代码实现。
from langconv import *line1 = '環境很惡劣'line2 = Converter('zh-hans').convert(line1)
line2
Out: '环境很恶劣'Converter('zh-hant').convert(line2)
Out: '環境很惡劣'
2.写成函数,调用函数,进行转换。
from langconv import *# 转换繁体到简体
def cht_to_chs(line):line = Converter('zh-hans').convert(line)line.encode('utf-8')return line# 转换简体到繁体
def chs_to_cht(line):line = Converter('zh-hant').convert(line)line.encode('utf-8')return lineline1 = '環境很惡劣'
cht_to_chs(line)
Out: '环境很恶劣'line2 = '环境很恶劣'
chs_to_cht(line)
Out: '環境很惡劣'
方法三:
zhconv 提供基于 MediaWiki 词汇表的最大正向匹配简繁转换,Python 2, 3 通用。
支持以下地区词转换:
- zh-cn 大陆简体
- zh-tw 台灣正體
- zh-hk 香港繁體
- zh-sg 马新简体(无词汇表,需要手工指定)
- zh-hans 简体
- zh-hant 繁體
import zhconv
line1 = '環境很惡劣'
line2 = zhconv.convert(line1, 'zh-cn')
line2
Out: '环境很恶劣'zhconv.convert(line2, 'zh-tw')
Out: '環境很惡劣'
中文繁体与简体字转换相关推荐
- Word文档中文繁体简体的转换
GPS平台.网站建设.软件开发.系统运维,找森大网络科技! https://cnsendnet.taobao.com 来自森大科技官方博客 http://www.cnsendblog.com/inde ...
- JAVA 人民币数字模式与中文繁体模式的转换(小白专用)!
金额转为大写形式 要求如下: 给定一个浮点数,将其转换为金额的中文大写形式的字符串.例如,123.45表示为"壹佰贰拾叁元肆角伍分".注意以下几种情况: A.当金额为整数时,只表示 ...
- 中文繁体字与简体字转换
/* * $Id: ChangeCode.java$ * * 来自:http://thorlst.blog.163.com/blog/static/59275749201122402041317 ...
- 基于Windows安装langconv实现繁体和简体字的转换
基于Windows安装langconv实现繁体和简体字的转换 在学习自然语言处理的时候,大家可能已经发现有些中文数据集是繁体字,那么当我们的任务需求是输出简体字时就需要对原始中文数据集进行字体转换,达 ...
- java utf8 简繁转换 类库_在Java中进行中文繁体简体转换,基于OpenCC(Open Chinese Convert)方案...
一.OpenCC介绍 OpenCC (Open Chinese Convert,开放中文转换) 是一个用于中文简繁转换的开源项目,支持词汇级别的转换.异体字转换和地区习惯用词转换(中国大陆.台湾.香港 ...
- 中文简体繁体之间的转换
中文简体繁体之间的转换 2007 年 09 月 13 日 星期四 10:58 对网页进行简繁字体转换的方法一般有两种:一是使用<简繁通>这样的专业软件,另外一种是制作两套版本的网页.显然, ...
- 【自然语言处理】opencc:中文繁体☞中文简体的转换
在看蚂蚁金服人工智能团队写的一篇关于中文的NLP的论文时,才知道有opencc这么个库,可以将中文繁体转为中文简体,大大简化了处理过程. 如果用的pycharm直接点开解释器,搜opencc,然后in ...
- C# 实现 简体<--->繁体 的互相转换
一.介绍 项目源码.Encode.dll文件在文末链接处,需要的自取 1)背景 对于很多人来说,学过简体字之后能很轻松的认识繁体字.但是如果说要根据简体字写出繁体字的话,没经过学习还是不容易的. ...
- Js实现金额转换为中文繁体
转载自:https://www.zuojl.com/convert-menoy-chinese-use-js/ 叙述 在工作中经常会遇到需要将金额转换成繁体数组进行展示的情况,这个转换的过程可以后台进 ...
- python实现中文繁体和中文简体之间的相互转换的代码
在学习过程中,把开发过程中重要的一些内容备份一下,下面内容是关于python实现中文繁体和中文简体之间的相互转换的内容,应该是对码农们有所好处. # 转换繁体到简体 line = Converter( ...
最新文章
- 腾讯云的Ubuntu 18.04的镜像地址
- python enumerate
- 3—YOLO:训练自己的数据
- CSS hack浏览器兼容一览表
- Hystrix能解决的问题
- Java EE应用程序的单片到微服务重构
- srs rtmp从监听到接收到新连接的过程分析
- 汉游天下公司的一些感悟
- Error:java: Annotation processing is not supported for module cycles.异常解决
- dev下没有ttyusb_Dev C++ 软件安装教程
- addeventlistener 清除_科普100秒 | 吃花生能软化血管、清除垃圾?
- 【异常】No suitable driver
- ORACLE -- ArcSDE Lock request conflicts with an established lock
- 程序猿如何使用清单,高效完成工作
- 7-4 华氏度转摄氏度 (5分)_PTA_Java基础练习
- 翼支付高速发展背后,甜橙金融的云化智能变革
- 手机怎么申请邮箱?手机邮箱下载
- access control延迟锁门_RFID ACCESS CONTROL门禁感应器的密码的修改方法
- 让心爱的TA不再孤单——Python微信聊天机器人
- 使用 zabbix 监控 tomcat(包含jvm监控)
热门文章
- python基于scrapy框架爬取当当图书信息
- c语言的Hello World
- ADC芯片——AD7705最详细讲解(STM32)
- 源支付源码三网免挂带云端协议源码搭建
- endnote找不到国标_实验差距惊人!揭秘雅迪高于新国标的品质标准测试
- 如何打出日语中的叠字符号「々」
- 疯狂的程序员 41-50
- 【网页截图亲测可用】Linux + python3 + selenium + chrome + chrome-driver 服务器端网页截图
- 软件项目管理第五章笔记---项目成本管理
- 魂斗罗进化革命 塞班JAVA版_魂斗罗之进化革命_JAVA游戏免费版下载_7723手机游戏[www.7723.cn]...