pinyin

pinyin模块是github上一个小项目,在github.com/cleverdeng/pinyin.py上面可以下到源码。衷心感谢那些为这个模块做出贡献的人来方便我们【鞠躬】

安装:

下载获得github上的包之后,解压,在cmd下将工作目录切换到解压出来的文件夹里。#python setup.py build,之后就装好了

我记得在我第一次用这个模块之前,我参考了某位前辈的工作,稍微改了一下pinyin的源码,那篇文章已经找不到了T-T。谢过那位前辈

源码第一处改动:改动class PinYin下的hanzi2pinyin方法

#######原来的hanzi2pinyin函数是这样的##########

def hanzi2pinyin(self, string=""):

result=[]if notisinstance(string, unicode):

string= string.decode("utf-8")for char instring:

key= '%X' %ord(char)

result.append(self.word_dict.get(key, char).split()[0][:-1].lower())returnresult#########把它改成这样##################

def hanzi2pinyin(self, string=""):

result=[]if notisinstance(string, unicode):

string= string.decode("utf-8")for char instring:

key= '%X' %ord(char)if not self.word_dict.get(key): #加一条判断,当碰到非汉字的时候原字符保留

result.append(char)else:

result.append(self.word_dict.get(key, char).split()[0][:-1].lower())return result

第二处改动:class PinYin 下的 hanzi2pinyin_split方法:

############原来函数是这样的###########

def hanzi2pinyin_split(self, string="", split=""):

result= self.hanzi2pinyin(string=string)if split == "":returnresultelse:returnsplit.join(result)###########改过之后的函数############

def hanzi2pinyin_split(self, string="", split=""):

result= self.hanzi2pinyin(string=string)#if split == "": #注释掉这三句,功能是这个函数的split参数为空串的时候也返回一个连在一起的字符串而不是一个列表

#return result

#else:

return split.join(result)

*pinyin把汉字转拼音的原理是从一个外部文件,找到相关汉字的拼音表示然后替换原文。这个外部文件在PinYin初始化时由变量的dict_file指定。需要注意的是原文没有写绝对路径,也就是说默认word.data文件是放在和pinyin.py同一个目录下的。可以自己根据需要修改

用法:

importpinyin

pinyinTransfer=pinyin.PinYin()

pinyinTransfer.load_word()print pinyinTransfer.hanzi2pinyin("一段中文内容")>>>yiduanzhongwenneirongprint pinyinTransfer.hanzi2pingyin("一段中文内容",split="|")>>> yi|duan|zhong|wen|nei|rong

python 中文转拼音原理_【Python】 汉字转化汉语拼音pinyin相关推荐

  1. python 中文转拼音原理_Python中文转拼音

    –人人可以学Python– pypinyin安装与使用 pip命令安装: pip install pypinyin (venv) allenwoo@~/renren$ pip install pypi ...

  2. python 中文转拼音原理_Python_ jieba、snownlp中文分词、Pinyin中文转拼音

    一.安装 pip install jieba pip install snownlp # 使用这个,建议使用Python3环境 pip install pypinyin 分词: jieba分词 # j ...

  3. python中文意思k-【Python】 汉字转化汉语拼音pinyin

    pinyin pinyin模块是github上一个小项目,在github.com/cleverdeng/pinyin.py上面可以下到源码.衷心感谢那些为这个模块做出贡献的人来方便我们[鞠躬] 安装: ...

  4. python获取字符串首字母_[Python] Python 获取中文的首字母 和 全部拼音首字母

    原博文 2019-07-08 04:18 − Python 获取中文的首字母 和 全部拼音首字母 代码如下: import pinyin def getStrAllAplha(str): return ...

  5. python卡方检验筛选特征原理_基于Python的遥感特征筛选—递归特征消除(RFE)与极限树(Extra-Trees)...

    引言 基于前几篇文章关于筛选方法的介绍,本篇同样给大家介绍两种python封装的经典特征降维方法,递归特征消除(RFE)与极限树(Extra-Trees, ET).其中,RFE整合了两种不同的超参数, ...

  6. python find函数实现原理_非常干货:Python 探针实现原理

    △点击上方"Python猫"关注 ,回复" 1 "领取电子书 剧照 | <棋魂> 原文:https://segmentfault.com/a/119 ...

  7. python垃圾回收机制原理_详解python的垃圾回收机制

    python的垃圾回收机制 一.引子 我们定义变量会申请内存空间来存放变量的值,而内存的容量是有限的,当一个变量值没有用了(简称垃圾)就应该将其占用的内存空间给回收掉,而变量名是访问到变量值的唯一方式 ...

  8. python异步回调实现原理_快速理解Python异步编程的基本原理

    第一个例子 假设你需要用电饭煲煮饭,用洗衣机洗衣服,给朋友打电话让他过来吃饭.其中,电饭煲需要30分钟才能把饭煮好,洗衣机需要40分钟才能把衣服洗好,朋友需要50分钟才能到你家.那么,是不是你需要在这 ...

  9. python中文教程github_GitHub - Virile-Tao/python_data_structures_and_algorithms: Python 中文数据结构和算法教程...

    Python 算法与数据结构视频教程 课程简介 数据结构和算法是每个程序员需要掌握的基础知识之一,也是面试中跨不过的槛.目前关于 Python 算法和数据结构的系统中文资料比较欠缺, 笔者尝试录制视频 ...

最新文章

  1. 论文笔记:CycleGAN
  2. oracle insert 新增语句
  3. flash 火狐总是崩溃_win10系统火狐flash插件总是崩溃的解决方法
  4. Oracle EBS中的“客户”、客户地点、‘订单’之间的关系
  5. 写ios系统和安卓系统的人到底有多牛?
  6. python 根据字符串语句进行操作再造函数(evec和eval方法)
  7. java 删除子文件夹_Java删除文件夹及文件夹下的子文件夹和子文件
  8. 计算机键盘上的每一个按键读音,电脑键盘上各键的名称功能及作用.doc
  9. Linux 并发测试工具 httpd-tools工具的安装和使用
  10. 图片剪裁在线html,前端图片裁剪实战
  11. Zookeeper隐藏通道和羊群效应
  12. 行列式的3种计算方法技巧和一点注意
  13. 带有两位小数的元转分
  14. 基本保险金额和保额的意思和区别是什么?
  15. SaltStack组件return和job cache以及salt-ssh
  16. 用c#做的打地鼠小游戏,整理一下上课学的
  17. 【C语言】万字讲解 从零到精通 (文件操作与文件函数)
  18. 斯福尼健康采暖,终结健康杀手——雾霾
  19. vue中DatePicker从前台到后台日期偶尔差一天
  20. C语言实现继承,封装,多态

热门文章

  1. 打卡第16天:ichunqiu做题之 i春秋 第二届春秋欢乐赛(1)
  2. 自编R计算MSE(均方误差)
  3. smartclient(barcode system)
  4. Itron加速澳大利亚和新西兰水务公司的数字化转型
  5. 用最复杂的方式学会数组(Python实现动态数组)
  6. vue生命周期每个阶段可以做什么
  7. 【Netty】五、Netty实现Http服务器
  8. python项目篇-酒店(会议室,电影)预定
  9. latex中bibitem的整理。
  10. php 搜索图片,关于php图片搜索的10篇文章推荐