汉字拼音转换工具(Python 版)

将汉字转为拼音。可以用于汉字注音、排序、检索(Russian translation) 。

License: MIT license

Python version: 2.7, pypy, pypy3, 3.4, 3.5, 3.6, 3.7, 3.8, 3.9

根据词组智能匹配最正确的拼音。

支持多音字。

简单的繁体支持, 注音支持。

支持多种不同拼音/注音风格。

$ pip install pypinyin

Python 3(Python 2 下把 '中心' 替换为 u'中心' 即可):

>>> from pypinyin import pinyin, lazy_pinyin, Style

>>> pinyin('中心')

[['zhōng'], ['xīn']]

>>> pinyin('中心', heteronym=True) # 启用多音字模式

[['zhōng', 'zhòng'], ['xīn']]

>>> pinyin('中心', style=Style.FIRST_LETTER) # 设置拼音风格

[['z'], ['x']]

>>> pinyin('中心', style=Style.TONE2, heteronym=True)

[['zho1ng', 'zho4ng'], ['xi1n']]

>>> pinyin('中心', style=Style.TONE3, heteronym=True)

[['zhong1', 'zhong4'], ['xin1']]

>>> pinyin('中心', style=Style.BOPOMOFO) # 注音风格

[['ㄓㄨㄥ'], ['ㄒㄧㄣ']]

>>> lazy_pinyin('中心') # 不考虑多音字的情况

['zhong', 'xin']

>>> lazy_pinyin('战略', v_to_u=True) # 不使用 v 表示 ü

['zhan', 'lüe']

# 使用 5 标识轻声

>>> lazy_pinyin('衣裳', style=Style.TONE3, neutral_tone_with_five=True)

['yi1', 'shang5']

注意事项 :

默认情况下拼音结果不会标明哪个韵母是轻声,轻声的韵母没有声调或数字标识(可以通过参数 neutral_tone_with_five=True 开启使用 5 标识轻声 )。

默认情况下无声调相关拼音风格下的结果会使用 v 表示 ü (可以通过参数 v_to_u=True 开启使用 ü 代替 v )。

默认情况下会原样输出没有拼音的字符(自定义处理没有拼音的字符的方法见 文档 )。

命令行工具:

$ pypinyin 音乐

yīn yuè

$ pypinyin -h

项目代码开发方面的问题可以看看 开发文档 。

目前是通过词组拼音库的方式来解决多音字问题的。如果出现拼音有误的情况,

可以自定义词组拼音来调整词语中的拼音:

>>> from pypinyin import Style, pinyin, load_phrases_dict

>>> pinyin('步履蹒跚')

[['bù'], ['lǚ'], ['mán'], ['shān']]

>>> load_phrases_dict({'步履蹒跚': [['bù'], ['lǚ'], ['pán'], ['shān']]})

>>> pinyin('步履蹒跚')

[['bù'], ['lǚ'], ['pán'], ['shān']]

详见 文档 。

>>> from pypinyin import Style, pinyin

>>> pinyin('下雨天', style=Style.INITIALS)

[['x'], [''], ['t']]

因为根据 《汉语拼音方案》 ,

y,w,ü (yu) 都不是声母。

声母风格(INITIALS)下,“雨”、“我”、“圆”等汉字返回空字符串,因为根据

《汉语拼音方案》 ,

y,w,ü (yu) 都不是声母,在某些特定韵母无声母时,才加上 y 或 w,而 ü 也有其特定规则。 —— @hotoo

如果你觉得这个给你带来了麻烦,那么也请小心一些无声母的汉字(如“啊”、“饿”、“按”、“昂”等)。

这时候你也许需要的是首字母风格(FIRST_LETTER)。 —— @hotoo

如果觉得这个行为不是你想要的,就是想把 y 当成声母的话,可以指定 strict=False ,

这个可能会符合你的预期:

>>> from pypinyin import Style, pinyin

>>> pinyin('下雨天', style=Style.INITIALS)

[['x'], [''], ['t']]

>>> pinyin('下雨天', style=Style.INITIALS, strict=False)

[['x'], ['y'], ['t']]

如果对拼音的准确性不是特别在意的话,可以通过设置环境变量 PYPINYIN_NO_PHRASES

和 PYPINYIN_NO_DICT_COPY 来节省内存。

详见 文档

更多 FAQ 详见文档中的

FAQ 部分。

hotoo/pinyin: 汉字拼音转换工具 Node.js/JavaScript 版。

python的拼音_GitHub - mozillazg/python-pinyin: 汉字转拼音(pypinyin)相关推荐

  1. java汉字的拼音首字母_Java 获取汉字的拼音首字母

    Java 获取汉字的拼音首字母: pom.xml 引用 pinyin4j 包: com.belerweb pinyin4j 2.5.0 PinyinUtil 类: package com.xxx.co ...

  2. android 获取拼音首字母,Android开发 - 汉字转拼音首字母

    概述 工作中经常会遇到的一些排序问题,比如 按汉字的拼音首字母排序,比如人名排序等,就要用到下面的方法了,思路: 1.获得汉字 2.将汉字转换成首字母,并记录下(必要时保存到数据库) 3.按首字母进行 ...

  3. php 将汉字转换成拼音,利用PHP怎么将汉字转换为拼音

    利用PHP怎么将汉字转换为拼音 发布时间:2020-12-17 15:36:59 来源:亿速云 阅读:83 作者:Leah 这篇文章将为大家详细讲解有关利用PHP怎么将汉字转换为拼音,文章内容质量较高 ...

  4. java拼音搜索排序算法_Java汉字按照拼音排序

    最近项目上使用到汉字排序的问题,网上搜索了一下后普遍使用下面的方法比较. @Test public void test_sort_pinyin() { Collator cmp = Collator. ...

  5. mysql查询汉字拼音首字母_MySQL查询汉字的拼音首字母实例教程

    最好的方法还是用 PHP 来取拼音首字母,在 MySQL 里新建一个字段来存放 php 里查询汉字的拼音首字母已经有很多参考的代码了. 现在给出在mysql 里实现的, 测试环境是mysql-5.0. ...

  6. 自己写的用Python将表格中的一列汉字转换为拼音(超详细解释)

    因为工作需要将Excel中的人名转换为拼音,正好自己也在学习Python就写了一个小小的工具. 下面是代码: import pandas as pd import pypinyin #定义一个字符串用 ...

  7. python汉字拼音查询_python获取一组汉字的拼音首字母

    下面是编程之家 jb51.cc 通过网络收集整理的代码片段. 编程之家小编现在分享给大家,也给大家做个参考. #!/usr/bin/env python # -*- coding: utf-8 -*- ...

  8. python获取汉字拼音查询翻译器_python获取汉字的拼音

    #coding:utf-8 #基于python2.6 table = 'a,-20319;ai,-20317;an,-20304;ang,-20295;ao,-20292;ba,-20283;bai, ...

  9. mysql汉字转拼音首字母_MySQL中文汉字转拼音的自定义函数和使用实例(首字的首字母)...

    fristPinyin : 此函数是将一个中文字符串的第一个汉字转成拼音字母 (例如:"中国人"->Z) CREATE FUNCTION `fristPinyin`(P_NA ...

最新文章

  1. DNS RR代码和含义
  2. python就业方向有哪些-目前Python这么火,Python有哪些就业方向?
  3. 高并发编程-捕获线程运行时的异常 + 获取调用链
  4. 记录Hibernate的缓存知识
  5. 【数据结构】二叉树的遍历及应用
  6. 用计算机听音乐和看电影的ppt,五年级下册信息技术课件-第六课 用计算机听音乐和看电影 川教版 (共13张PPT)...
  7. java获取系统时间并自定义格式
  8. androidstudio 评论栏_android-studio 添加没有菜单栏和actionBar的模板
  9. SqlServer数据库 性能监视器 打开路径、添加监控参数 等详解
  10. JS正则表达式的分组匹配
  11. 一分钟教你学会配置eslint,还在为风格单双引号,对象末位逗号要不要,引用各种报错而烦恼?(建议收藏!详细中文注释)...
  12. python网络编程讲解_详解Python Socket网络编程
  13. Java基础 第一节 第一课
  14. IntelliJ IDEA的maven如何提高下载速度
  15. 用python爬取网页数据代码_python实现web页面数据抓取代码
  16. 移动基站动力及环境集中监控系统(转)
  17. 阿里云服务器发送邮件(一)
  18. 计算机操作系统原理--Linux实例分析
  19. 给20块钱买可乐,每瓶可乐3块钱,喝完之后退瓶子可以换回1块钱,问最多可以喝到多少瓶可乐。
  20. 基于STM32F103智能小车黑线寻迹运动实验(有代码)

热门文章

  1. Windows下Apache连接Tomcat(64位)
  2. 苹果cms10好看的模板
  3. 2020磺化工艺证考试及磺化工艺考试试题
  4. micro-F1和macro-F1评价指标的理解
  5. Java解析快手视频去水印教程--2020年10月最新有效代码
  6. 浅谈国产智能手机的自主创新
  7. 2021年P气瓶充装考试题及P气瓶充装最新解析
  8. 让你的爱宠不止于你的爱--宠物领养(寄养)系统
  9. springboot校园兼职系统毕业设计源码463450
  10. Malicious URL Detection using Machine Learning