python工具——pypinyin 汉字转换拼音
把汉字转成拼音后可以进行深度学习分类,做内容识别
1.安装
pip install pypinyin
将汉字转换为拼音并生成 slug 字符串
import pypinyin
from pypinyin import Style
content = pypinyin.slug('汉语拼音')
print(content)
# E:\python\>python pinyin.py
# han-yu-pin-yin
修改分隔字符串
import pypinyin
from pypinyin import Style
content = pypinyin.slug('汉语拼音',separator=' ')
print(content)
# E:\python>python pinyin.py
# han yu pin yin
启用多音字模式
import pypinyin
content = pypinyin.pinyin(u'单个', heteronym=True) # heteronym=False 不启用多音字
print(content)
# [['dān', 'chán', 'shàn'], ['gè', 'gàn', 'gě']]
生成多音名字所有拼音列表
import pypinyin
from icecream import ic
from itertools import productdef load_pinyins(name):"""通过名字加载拼音列表"""pinyins = []for char in name:pinyins = pinyins + pypinyin.pinyin(char, style=pypinyin.NORMAL, heteronym=True)# 通过笛卡尔积找到所有姓和名字的组合 product(*pinyins)return set(["".join(pinyins) for pinyins in product(*pinyins)])
style设置拼音音调风格
from pypinyin import pinyin, Style# (1)Style.TONE3音调显示在末尾
print(pinyin('单个',style=Style.TONE3))
# [['dan1'], ['ge4']]#数字为音调
print(pinyin('单个',style=Style.TONE3,heteronym=True))
# [['dan1', 'chan2', 'shan4'], ['ge4', 'gan4', 'ge3']]#数字为音调# (2) Style.TONE2音调显示在韵母
print(pinyin('单个',style=Style.TONE2,heteronym=True))
# [['da1n', 'cha2n', 'sha4n'], ['ge4', 'ga4n', 'ge3']]#数字为音调# (3)Style.TONE音调为手写格式
print(pinyin('单个',style=Style.TONE))
# [['dān'], ['gè']]
print(pinyin('单个',style=Style.TONE,heteronym=True))
# [['dān', 'chán', 'shàn'], ['gè', 'gàn', 'gě']]# (4)pypinyin.NORMAL不显示音调
print(pinyin(u'单个', heteronym=True,style=pypinyin.NORMAL))
# [['dan', 'chan', 'shan'], ['ge', 'gan']]
print(pinyin(u'单个', style=pypinyin.NORMAL))
# [['dan'], ['ge']]
python工具——pypinyin 汉字转换拼音相关推荐
- Java汉字转换拼音工具类
1. 使用pinyin4j 1.1 引入相关maven依赖 <dependency><groupId>com.belerweb</groupId><artif ...
- pinyin4j汉字转换拼音的工具类
import net.sourceforge.pinyin4j.PinyinHelper;/*** 功能说明:汉字转换拼音工具类* * @author LZG*/ public class Pinyi ...
- Python3 如何实现汉字转换拼音?
目前常用的有两个包可以实现 Python 汉字转换拼音. 第一个是 pypinyin 比较有名,可以参考 pypinyin 官方 地址或者 GitHub 地址开发文档. pypinyin 最初版本是基 ...
- python直接把汉字转换为拼音
今天任务要把之前获取到的中文例句全部转换成拼音.最开始打算通过爬虫从那些在线转换的网站上面爬取下来.但是所有的网站的都如下图的网站一样,通过页面中js动态加载的.直接从url入手行不通.按我现阶段多掌 ...
- python3怎么切换汉版_python3 中文繁体转换简体,简体转换为繁体,汉字转换拼音...
SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和Te ...
- 昵称到拼音php,php 汉字转换拼音程序_PHP教程
php 汉字转换拼音程序 $p=ord(substr($str,$i,1)); if($p>160){ $q=ord(substr($str,++$i,1)); $p=$p*256+$q-655 ...
- php汉字转换拼音,PHP汉字转换拼音的函数代码
/************ *汉字转换拼音Class *************/ class pin{ function Pinyin($_String, $_Code='gb2312'){ $_D ...
- php 汉字转拼音类,PHP汉字转换拼音的类_php
网络上类似的代码大多只能在gb2312编码下使用,下面这个类同时能在utf-8编码下将汉字转换为拼音,具体的代码和用法如下: function Pinyin($_String, $_Code='gb2 ...
- 中文汉字转换拼音PHP类
1 <?php 2 /** 3 * 中文汉字转换拼音类 4 * 功能支持 5 * 1.支持中文转换全拼 6 * 2.支持中文转换简拼(首字母) 7 * 3.支持转换的字符串返回格式设置(字符中间 ...
最新文章
- JAVA线程池的分析和使用
- intelliJ idea 下载安装
- 对于《软件工程》课程的认识
- 玩转C#窗体-属性、方法和事件详细说明
- 话里话外:按单制造(MTO II)信息化管理特点
- 查看从库mysql同步错误日志_常见MySQL同步错误恢复方法
- 12.1 LNMP架构介绍 12.2 MySQL安装 12.3/12.4 PHP安装 12.5 Ng
- exposed beyond app through Intent.getData()
- Lightweight OpenPose
- 什么是云计算架构和组件
- 全国哀悼日 网站变灰代码集锦
- python读书心得体会范文_读书心得体会范文10篇完美版
- xiuno论坛开发模式怎么调整
- 群晖域名解析 DDNS ——阿里云 DNS 脚本
- ZF GE5060F47/153
- 成为一个有目标的学习者
- 如何在 SAP ABAP 系统中使用 Adobe Form 试读版
- 接吻的十大忌讳及对策
- SAP SCC4所有细节详细解析
- c语言中编译解释,C语言既可以编译执行又可以解释执行吗? 编译执行怎么解释? 解释执行又怎么解释?...