探索PinYin4j.jar将汉字转换为拼音的基本用法
将汉字转换为拼音在Android开发中是个很常见的问题。例如:在android手机应用开发中,要查询联系人的姓名,通常都是用拼音进行查询的。
Pinyin4j是一个功能强悍的汉语拼音工具包,是sourceforge.net上的一个开源项目。
主要的功能有:
- 支持同一汉字有多个发音
- 支持拼音的格式化输出,比如第几声之类的
- 支持简体中文、繁体中文转换为拼音
首先,在Android Studio中的使用应该将pinyin4j的包放入到libs文件夹下,然后在需要使用到pinyin4j时就在类中import要使用的相应类即可。
检查在build.gradle中是否已经导入PinYin4j.jar的存放路径
1.基本用法(单个汉字转拼音):
PinyinHelper类中的静态方法toHanyuPinyinStringArray返回的数据类型是一个String数组,它用来接收一个汉字的多个发音,如果toHanyuPinyinStringArray中的参数不是汉字,那么它会返回null。
String[] pinyinArray = PinyinHelper.toHanyuPinyinStringArray('行');for (int i = 0; i < pinyinArray.length; ++i){Log.d("TAG", pinyinArray[i]);}
- 1
- 2
- 3
- 4
- 5
- 1
- 2
- 3
- 4
- 5
结果输出:
可以看到“行”字有这么5种发音,后面的数字代表第几声。
2.格式支持
Pinyin4j支持拼音输出的格式化,比如,“行”字出了像前面输出“xing2”,也可以输出为“xing”或者“xíng”之类的其他格式。
HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);String[] pinyinArray = null;try {pinyinArray = PinyinHelper.toHanyuPinyinStringArray('行', format);} catch (BadHanyuPinyinOutputFormatCombination badHanyuPinyinOutputFormatCombination) {badHanyuPinyinOutputFormatCombination.printStackTrace();}for (int i = 0; i < pinyinArray.length; ++i) {Log.d("TAG", pinyinArray[i]);}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
效果图如下:
其中使用HanyuPinyinOutputFormat来格式化返回拼音的格式还有例如以下几种:
- WITH_V:用v表示ü (nv)
- WITH_U_AND_COLON:用”u:”表示ü (nu:)
- WITH_U_UNICODE:直接用ü (nü)
–>使用:format.setVCharType(HanyuPinyinVCharType.WITH_U_UNICODE);
- UPPERCASE:大写 (XING)
- LOWERCASE:小写 (xing)
–>使用:format.setCaseType(HanyuPinyinCaseType.LOWERCASE);
- WITHOUT_TONE:无音标 (xing)
- WITH_TONE_NUMBER:1-4数字表示英标 (xing2)
- WITH_TONE_MARK:直接用音标符
–>使用:format.setToneType(HanyuPinyinToneType.WITH_TONE_MARK);
虽然pinyin4j很好用,但是还是有局限的。以上代码只能获取单个汉字的拼音,但是不能获取一个包含多音字的词的拼音。例如“重庆”,无法判断到底是“chongqing”还是“zhongqing”,pinyin4j不能通过上下文来判断多音字的读音。
所以,在获取一个包含多音字的词语的读音,可以返回一个列表,正确的读音只能是人工判断选择。
3.示例代码
package com.adan.pinyindome;import net.sourceforge.pinyin4j.PinyinHelper;
import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;
import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;
import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;
import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;
import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;/*** @author: xiaolijuan* @description:* @projectName: PinyinDome* @date: 2016-02-18* @time: 10:13*/
public class PinyinUtils {/*** 获得汉语拼音首字母** @param chines 汉字* @return*/public static String getAlpha(String chines) {String pinyinName = "";char[] nameChar = chines.toCharArray();HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);for (int i = 0; i < nameChar.length; i++) {if (nameChar[i] > 128) {try {pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0);} catch (BadHanyuPinyinOutputFormatCombination e) {e.printStackTrace();}} else {pinyinName += nameChar[i];}}return pinyinName;}/*** 将字符串中的中文转化为拼音,英文字符不变** @param inputString 汉字* @return*/public static String getPingYin(String inputString) {HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat();format.setCaseType(HanyuPinyinCaseType.LOWERCASE);format.setToneType(HanyuPinyinToneType.WITHOUT_TONE);format.setVCharType(HanyuPinyinVCharType.WITH_V);String output = "";if (inputString != null && inputString.length() > 0&& !"null".equals(inputString)) {char[] input = inputString.trim().toCharArray();try {for (int i = 0; i < input.length; i++) {if (java.lang.Character.toString(input[i]).matches("[\\u4E00-\\u9FA5]+")) {String[] temp = PinyinHelper.toHanyuPinyinStringArray(input[i], format);output += temp[0];} elseoutput += java.lang.Character.toString(input[i]);}} catch (BadHanyuPinyinOutputFormatCombination e) {e.printStackTrace();}} else {return "*";}return output;}/*** 汉字转换位汉语拼音首字母,英文字符不变** @param chines 汉字* @return 拼音*/public static String converterToFirstSpell(String chines) {String pinyinName = "";char[] nameChar = chines.toCharArray();HanyuPinyinOutputFormat defaultFormat = new HanyuPinyinOutputFormat();defaultFormat.setCaseType(HanyuPinyinCaseType.UPPERCASE);defaultFormat.setToneType(HanyuPinyinToneType.WITHOUT_TONE);for (int i = 0; i < nameChar.length; i++) {if (nameChar[i] > 128) {try {pinyinName += PinyinHelper.toHanyuPinyinStringArray(nameChar[i], defaultFormat)[0].charAt(0);} catch (BadHanyuPinyinOutputFormatCombination e) {e.printStackTrace();}} else {pinyinName += nameChar[i];}}return pinyinName;}}
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- 107
- 108
在实际开发中如果我们要将一段文字中的汉字全部转换成不带音调的拼音输出,而这段文字中又可能包含阿拉伯数字、英文、标点符号等等。如果完全靠自己写代码进行转换,那是非常麻烦的,其中一个首先就要区别,这段文字中那些是汉字,那些是非汉字。有了Pinyin4j,这个问题就不再困难了
String strs = PinyinUtils.getPingYin("新年好!Hello,新年大家都过得开心吧?哈哈,我是做Android开发哒,what's this?");TextView textView = (TextView) findViewById(R.id.text);textView.setText(strs);Log.d("TAG", strs);
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
结果输出:
xinnianhao!Hello,xinniandajiadouguodekaixinba?haha,woshizuoAndroidkaifada,what’s this?
Dome下载
下载pinyin4j-2.5.0.jar
探索PinYin4j.jar将汉字转换为拼音的基本用法相关推荐
- 使用 pinyin4j API 将汉字转换为拼音 (学习笔记)
1.导入 pinyin4j.jar 2.使用实例 public class PinYin {/** * 将汉字转换为全拼 * @param src * @return */ public static ...
- JAVA实现汉字转换为拼音 pinyin4j/JPinyin
转载自 JAVA实现汉字转换为拼音 pinyin4j/JPinyin 在项目中经常会遇到需求用户输入汉字后转换为拼音的场景,比如说通讯录,就会要求按名字首字符发音排序,如果自己写实现这方面的功能是个 ...
- java字符串转换为拼音_JAVA实现汉字转换为拼音 pinyin4j/JPinyin
在项目中经常会遇到需求用户输入汉字后转换为拼音的场景,比如说通讯录,就会要求按名字首字符发音排序,如果自己写实现这方面的功能是个很好大的工程,还好网上有公开的第三方jar支持转换,结合网上很多前辈的代 ...
- 基于struts2、spring、spring data jpa实现poi导入 + pinyin4j将汉字转换为拼音
基于struts2.spring.spring data jpa实现poi导入 + pinyin4j将汉字转换为拼音 1.引入坐标到pom.xml <!-- Excel解析工具类 -->& ...
- java 汉字转换为拼音
需要引入pinyin4j , 没有文件上传,pinyin4j 上传不上来 import java.io.UnsupportedEncodingException; import net.source ...
- 汉字转换为拼音Java工具类
声明:本文是对https://www.cnblogs.com/DreamDrive/p/5762078.html的整理,感谢博主分享. 我就是爱音乐~ 准备工作:在pom.xml中引入依赖. < ...
- 通过第三方jar实现中文转换为拼音
如何把中文转换为拼音 通过使用第三方的jar包pinyin4j-2.5..jar,把中文转换为拼音,代码如下. public class PinYinUtil {/*** 获取汉字的拼音,会销毁一定的 ...
- php 将汉字转换成拼音,利用PHP怎么将汉字转换为拼音
利用PHP怎么将汉字转换为拼音 发布时间:2020-12-17 15:36:59 来源:亿速云 阅读:83 作者:Leah 这篇文章将为大家详细讲解有关利用PHP怎么将汉字转换为拼音,文章内容质量较高 ...
- 程序实现汉字转换为拼音
做了一个讯飞语音识别的项目,API返回的识别结果是汉字格式.需要提取关键字与数据库中的数据进行匹配,为提高数据的识别率.考虑到需要将数据库中的文字和识别后的数据转换为拼音的形式进行匹配.但也没找到相关 ...
最新文章
- 【控制】《多无人机协同控制技术》周伟老师-第2章-多无人机协同控制体系结构
- 搞网络都应该知道的12条基本命令
- “.Net 社区虚拟大会”(dotnetConf) 2016 Day 2 Keynote: Miguel de Icaza
- 知识管理系统Data Solution研发日记之十二 网页数据抓取Fetch,呈现Render,导出Export...
- go test遇到的一些问题-command-line-arguments undefined: xxxxx
- c语言报数函数问题,[编程入门]报数问题-题解(C语言代码)
- 凸优化-Proximal GD
- 新库上线 | CnOpenData境外投资企业(机构)名录数据
- java.util.TaskQueue的最小堆排序算法的应用
- 管理的5个层次,你在第几层?
- oracle io错误的是什么意思,磁盘IO错误 导致数据库故障一则
- 深入理解卷积网络的卷积
- 线索二叉树中序非递归线索化以及递归线索化构建和遍历算法
- 一款强大易用的Vue-markdown文本编辑器插件
- 当编辑内容改变是后 选中内容 Range 的startOffset会被重置
- Learning Cocos2d-x for XNA(6)——场景切换和场景过渡效果
- 自定义类 无极限树形结构菜单(繁杂版)
- 当代年轻人下班行为报告:我下班了,却又没完全下班
- 高频交易是如何发展起来的?
- c语言模拟洛伦兹吸引子,洛伦兹吸引子相图的简易实现.pdf