python直接把汉字转换为拼音
今天任务要把之前获取到的中文例句全部转换成拼音。最开始打算通过爬虫从那些在线转换的网站上面爬取下来。但是所有的网站的都如下图的网站一样,通过页面中js动态加载的。直接从url入手行不通。按我现阶段多掌握的方法,只能通过selenium库进行自动化加载页面,输入文本再通过xpath定位文本爬取。但是selenium库进行爬取太慢了。我两万多条数据得到明天才行了。
突然老大一语惊醒梦中人。老大说Java有一个jar包可以实现中文文本直接转拼音。但我比较懒,java第三方jar包下载导入太麻烦了。就想看看python当中有没有类似的库。一搜,嘿嘿嘿
python可以进行汉字转拼音的库有两个一个是xpinyin,一个是pinyin。后者的功能更强大一点。
食用方法如下:
1、打开冰箱拿出吃的
万能pip安装pinyin库
pip install pinyin
2、起锅烧油开始炒菜
基本调用:
pinyin.get("天地君亲师!")
3、其他佐料
如果想要两个拼音之间有分隔符分开,可以使用delimitrer参数。比如可以设置空格:
pinyin.get('天地君亲师', delimiter=" ")
很多时候, ǐǎ 这样的符号并不适合计算机来读取。 format 参数可以设置输出拼音的方式,比如我们设置为 strip 参数去掉注音,或者使用 numerical 将注音以数字的方式放在最后:
pinyin.get('天地君亲师', format='strip', delimiter=" ")
输出:tian di jun qin shi
pinyin.get('天地君亲师', format='numerical', delimiter=" ")
输出:tian1 di4 jun1 qin1 shi1
我运行后是存为一个json文件,运行整体效果:
python直接把汉字转换为拼音相关推荐
- python:将汉字转换为拼音
2019独角兽企业重金招聘Python工程师标准>>> 找了两个库,都是基于键值的对拼音的简单查找,不支持多音字: https://github.com/cleverdeng/pin ...
- 将汉字转换为拼音:pypinyin.pinyin()
[小白从小学Python.C.Java] [计算机等级考试+500强双证书] [Python-数据分析] 将汉字转换为拼音 pypinyin.pinyin() 选择题 下列说法错误的是? import ...
- python工具——pypinyin 汉字转换拼音
把汉字转成拼音后可以进行深度学习分类,做内容识别 1.安装 pip install pypinyin 将汉字转换为拼音并生成 slug 字符串 import pypinyin from pypinyi ...
- Python实现批量汉字转拼音作搜索框提示词
下拉框提示词也称Suggestion(查询词提示),这已经是搜索引擎必备的一个功能了,而问答系统则是搜索引擎的精简版,也需要检索提示功能,给用户带来便捷,提高产品的体验感. 当你在搜索框进行输入时,搜 ...
- JAVA实现汉字转换为拼音 pinyin4j/JPinyin
转载自 JAVA实现汉字转换为拼音 pinyin4j/JPinyin 在项目中经常会遇到需求用户输入汉字后转换为拼音的场景,比如说通讯录,就会要求按名字首字符发音排序,如果自己写实现这方面的功能是个 ...
- php 将汉字转换成拼音,利用PHP怎么将汉字转换为拼音
利用PHP怎么将汉字转换为拼音 发布时间:2020-12-17 15:36:59 来源:亿速云 阅读:83 作者:Leah 这篇文章将为大家详细讲解有关利用PHP怎么将汉字转换为拼音,文章内容质量较高 ...
- 程序实现汉字转换为拼音
做了一个讯飞语音识别的项目,API返回的识别结果是汉字格式.需要提取关键字与数据库中的数据进行匹配,为提高数据的识别率.考虑到需要将数据库中的文字和识别后的数据转换为拼音的形式进行匹配.但也没找到相关 ...
- Excel2007将汉字转换为拼音首字母
Excel2007将汉字转换为拼音首字母 一.打开Excel,按下"Alt+F11"组合键,弹出"Visual Basic编辑器" 二.点击"Visu ...
- java 汉字转换为拼音
需要引入pinyin4j , 没有文件上传,pinyin4j 上传不上来 import java.io.UnsupportedEncodingException; import net.source ...
最新文章
- boost::hana::chain用法的测试程序
- 昨天一天都没怎么看书。。。
- Laravel大型项目系列教程(一)
- linux目录 文件 pdf,linux文件与目录管理.pdf
- LeetCode 1480. 一维数组的动态和(前缀和)
- 如何成为一个优秀的高级C++程序员
- phpstudy命令行中数据表插入中文显示不了的问题
- 让你的 Node.js 应用跑得更快的 10 个技巧
- 将jQuery的复选框设置为“已选中”?
- 汇编语言中xor指令_汇编语言基本指令
- Java开发微信支付实践
- 接口测试用例设计方法
- 联想笔记本电脑(LENOVO)关闭触摸板
- 三层交换机与路由器的区别
- 优化 WindowsXPSP2 系统服务项设置
- UE4 Slate二 用UMG思想去理解Slate+Slate编码
- C++基础概念(初步代码示例英石与磅单位互换)
- sql注入bypass方法
- C++泛型编程——模板学习
- Elasticsearch基础
热门文章
- 始于情怀,终于品质----方寸微T630 USB3.0 替换 CYUSB3014
- 【SAP ABAP学习资料】(财务相关)BTE增强查找,新增
- 从你的全世界路过 经典语录
- 第五人格显示连接服务器失败怎么办,第五人格提示重新连接服务器怎么办 连接服务器失败解决方法...
- 看懂卫星遥感数据RPC文件
- 如何在 Ubuntu 中禁用 motd 欢迎消息
- 收发一体超声波测距离传感器模块_咸阳KUS3000 超声波额液位物位计
- java最大文件描述符,java – 为什么JDK NIO使用这么多的anon_inode文件描述符?
- 前端项目实战11-hook usememo使用
- Keras的loss_weights和class_weight