茕茕孑立 沆瀣一气

踽踽独行 醍醐灌顶

绵绵瓜瓞 奉为圭臬

龙行龘龘 犄角旮旯

娉婷袅娜 涕泗滂沱

呶呶不休 不稂不莠

这首《生僻字》,考验的是“语文”硬实力。倘若实力不够,其实可以拿Python来凑,毕竟库多!今天就来说一个有意思的pypinyin库,名字很直白,是Python版的拼音库,用来将汉字转为拼音。

先来看下代码运行效果,比较喜欢将结果print到命令行的样式:

当然,正规的操作是读取汉字txt文本,生成注音版txt文本:

思路

很简单,拼音库可以把汉字转化为拼音,那我们要做的就是读取文本,获取拼音,最后将文本和拼音重新拼接。代码也不难,基本围绕字符串和列表进行拼接操作,比较适合新手朋友拿来练手。

pypinyin库

首先是安装:pip install pypinyin

装好后引入模块:from pypinyin import pinyin

调用 pinyin(“生僻字”) 即可得到拼音列表 [[‘shēng’], [‘pì’], [‘zì’]]

读写txt文本

算是读写txt文件的简单应用:

txt_name = "生僻字"with open("%s.txt"%txt_name,encoding="UTF-8-sig") as f:    content = f.read()    input_str = content
result = transfer(input_str)#对读取到的txt进行注音操作

with open("%s_拼音.txt"%txt_name,'w',encoding='UTF-8-sig') as m:    m.write(result)

拼接

首先会对读入的文本进行整理,去除多余的空格,将字符串中的汉字与列表中的拼音一一对应并拼接。

由于中文字符是占两个字节,以及读写txt时也会涉及到编码格式,这部分的代码费了些功夫,只能说勉强做到格式整齐吧。

回顾

最初接触一个读取剪贴板内容的pyperclip模块,琢磨对剪贴板中字符串如何操作。恰巧听到《生僻字》,觉得既然逐字查拼音是个麻烦事,何不通过Python来批量添加拼音呢?很幸运,还真有大佬写了这个pypinyin库,在Github上也已有1500多颗星了~

昨天完成的小代码,是对剪贴板中复制的内容添加拼音,感觉实用性不强且操作不方便,故今天修改为读取txt文本生成注音版本。

代码下载

后台回复 拼音 获取下载链接

最后再放个《离骚》文本的注音,先txt文本:

以及偏爱的命令行格式:


Python 玩转《生僻字》相关推荐

  1. python将txt转为字符串_Python 玩转生僻字

    茕茕孑立 沆瀣一气 踽踽独行 醍醐灌顶 绵绵瓜瓞 奉为圭臬 龙行龘龘 犄角旮旯 娉婷袅娜 涕泗滂沱 呶呶不休 不稂不莠 这首<生僻字>,考验的是"语文"硬实力.倘若实力 ...

  2. python输出大字号汉字_Python print 玩转点阵字

    学python3第一句大概率是 print("hello world") 吧,既然可以逐行逐个地输出字符,那么把字符组成汉字应该也不难吧?经过一番搜索与尝试,实现了通过python ...

  3. Python玩转《生僻字》

    Python玩转<生僻字> 最终效果 思路 pypinyin库 读写txt文本 拼接 回顾 代码下载 最后 茕茕孑立 沆瀣一气 踽踽独行 醍醐灌顶 绵绵瓜瓞 奉为圭臬 龙行龘龘 犄角旮旯 ...

  4. python将txt转为字符串_Python玩转《生僻字》

    茕茕孑立 沆瀣一气 踽踽独行 醍醐灌顶 绵绵瓜瓞 奉为圭臬 龙行龘龘 犄角旮旯 娉婷袅娜 涕泗滂沱 呶呶不休 不稂不莠 这首<生僻字>,考验的是"语文"硬实力.倘若实力 ...

  5. 装13失败后,我决定使用Python为生僻字批量注音

    装13的冷场 "龙生九子,各不相同-" 囚牛.睚眦.嘲风.蒲牢.狻猊.霸下.狴犴.负屃.螭吻. 都说提笔忘字丢人,可至少还有提笔的机会.随着信息化时代的普及,原来越多的人成了半文盲 ...

  6. python ljust 中文_python ljust 中文_Python为文档批量注音(生僻字歌词为例)

    抖音配乐--生僻字 首次听到生僻字就是从抖音了,随着生僻字配乐使用的人越来越多,很多人翻唱.模仿甚至有讲解成语出处和寓意的段子,可谓百家争鸣. 但,有一类视频很不讨喜,就是把歌词用谐音字代替,好让人一 ...

  7. Python print 玩转点阵字

    Python print 玩转点阵字 效果图 点阵字 HZK16字库 实现单字 单字代码 命令行中效果 pycharm编辑器中效果 实现多字 多字代码 多字命令行效果 pycharm编辑器多字效果 最 ...

  8. python print 字体大小_Python print 玩转“点阵字”

    原标题:Python print 玩转"点阵字" 学习python3第一句大概率是 print("hello world") 吧?既然可以逐行逐个地输出字符,那 ...

  9. python生僻字如何转码_装13失败后,我决定使用Python为生僻字批量注音

    装13的冷场 "龙生九子,各不相同-" 囚牛.睚眦.嘲风.蒲牢.狻猊.霸下.狴犴.负屃.螭吻. 都说提笔忘字丢人,可至少还有提笔的机会.随着信息化时代的普及,原来越多的人成了半文盲 ...

最新文章

  1. input[type=checkbox] ; input[type=radio] 改变默认样式
  2. 数据挖掘分析的必要性
  3. Automatic Summarization of Bug Reports
  4. ngui 输入事件处理
  5. 数据挖掘竞赛-北京PM2.5浓度回归分析训练赛
  6. 小技巧:用python迅速打印Java写 的Flink代码中的hive建表语句
  7. ubuntu19.10安装deepin的微信和qq(转载+自己在新系统上验证)
  8. C++中private成员变量和protect成员变量的区别
  9. 解决Intellij IDEA 通过archetype创建Maven项目缓慢的问题
  10. 在lua中调用DLL
  11. SDHC和SDXC的区别总结
  12. 在python中,计算Sum = m + mm + mmm +mmmm+.....+mmmmm.....,输入两个数m,n。m的位数累加到n的值,列出算式并计算出结果:
  13. 图像滤镜艺术---乐高像素拼图特效
  14. c语言的编程switch,C语言之switch详解
  15. 神经网络学习(3)————BP神经网络以及python实现
  16. Kolmogorov–Smirnov test
  17. 正则表达式的.*?不包含空格(解决办法)
  18. app应用关键词排名都有哪些因素?
  19. 软件流水和循环展开的区别
  20. 服务器不显示串口,关于串口服务器的配置问题

热门文章

  1. UVALive 7139 Rotation(矩阵前缀和)(2014 Asia Shanghai Regional Contest)
  2. iOS tableView滑动隐藏/显示tabbar
  3. 南非世界杯对阵及电视直播表
  4. org.springframework.web.HttpMediaTypeNotAcceptableException: Could not find acce
  5. 软件测试之ios自动化——ios真机命令
  6. Python如何访问Excel文件中的文本框?
  7. 专利申请与专利授权的区别?
  8. 项目代码架构-业务分层和各层业务逻辑
  9. 良品铺子或签《爸3》萌娃,电视真人秀植入代言人成新玩法
  10. 安装Adobe AIR 时出错 管理员可能不允许安装