python 日语转罗马音工具 pykakasi模块使用
翻译文章自:https://qiita.com/komorin0521/items/8cd1eb0cdb4a9ede217e
①下载模块:
pip install pykakasi
pip会自动把依赖库six和semidbm给装上
手动装也可以:
pip install six semidbm pip install pykakasi
模块主页:https://github.com/miurahr/pykakasi
②测试代码:
#!/usr/bin/env python3
# coding: utf-8
from pykakasi import kakasikakasi = kakasi()kakasi.setMode('H', 'a')
kakasi.setMode('K', 'a')
kakasi.setMode('J', 'a')conv = kakasi.getConverter()filename = '本日は晴天なり.jpg'print(type(filename))
print(conv.do(filename))
③最终结果:
honjitsuhaseitennari.jpg
④效果截图:
⑤参数说明
These switch alphabets are derived from original Kakasi. Now it support following options:
Option | Description | Values | Note |
---|---|---|---|
K | Katakana convertion | a,H,None | roman, Hiragana or noconversion |
H | Hiragana convertion | a,K,None | roman, Katakana or noconversion |
J | Kanji conversion | a,H,K,None | roman or Hiragana, Katakana or noconv |
a | Roman conversion | E,None | JIS ROMAN or noconversion |
E | JIS ROMAN conversion | a,None | ascii roman or noconversion |
Each character means character sets as follows:
Character Setsa: ascii j: jisroman g: graphic k: kana(j,k defined in jisx0201)E: kigou K: katakana H: hiragana J: kanji(E,K,H,J defined in jisx0208)
上面的参数说明很详细了,如果看不懂看下面的例子就一目了然:
from pykakasi import kakasi,wakatitext = u"かな漢字交じり文"
kakasi = kakasi()
kakasi.setMode("H","a") # Hiragana to ascii, default: no conversion
kakasi.setMode("K","a") # Katakana to ascii, default: no conversion
kakasi.setMode("J","a") # Japanese to ascii, default: no conversion
kakasi.setMode("r","Hepburn") # default: use Hepburn Roman table
kakasi.setMode("s", True) # add space, default: no separator
kakasi.setMode("C", True) # capitalize, default: no capitalize
conv = kakasi.getConverter()
result = conv.do(text)
print(result)wakati = wakati()
conv = wakati.getConverter()
result = conv.do(text)
print(result)
要说这个模块的作用,除了可以自动转换日文歌词之外,还有python的很多模块不支持非ascii字符串,比如Vapoursynth用于压制的时候,VSFilter或者VSFilterMod就不支持很多字幕文件名的字符了,这个模块可以自动把文件名转换成罗马音解决要手动改名字的麻烦。
python 日语转罗马音工具 pykakasi模块使用相关推荐
- win10日语输入法罗马音与假名不对应
问题 win10中使用日语输入法时,输入罗马音a,打出的却是ち,输入其他罗马音也是这种情况 出现这种情况是因为你无意中输入方式设置成了假名输入,我们需要改成罗马字输入 解决 在win10任务栏中的日语 ...
- Python脚本 抓取/翻译动漫角色名字的罗马音或外文名(用于搜索图片)
在 https://danbooru.donmai.us 搜索色图的时候,因为老美的网站的缘故,不支持中文和日文输入,只能输入平假名对应罗马音来寻找人物.像我虽然日语N1了,但是遇到人名有时依然会念错 ...
- Python中常用的数据分析工具(模块)有哪些?
本期Python培训分享:Python中常用的数据分析工具(模块)有哪些?Python本身的数据分析功能并不强,需要安装一些第三方的扩展库来增强它的能力.我们课程用到的库包括NumPy.Pandas. ...
- 罗马音平假名片假名转换器_零基础日语萌新该如何学习五十音?
在这里跟小伙伴们讲一下如何学习日语50音.五十音就像我们的二十六个字母一样.如果我们不能熟练地写和发音五十种音调,我们就无法很好地继续学习. 日语五十音图 https://sourl.cn/rMFhZ ...
- 罗马音平假名中文可复制_如何快速有效地学习日语五十音?
在日语学习的过程中,五十音图是学习日语朋友的第一步,而在平假名,片假名和罗马字的转换中,让一部分初学之放弃了日语的学习,那么,日语五十音图很难背吗?什么样的方法记忆日语五十音图最高效,日语五十图记忆方 ...
- 罗马音平假名中文可复制_日语零基础入门五十音,日语零基础五十音图表
日语零基础入门五十音,日语入门的最基本要求就是记住五十音图,但是这个记住不仅是你能背下来或是默写下来.而是你需对号入座! 下面是一张五十音图表. 即每个假名单独拿出来你要立马反应出来怎么读.其重要性甚 ...
- 【python小白】抖音无水印视频下载小工具(windows)
无水印视频的方法大家都已经知道了,我很早之前也写了一个脚本.最近学习了一下下pyside2,所以我用python写了一个小工具. 运行图: from PySide2.QtWidgets import ...
- 罗马音平假名中文可复制_想自学日语口语又想唱日语歌但苦于不会读罗马音标?干货都在这...
日文应该算是一门和中文相似度较高的语言了,其中很多字词都来源于中文的繁体字,所以相对于英文来说,我们学习日文更加容易上手. 和我国汉语拼音不同的是,学习日语需要用到罗马音标,相信唱过日语歌的小伙伴都看 ...
- python一键去抖音视频水印工具,请勿用于学习以外的用途!
一.前言 翻了翻爬虫代码存货,决定把抖音APP视频批量下载的代码拿出来做个文章. 二.实战背景 抖音越来越火,越刷越上瘾,总感觉下一个视频一定会更精彩,根本停不下来.想将抖音里喜欢的小哥哥/×××姐的 ...
最新文章
- 什么是视觉Visual SLAM
- 2021年春季学期-信号与系统-第十次作业参考答案-第六小题
- java 小球抛物线_关于【愤怒的小鸟】其中的算法(自由落体,抛物线,碰撞,反弹)...
- 卷积神经网络(CNN)结尾篇:可视化跟踪(Visualize)
- Qt之进程间通信(共享内存)
- 春节7天新增病毒54万 钓鱼欺诈成最大威胁
- 如何在SqlServer中获取前端连接的IP地址,计算机名等信息
- )C# Enum,Int,String的互相转换 枚举转换
- java走梅花桩_PGIS周中赛:梅花桩4队混战 PERO17杀饮恨 STK拿下本局
- matlab函数mapminmax,Matlab的mapminmax函数说明[转]
- Kubernetes crictl管理命令详解
- VS 2010错误提醒: 必需属性“VSInstallDir”缺失或为空 以及 error MSB8008
- 【原创】Codeforces 39A C*++ Calculations
- 云超融合数据中心 CloudFabric
- 论文研读-基于种群分布的两阶段自适应知识迁移多目标进化多任务
- 前端和Java后端分别需要学哪些技术?
- 对行人重识别(RE-ID)问题的初步了解(一)
- k8s双节点集群搭建详细教程
- android自动微信支付平台,Android实现微信支付功能
- scala编程_Scala可以带回编程的喜悦吗?