再见所有的翻译工具!我使用了有道智云+Python开发一个批量文档翻译工具,老大对我赞不绝口
文章目录
- 一、需求分析
- 二、已做好的批量文档翻译工具的使用
- 三、开发过程
- (一)个人开发者账号注册
- (二) 创建应用和实例
- (三)接口调用及代码实现
- 1、API接口介绍
- 3、批量文档翻译开发
- 四、总结
一、需求分析
需求:
最近有个任务,需要对一批文件进行汉译英的翻译
刚开始想着挺简单的呀,那就直接复制到翻译软件中,在复制出来呗。
有很多办法可以实现翻译:
可以使用谷歌翻译,这个完全免费的。但是不好的地方就是需要一个文档一个文档的进行导入。我几百个文件的话,估计手就要废掉了。
也可以使用网易有道词典:
对单个文档手工复制、粘贴的翻译方式过于繁琐
,考虑
到工作的重复性
和本人追求提高效率
、少动手
(懒)。
做为计算机行业的一份子,应该充分的利用好,不然技术不就白学了。我就利用的很充分。
我在网上找了几款翻译api,通过对比翻译的结果和学习成本,选择了**有道智云的服务
**,自己开发了一个批量翻译的小软件。详细记录一下使用和开发过程,后面的小伙伴们有相关需求,可以参考。
使用Python调用已有的接口的方法,自己实现一个批量翻译工具,一劳永逸。
我计划着连续更新一个月左右,把详细的整个过程都记录下来,也方便粉丝们使用。
二、已做好的批量文档翻译工具的使用
我这里开发批量文档翻译工具使用python作为开发工具,功能如下:
1)通过文件夹选择多个文档;
2)可以将多个文档的翻译结果存到目标文件夹下。
话不多说,看图↓↓↓↓↓
部分翻译结果展示(涉及工作内容的保密性,这里用荷塘月色作为样例):
可以先尝试一下,我上传到了百度网盘里:
可以关注我公众号:回复:20200910
即可拿到资源哦,同时也会同步到GitHub中,链接在文章末尾。
三、开发过程
下面开始详细介绍调用有道智云API接口的步骤和软件开发的过程:
(一)个人开发者账号注册
首先,需要注册个人的开发者账号。
在官网点击注册,然后填写个人资料。即可完成注册,官网地址:http://ai.youdao.com/gw.s
(二) 创建应用和实例
注册成功并登录后个人中心页面如下图,有道智云提供了自然语言翻译、文字识别、语音合成、语音测评等服务接口。 这些服务接口都是通过以实例的方式运行的,通过应用进行管理的。需要分别创建实例、创建应用,通过应用获取应用ID和应用密钥等信息。
我这里用到的是自然语言翻译服务,首先,需要分别创建一个应用、创建一个自然语音翻译的实例;其次,需要将实例绑定到应用上。最后,就可以通过应用的应用ID、应用密钥调用自然语音翻译api接口了。有道平台会对不同的实例、应用的使用情况进行记录、分析、收费。刚刚注册的体验者会有免费体验字数和50元的体验金哦(加客服貌似还会有额外的50元的)。
创建实例的步骤:
根据使用需求,选择对应服务(“自然语言翻译”/“文字识别OCR”/“语音合成TTS”/“语音识别ASR”/“智能语音评测”/“多平台编辑器”)->“创建实例”,按步骤完成实例创建。
创建应用并绑定实例(应用接口分为三种:API、安卓、ios接口):
点击“应用管理”->“我的应用”->“创建应用”,填写应用名称等相关信息,选择接入方式,并绑定我们所创建的实例,完成应用创建。我们这里用到的是API方式接入,安卓、ios接口需要根据提示填写相应的信息,详见官网新手指南。
应用创建成功后,可获取应用ID(appKey)和应用密钥等信息,这些信息是调用API接口必不可少的参数。
(三)接口调用及代码实现
1、API接口介绍
下面介绍API接口的调用方法
文本翻译API HTTPS地址:https://openapi.youdao.com/api
调用规则:在调用集成文本翻译API时,需遵循以下规则。
规则 | 描述 |
---|---|
传输方式 | HTTPS |
请求方式 | GET/POST |
字符编码 | 统一使用UTF-8 编码 |
请求格式 | 表单 |
响应格式 | JSON |
调用传参:调用API需要向接口发送以下字段来访问服务。
字段名 | 类型 | 含义 | 必填 | 备注 |
---|---|---|---|---|
q | text | 待翻译文本 | True | 必须是UTF-8编码 |
from | text | 源语言 | True | 参考下方 支持语言 (可设置为auto) |
to | text | 目标语言 | True | 参考下方 支持语言 (可设置为auto) |
appKey | text | 应用ID | True | 可在 应用管理 查看 |
salt | text | UUID | True | UUID |
sign | text | 签名 | True | sha256(应用ID+input+salt+curtime+应用密钥) |
signType | text | 签名类型 | True | v3 |
curtime | text | 当前UTC时间戳(秒) | true | TimeStamp |
ext | text | 翻译结果音频格式,支持mp3 | false | mp3 |
voice | text | 翻译结果发音选择 | false | 0为女声,1为男声。默认为女声 |
strict | text | 是否严格按照指定from和to进行翻译:true/false | false | 如果为false,则会自动中译英,英译中。默认为false |
签名生成方法如下:
signType=v3;
sign=sha256(应用ID
+input
+salt
+curtime
+应用密钥
);
其中,input的计算方式为:input
=q前10个字符
+q长度
+q后10个字符
(当q长度大于20)或input
=q字符串
(当q长度小于等于20);
返回结果格式:返回的结果是json格式,具体说明如下:
字段名 | 类型 | 含义 | 备注 |
---|---|---|---|
errorCode | text | 错误返回码 | 一定存在 |
query | text | 源语言 | 查询正确时,一定存在 |
translation | Array | 翻译结果 | 查询正确时,一定存在 |
basic | text | 词义 | 基本词典,查词时才有 |
web | Array | 词义 | 网络释义,该结果不一定存在 |
l | text | 源语言和目标语言 | 一定存在 |
dict | text | 词典deeplink | 查询语种为支持语言时,存在 |
webdict | text | webdeeplink | 查询语种为支持语言时,存在 |
tSpeakUrl | text | 翻译结果发音地址 | 翻译成功一定存在,需要应用绑定语音合成实例才能正常播放 否则返回110错误码 |
speakUrl | text | 源语言发音地址 | 翻译成功一定存在,需要应用绑定语音合成实例才能正常播放 否则返回110错误码 |
returnPhrase | Array | 单词校验后的结果 | 主要校验字母大小写、单词前含符号、中文简繁体 |
当返回的结果errorCode为 0 时说明调用成功,不为0时,则会出现不同含义的错误码。详细含义可查阅官方开发文档。
3、批量文档翻译开发
批量翻译demo使用python3实现,为了方便测试,我用tkinter做了简单的界面,用来读取待翻译文档,指定结果存储路径,为了最大化简化开发过程,降低测试的时间成本,目前只实现了读取.txt类型文件的方法。
整个demo分为三个文件,mainwindow.py,translate.py和translatetool.py,mainwindow为UI部分的代码,translate中实现了批量读取文档并翻译保存的逻辑,translatetool为根据示例代码改造后的翻译方法,需调用其他平台API时,亦可封装相应方法,增加了项目的扩展性。
mainwindow的元素如下:
root=tk.Tk()
root.title("netease youdao translation test")
frm = tk.Frame(root)
frm.grid(padx='50', pady='50')
btn_get_file = tk.Button(frm, text='选择待翻译文件', command=get_files)
btn_get_file.grid(row=0, column=0, ipadx='3', ipady='3', padx='10', pady='20')
text1 = tk.Text(frm, width='40', height='10')
text1.grid(row=0, column=1)
btn_get_result_path=tk.Button(frm,text='选择翻译结果路径',command=set_result_path)
btn_get_result_path.grid(row=1,column=0)
text2=tk.Text(frm,width='40', height='2')
text2.grid(row=1,column=1)
btn_sure=tk.Button(frm,text="翻译",command=translate_files)
btn_sure.grid(row=2,column=1)
其中translate_files()方法最终调用了translate类的translate_files()方法:
def translate_files():if translate.file_paths:translate.translate_files()tk.messagebox.showinfo("提示","搞定")else :tk.messagebox.showinfo("提示","无文件")
类translate定义如下:
import os
from translatetool import connectclass Translate():def __init__(self,name,file_paths,result_root_path,trans_type):self.name=nameself.file_paths=file_paths # 待翻译文件路径self.result_root_path=result_root_path # 翻译结果存储路径self.trans_type=trans_type# 翻译过程:读取文件-掉用有道api-解析返回信息-保存def translate_files(self):for file_path in self.file_paths:file_name=os.path.basename(file_path)file_content=open(file_path,encoding='utf-8').read()trans_reult=self.translate_use_netease(file_content)resul_file=open(self.result_root_path+'/result_'+file_name,'w').write(trans_reult)def translate_use_netease(self,file_content):result=','.join(connect(file_content,'zh-CH','EN')) # 翻译API返回结果为一个数组return result
调用有道API主要方法为connect(),根据API的签名信息等要求组成data并发送请求,解析返回的json:
# input输入待翻译字段,fromlanguage待翻译的语言,tolanguage翻译成的目标语言
# 返回翻译的字段
def connect(inputtext,fromlanguage,tolanguage):q=inputtextdata = {}data['from'] = fromlangdata['to'] = tolangdata['signType'] = 'v3'curtime = str(int(time.time()))data['curtime'] = curtimesalt = str(uuid.uuid1())signStr = APP_KEY + truncate(q) + salt + curtime + APP_SECRETsign = encrypt(signStr)data['appKey'] = APP_KEYdata['q'] = qdata['salt'] = saltdata['sign'] = signprint(data)response = do_request(data)print(response.content)j = json.loads(str(response.content, encoding="utf-8"))["translation"]return j
完整demo代码地址:https://github.com/LemonQH/BatchFileTraslationProgram/tree/master
得益于API的学习成本之低,接口调用部分的开发过程十分顺利,仅有一个小插曲,最开始调用API总是返回错误码206(即时间戳错误),最后发现是我的系统时间比标准时间慢了十分钟 - - #
四、总结
对于我此次的需要翻译的文档需求来说,有道智云赠送的字数和账户额度,已经够用了,但是如果想长期的使用下去,还是要付费的。最后发现,有道智云在个人主页中还提供了按小时统计当日实例调用次数和查询字符数和按天统计历史天数内实例的调用次数和字符数,对有需求的小伙伴,还可以记录查看自己接口的翻译量、实时调用量等状态。
如上是我整个demo的开发过程。整体来说从注册到调用有道智云API的过程还是比较顺利的,而且每一步都有官方的详细文档可以参照。以至于主要开发时间都分配给了tkinter排版(顺便吐槽下tkinter的“好用” :p)。
关注我,期待下次更新此系列吧。
再见所有的翻译工具!我使用了有道智云+Python开发一个批量文档翻译工具,老大对我赞不绝口相关推荐
- 再见所有的翻译工具!我使用了有道云+Python开发一个批量文档翻译工具!
一.需求分析 需求: 最近有个任务,需要对一批文件进行汉译英的翻译 刚开始想着挺简单的呀,那就直接复制到翻译软件中,在复制出来呗. 有很多办法可以实现翻译: 可以使用谷歌翻译,这个完全免费的.但是不好 ...
- python开发web运维工具_【实战小项目】python开发自动化运维工具--批量操作主机...
有很多开源自动化运维工具都很好用如ansible/salt stack等,完全不用重复造轮子.只不过,很多运维同学学习Python之后,苦于没小项目训练,本篇演示用Python写一个批量操作主机的工具 ...
- 使用python开发一个pdf合并工具
老婆给女儿整理打印学习资料,希望能从很多个pdf中抽取一些页码来合并成一个文件, 就希望我能写一个程序来实现这个功能.刚好最近正在学习python,就用python开发了一个 pdf合并工具,也算是学 ...
- Python简单主机批量管理工具
Python简单主机批量管理工具 一.程序介绍 需求: 简单主机批量管理工具需求:1.主机分组2.主机信息使用配置文件3.可批量执行命令.发送文件,结果实时返回4.主机用户名密码.端口可以不同5.执行 ...
- 微软的python开发工具_面向 Python 开发人员的 Azure 工具
面向 Python 开发人员的 Azure 工具Azure tools for Python developers 08/06/2020 本文内容 Visual Studio CodeVisual S ...
- python实战扫码下载_实例:用 Python 做一个扫码工具
原标题:实例:用 Python 做一个扫码工具 来自公众号: 新建文件夹X 链接:https://blog.csdn.net/ZackSock/article/details/108610957Pyt ...
- python制作一个桌面小工具
python实现一个桌面小工具,制作一个桌面的便签提醒工具 参考代码:https://github.com/cosven/memo 参考链接:https://www.jb51.net/article/ ...
- python 代码行数统计工具_使用Python设计一个代码统计工具
问题 设计一个程序,用于统计一个项目中的代码行数,包括文件个数,代码行数,注释行数,空行行数.尽量设计灵活一点可以通过输入不同参数来统计不同语言的项目,例如: # type用于指定文件类型 pytho ...
- 用Python写一个纪念日计算工具
用python写一个纪念日计算工具 前言 主要内容 日期计算函数 GUI布局 用pyinstaller打包生成.exe文件 打包后的.exe文件预览 运行结果 最后提前祝马英俊生日快乐吧~ 前言 纪念 ...
- 用Python做一个安全攻防工具:端口嗅探器(9)
传送门 本系列原创博文传送门: 用Python做一个安全攻防工具:端口嗅探器(1) 用Python做一个安全攻防工具:端口嗅探器(2) 用Python做一个安全攻防工具:端口嗅探器(3) 用Pytho ...
最新文章
- JAE京东云引擎Git上传管理代码教程和京东云数据库导入导出管理
- 安装jenkins插件的两种方法
- HCNA(012-211) 试题解析
- 使用:focus-within实现下拉菜单效果
- sap 分摊分配不产生会计凭证的原因_SAP软件的物料分类账功能
- c语言文件怎么在手机上打开,各位前辈这两个程序怎么在手机上运行
- java base64 加解密_java Base64加解密
- css实现发光的input输入框
- 神经进化算法——利用NEAT算法解决迷宫导航问题(基于NEAT-Python)
- 使用C++模板判断是否基本类型
- python中write的用法_python中write方法是如何使用?
- c#机器人聊天软件,C#制造简易QQ聊天机器人
- Tasker实现简易的Telegram新消息朗读
- spring cloud 微服务调用链
- 团队的英文翻译缩写_有感情的一起游戏的团队英文缩写
- gba模拟器ios_苹果手机iphone安装GBA游戏模拟器教程
- 〖Python 数据库开发实战 - Python与Redis交互篇⑯〗- 综合案例 - 新闻管理系统第二阶段完结 - “app.py“ 模块收尾及案例演示
- 将ppm格式转换为bmp格式的方式有哪些?
- win10自带邮箱怎么服务器,win10系统查看邮箱服务器信息的操作方法
- PS网页设计教程XVI——在PS中创建一个摩登实验室风格的网页设计
热门文章
- 中国首位00后CEO惹事了,被指抄袭开源项目,素材图都不换
- 怎么利用python输出星座符号_Python输出十二星座的符号
- 股价大涨61%,趣头条还能维持下一季增长吗?
- 进行maya特效的学习
- 循环实现自动售货机的学习笔记
- ckeditor5加字数_CKEditor5 输入文字时拼音和汉字同时输入问题
- 店店融合共振出的价值 才是苏宁的零售杀手锏
- 1688店铺列表接口-(item_search_seller-搜索店铺列表接口)
- Typora官网下载慢,用这个镜像
- 八爪鱼 ajax 循环采集,网页数据采集五大循环方式详解 - 八爪鱼采集器