使用python进行英语文献翻译

1. 前期准备

安装PyPDF2模块、申请百度翻译api。其中模块安装大家可以根据情况,因为很多模块我之前安装过,比如requests,所以现在都是直接用的,如果你在使用的过程中,缺少了摸个模块,你可以自己进行安装。

百度翻译api申请,你可以进入百度翻译开放平台进行注册申请,然后在开发者信息里面找到你的Appid以及秘钥。

这个秘钥后来进行翻译的时候回用的到。

2. 处理pdf- 提取文字

这个工作使用PyPDF2就可以搞定,主要使用的extractText函数进行pdf的文字抽取,具体代码如下:

from PyPDF2.pdf import PdfFileReader, PdfFileWriter, ContentStream
## 处理pdf
def getDataUsingPyPdf(filename):  pdf = PdfFileReader(open(filename, "rb"))  content = ""  num = pdf.getNumPages()for i in range(0, num):  extractedText = pdf.getPage(i).extractText()content +=  extractedText + "\n"  return content

其中filename就是你待处理pdf的位置,最终这个函数的返回值就是整个pdf的全文。

3. 使用百度翻译

百度翻译提供了接口供使用,你只需要把你的appid和秘钥拿到,然后传入正确的json串,百度翻译这个接口就会返回一个json串,你对这个json串进行分析就ok了。代码如下:

import requests
import string
import time
import hashlib
import json#init
api_url = "http://api.fanyi.baidu.com/api/trans/vip/translate"
my_appid = "你的Id"
cyber = "你的秘钥"def translate(word):#init salt and final_signsalt = str(time.time())[:10]final_sign = str(my_appid)+word+salt+cyberfinal_sign = hashlib.md5(final_sign.encode("utf-8")).hexdigest()#其中form和to可以区别en,zh构造请求参数paramas = {'q':word,'from':'en','to':'zh','appid':'%s'%my_appid,'salt':'%s'%salt,'sign':'%s'%final_sign}my_url = api_url+'?appid='+str(my_appid)+'&q='+word+'&from='+'zh'+'&to='+'en'+'&salt='+salt+'&sign='+final_signresponse = requests.get(api_url,params = paramas).contentcontent = str(response,encoding = "utf-8")json_reads = json.loads(content)return json_reads['trans_result'][0]['dst']+" "

这个函数功能就是传入一个英文字符串,然后返回一句中文。

3. 使用上面两个函数,进行文本处理

content = getDataUsingPyPdf("08095313.pdf")
clist = content.split(".")
i=0
while(i<clist.__len__()):print(translate.translate(clist[i].replace("\n"," ")))i+=1

其中我按照 . 把英文文章进行了分句,这样就可以用百度翻译函数进行单句的翻译。在翻译的过程中我也进行了replace(“\n”,” “),这样主要目的是有时候你的句子可能由于pdf转换,一句话被回车给隔开了,导致翻译的时候不准确。你也可以自己进行很多自定义处理,比如在读pdf的时候,把句子处理一下,都是可以的。我本次测试了效果还ok。下面贴出部分原文以及翻译后。

原文:

翻译后:

使用迅捷pdf翻译:

本次处理的结果是在控制台输出的,你可以重定向到txt,甚至写到pdf中。

参考:

百度翻译api调用

pdf处理

python进行英语文献翻译相关推荐

  1. java网上商城外文翻译_英语文献翻译网上商城java.doc

    英语文献翻译网上商城java.doc 时间:2019-05-15 作者: 文档介绍: 毕业设计(论文)外文翻译 Java and the If Java is, in fact, yet puter ...

  2. 计算机两万字符英语文献翻译,求一篇2万字符以上的工程类外文文献及翻译

    小_金猪. 2017.03.31 采纳率:27%    等级:12 已帮助:750人 毕业论文外文文献翻译要求 一.翻译的外文文献可以是一篇,也可以是两篇,但英文字符要求不少于 2 万 二. 翻译的外 ...

  3. CAJ转换为PDF+英语文献翻译

    一.CAJ转换为PDF 1.先将CAJ文件通过CAJViewer软件打开 2.点击文件的"打印"选项 3.选择第二个"导出为WPS PDF"或者是第五个选项都可 ...

  4. 计算机 英语 文献翻译,计算机类外文文献翻译_1.doc

    计算机类外文文献翻译_1 本科毕业论文 外文文献及译文 文献.资料题目:Core Java? Volume II–Advanced Features 文献.资料来源:著作 文献.资料发表(出版)日期: ...

  5. 高校复试计算机英语文献翻译,专业文献英语翻译复试.pdf

    专业英语复试题 -1 Mesocrystals(介晶) are a new class of nanostructured solid materials, which are most often ...

  6. 至今为止最令我惊喜的一款文献翻译工具!

    这是一款迄今为止让我最为惊喜的一款文献翻译工具,它已经成功的解除了我对于阅读文献的恐惧心理.本文,我们就来详细的介绍这款强大的翻译工具吧!文末有下载安装方式~ 前言 英语翻译,是我们在工作和学习中经常 ...

  7. python英语翻译-python制作英语翻译小工具代码实例

    这篇文章主要介绍了python制作英语翻译小工具代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 用python爬虫可以制作英语翻译小工具.来 ...

  8. php英文文献翻译,php外文文献翻译_英语论文

    <php外文文献翻译_英语论文>由会员分享,可在线阅读,更多相关<php外文文献翻译_英语论文(23页珍藏版)>请在人人文库网上搜索. 1.您遭骨焙隔洪洒侯印志窥礼席铂绝臭湛闷 ...

  9. 计算机英语介绍项目,【精品文档】614关于计算机专业Vue.js应用程序设计开发介绍简介概述的毕业设计论文英文英语外文文献翻译成品资料:了解Vue.js项目和工具(中英文双语对照)...

    1.本文是中英对照毕业设计论文外文文献翻译,下载后直接可用!省去您找文献.pdf整理成word以及翻译的时间,一辈子也就一次的事!文献引用作者出处信息:Freeman, Adam Pro Vue.js ...

  10. 英语论文文献翻译小窍门

    英语论文翻译 最近快毕业了嘛,然后毕业论文肯定是需要的,在做外文文献阅读时,感觉好麻烦,之后就去网上找了些资源,还找女票求助,最后发现有蛮多良心网站,可以快捷实现英文文献全片翻译的功能,重点是--免费 ...

最新文章

  1. 华为mate30会用鸿蒙嘛,华为Mate30安卓系统再遭限制,鸿蒙系统真的要应战了
  2. 实践重于理论——创建一个监控程序探测WCF的并发处理机制
  3. opencv连通域去除小块面积_晋中市建成区面积排名,榆次区最大,榆社县最小,来了解一下?...
  4. Rsyslog 日志相关内容
  5. android动画详解
  6. Myecplise Tomcat 启动很慢
  7. Linux中的head命令
  8. RTSP客户端模拟器(TCP方式,Python实现)
  9. Pytorch——Tensor合并+截取+拼接
  10. PAT 考试是什么?
  11. ROG 2022 款幻 13 评测
  12. MySQL中表的增删查改操作(CRUD)
  13. 如何区分自己mac电脑的CUP型号
  14. win10 打开控制面板 和 启用 Telnet 的方法
  15. 易语言零基础新手入门系列教程 第一课
  16. Excel在单元格输入内容,行自动添加边框
  17. SQLite Expert安装与注册
  18. 微信域名检测 腾讯微信域名检测的机制原理以及实现方式
  19. AI大神李沐开源新手剪辑神器!只看字幕就能剪视频,卡壳重复片段一键删除...
  20. 第 17 节 字段、属性、索引器、常量

热门文章

  1. java jco sap 重连_Java连接SAP,使用SAPJCO3.jar
  2. SAP接口编程 之 JCo3.0系列:JCoDestination
  3. 疯狂Java讲义(六)----第三部分
  4. hbase的快速下载
  5. 华为MAGICBOOK安装win10专业版,华为MAGICBOOK win10专业版X64下载
  6. Win11 蓝牙功能消失
  7. 中国城市网约车监管之政策走向与发展前景
  8. 思科路由器OSPF配置实例
  9. layui框架实战案例(9):layPage 静态数据分页组件
  10. laypage 独立控件使用 laypage 不出总页数