1.引言:

网上有很多的ocr识别图片转文字再翻译的软件。但是没有翻译日语的。于是想自己做一个对含有日语的图片进行识别并翻译为中文的小工具。这里提一下,如果看这篇文章的人只是希望找个选中文本并翻译的软件程序,那推荐看此链接程序。

https://github.com/copytranslator/CopyTranslator/wiki/Downloads-%E4%B8%8B%E8%BD%BD%E4%B8%8E%E5%AE%89%E8%A3%85

这个软件功能是复制文本然后自动翻译,支持日语、英语等多种语言。

如果还是希望实现截图翻译,请继续看,下文娓娓道来。

2.思路:

基本动作流程:

截图 ->对剪切板中图片的文字进行识别->翻译。

3.具体实现:

1).对需要翻译的内容截图。

截图可通过搭配其他软件来实现。使用QQ或者微信等截图工具截图到剪切板也行。或者自己开发也行。

这里,我用的是网上流行的微信的dll库来实现截图的。名字:PrScrn.dll。网上有下载,但好像都是32位的,看网上是用下面的代码来使用这个截图dll的。我运行的时候出错了。这里也贴一下,或许对于制作的人有参考。估计python 是32位的应该可以使用。或许有了解确切原因的请留言。

# #**********调用微信dll截图********************
def capture():import ctypestry:dll = ctypes.cdll.LoadLibrary('PrScrn.dll')except Exception as e:print("Dll load error: ")print(e)returnelse:try:dll.PrScrn(0)except:print("Sth wrong in capture!")return

因为电脑python是64的。后来改成python代码中运行,出现截图框了,截图反正是好用了。

os.system('rundll32 PrScrn.dll PrScrn')

另外是监视剪贴板内容,参照这个


def main():im = ImageGrab.grabclipboard()if 'image' in str(im):#print(im)pyperclip.copy('test')assert isinstance(im, object)im.save("ocr.png")img_path = os.path.join(os.getcwd(), "ocr.png")content = vcode2str(img_path)ui.setOcrText(str(content))#mytext=fanyi(content)mytext=my_translate(content)ui.setTransText(str(mytext))os.remove(img_path)time.sleep(2)else:pass#print("请检查是否正确截图后重试!")import win32con,win32gui
import win32clipboard as cb
class MyWindow():         #剪切板监听def __init__(self):#注册一个窗口类wc = win32gui.WNDCLASS()wc.lpszClassName = 'MyWindow'wc.hbrBackground = win32con.COLOR_BTNFACE+1wc.lpfnWndProc = self.wndProcclass_atom=win32gui.RegisterClass(wc)#创建窗口self.hwnd = win32gui.CreateWindow( class_atom, u'OCR',win32con.WS_OVERLAPPEDWINDOW,win32con.CW_USEDEFAULT,win32con.CW_USEDEFAULT,win32con.CW_USEDEFAULT,win32con.CW_USEDEFAULT, 0,0, 0, None)# 显示窗口# win32gui.ShowWindow(self.hwnd, win32con.SW_SHOWNORMAL)#消息处理def wndProc(self, hwnd, msg, wParam, lParam):if msg == win32con.WM_DESTROY:win32gui.PostQuitMessage(0)if msg == win32con.WM_DRAWCLIPBOARD: #当剪切板更新的时候收到这个消息main()return win32gui.DefWindowProc(hwnd, msg, wParam, lParam)

2).图片转文本(日语),OCR。

依靠百度开发平台的OCR来实现。具体注册过程就不写了,网上会找到。终点是要得到三个值。appID,API key, secret Key。下面程序要用。

另外,还要安装百度的sdk.

我用的是pycharm,如下安装即可。很方便。

对于OCR调试的话,百度开发平台官网有例子程序。如下,先运行看看。先确保自己目前申请和搭建的环境是可用的。

from aip import AipOcr""" 你的 APPID AK SK """
APP_ID = '123321'
API_KEY = 'vrUQ0123123123KsXIUT'
SECRET_KEY = 'm6zy123123123123123PGikQ'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)""" 读取图片 """
def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()image = get_file_content('C:\\Users\\Administrator\\Desktop\\AAA.bmp')""" 调用通用文字识别, 图片参数为本地图片 """
#client.basicGeneral(image);""" 如果有可选参数 """
options = {}
options["language_type"] = "CHN_ENG"
options["detect_direction"] = "true"
options["detect_language"] = "true"
options["probability"] = "true"""" 带参数调用通用文字识别, 图片参数为本地图片 """
result=client.basicGeneral(image, options)print(result)

详细参数设置请参照下面官网链接:比如设置其他语言的识别等等。

https://cloud.baidu.com/doc/OCR/OCR-Python-SDK.html#.E6.96.B0.E5.BB.BAAipOcr

3).日语翻译为中文。

本来想用百度翻译的。但是下面这个提交参数sig和token不知道怎么生成的。于是就放弃这个途径了。

还有一种方式是申请百度翻译的api.申请的时候看到需要填写公司。于是就没有申请了。

目前是用有道翻译的demo接口实现翻译的。

下面是用有道翻译的代码。

def my_translate(in_str):import requestsimport jsonurl = "https://aidemo.youdao.com/trans"data = {"q": in_str,"from": "ja","to": "zh-CHS"}headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36","Referer": "https://ai.youdao.com/product-fanyi.s"}response = requests.post(url, data=data, headers=headers)html_str = response.content.decode()  # json字符串dict_ret = json.loads(html_str)ret = dict_ret["translation"]print("翻译结果是:", ret)print("\n")return ret

4.完成代码:

# coding:utf-8
import pyperclip
import os
import time
from PIL import Image,ImageGrab
import subprocess
from aip import AipOcr
#-----------------------UI begin--------------------------------------------------# Form implementation generated from reading ui file 'snip_translate.ui'
#
# Created by: PyQt5 UI code generator 5.10.1
#
# WARNING! All changes made in this file will be lost!from PyQt5 import QtCore, QtGui, QtWidgetsclass Ui_MainWindow(object):def setupUi(self, MainWindow):MainWindow.setObjectName("MainWindow")MainWindow.resize(1309, 892)self.centralwidget = QtWidgets.QWidget(MainWindow)self.centralwidget.setObjectName("centralwidget")self.pushButton_jietu = QtWidgets.QPushButton(self.centralwidget)self.pushButton_jietu.setGeometry(QtCore.QRect(10, 10, 91, 41))self.pushButton_jietu.setObjectName("pushButton_jietu")self.pushButton_cptext = QtWidgets.QPushButton(self.centralwidget)self.pushButton_cptext.setGeometry(QtCore.QRect(10, 60, 91, 41))self.pushButton_cptext.setObjectName("pushButton_cptext")self.pushButton_cptext.clicked.connect(self.cptext)self.pushButton_jietu.clicked.connect(self.jietu)self.textEdit = QtWidgets.QTextEdit(self.centralwidget)self.textEdit.setGeometry(QtCore.QRect(690, 40, 611, 801))self.textEdit.setVerticalScrollBarPolicy(QtCore.Qt.ScrollBarAlwaysOn)self.textEdit.setHorizontalScrollBarPolicy(QtCore.Qt.ScrollBarAlwaysOff)self.textEdit.setLineWrapColumnOrWidth(0)self.textEdit.setObjectName("textEdit")self.textEdit_ocr = QtWidgets.QTextEdit(self.centralwidget)self.textEdit_ocr.setGeometry(QtCore.QRect(120, 40, 541, 801))self.textEdit_ocr.setVerticalScrollBarPolicy(QtCore.Qt.ScrollBarAlwaysOn)self.textEdit_ocr.setHorizontalScrollBarPolicy(QtCore.Qt.ScrollBarAlwaysOff)self.textEdit_ocr.setObjectName("textEdit_ocr")self.label = QtWidgets.QLabel(self.centralwidget)self.label.setGeometry(QtCore.QRect(320, 10, 121, 21))font = QtGui.QFont()font.setFamily("Aharoni")font.setPointSize(14)font.setBold(True)font.setWeight(75)self.label.setFont(font)self.label.setObjectName("label")self.label_2 = QtWidgets.QLabel(self.centralwidget)self.label_2.setGeometry(QtCore.QRect(890, 10, 121, 21))font = QtGui.QFont()font.setFamily("黑体")font.setPointSize(14)font.setBold(False)font.setWeight(50)self.label_2.setFont(font)self.label_2.setObjectName("label_2")MainWindow.setCentralWidget(self.centralwidget)self.menubar = QtWidgets.QMenuBar(MainWindow)self.menubar.setGeometry(QtCore.QRect(0, 0, 1309, 23))self.menubar.setObjectName("menubar")MainWindow.setMenuBar(self.menubar)self.statusbar = QtWidgets.QStatusBar(MainWindow)self.statusbar.setObjectName("statusbar")MainWindow.setStatusBar(self.statusbar)self.retranslateUi(MainWindow)QtCore.QMetaObject.connectSlotsByName(MainWindow)def retranslateUi(self, MainWindow):_translate = QtCore.QCoreApplication.translateMainWindow.setWindowTitle(_translate("MainWindow", "MainWindow"))self.pushButton_jietu.setText(_translate("MainWindow", "截图"))self.pushButton_cptext.setText(_translate("MainWindow", "复制文本"))self.label.setText(_translate("MainWindow", "识别结果"))self.label_2.setText(_translate("MainWindow", "译文"))def cptext(self, MainWindow):passdef jietu(self,MainWindow):os.system('rundll32 PrScrn.dll PrScrn')def setTransText(self, str):self.textEdit.setPlainText(str)def setOcrText(self, str):self.textEdit_ocr.setPlainText(str)
#-----------------UI end--------------------------------------------------------#**********图片处理********************
def vcode2str(img_url):""" 你的 APPID AK SK """APP_ID = '123123123'API_KEY = 'vr123123123KsXIUT'SECRET_KEY = 'm6123123123123123123kQ'client = AipOcr(APP_ID, API_KEY, SECRET_KEY)# """ 读取图片 """def get_file_content(filePath):with open(filePath, 'rb') as fp:return fp.read()# image = get_file_content('YZM.jpg')image = get_file_content(img_url)""" 调用通用文字识别, 图片参数为本地图片 """client.basicGeneral(image);""" 如果有可选参数 """options = {}options["language_type"] = "JAP"options["detect_direction"] = "false"options["detect_language"] = "false"options["probability"] = "false"""" 带参数调用通用文字识别, 图片参数为本地图片 """a=client.basicGeneral(image, options)length = len(a['words_result'])b = ""for i in range(length):b = b + a['words_result'][i]["words"]print("图片文本: " + b)with open("original.txt",'w+') as fp:#    fp.write(b)#print("文字识别部分已保存到本地")#print(b)fp.close()return b# #**********调用微信dll截图********************
def capture():import ctypestry:dll = ctypes.cdll.LoadLibrary('PrScrn.dll')except Exception as e:print("Dll load error: ")print(e)returnelse:try:dll.PrScrn(0)except:print("Sth wrong in capture!")returndef main():im = ImageGrab.grabclipboard()if 'image' in str(im):#print(im)pyperclip.copy('test')assert isinstance(im, object)im.save("ocr.png")img_path = os.path.join(os.getcwd(), "ocr.png")content = vcode2str(img_path)ui.setOcrText(str(content))#mytext=fanyi(content)mytext=my_translate(content)ui.setTransText(str(mytext))os.remove(img_path)time.sleep(2)else:pass#print("请检查是否正确截图后重试!")import win32con,win32gui
import win32clipboard as cb
class MyWindow():         #剪切板监听def __init__(self):#注册一个窗口类wc = win32gui.WNDCLASS()wc.lpszClassName = 'MyWindow'wc.hbrBackground = win32con.COLOR_BTNFACE+1wc.lpfnWndProc = self.wndProcclass_atom=win32gui.RegisterClass(wc)#创建窗口self.hwnd = win32gui.CreateWindow( class_atom, u'OCR',win32con.WS_OVERLAPPEDWINDOW,win32con.CW_USEDEFAULT,win32con.CW_USEDEFAULT,win32con.CW_USEDEFAULT,win32con.CW_USEDEFAULT, 0,0, 0, None)# 显示窗口# win32gui.ShowWindow(self.hwnd, win32con.SW_SHOWNORMAL)#消息处理def wndProc(self, hwnd, msg, wParam, lParam):if msg == win32con.WM_DESTROY:win32gui.PostQuitMessage(0)if msg == win32con.WM_DRAWCLIPBOARD: #当剪切板更新的时候收到这个消息main()return win32gui.DefWindowProc(hwnd, msg, wParam, lParam)
def my_translate(in_str):import requestsimport jsonurl = "https://aidemo.youdao.com/trans"data = {"q": in_str,"from": "ja","to": "zh-CHS"}headers = {"User-Agent":"Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Mobile Safari/537.36","Referer": "https://ai.youdao.com/product-fanyi.s"}response = requests.post(url, data=data, headers=headers)html_str = response.content.decode()  # json字符串dict_ret = json.loads(html_str)ret = dict_ret["translation"]print("翻译结果是:", ret)print("\n")return retif __name__ == '__main__':import sysapp = QtWidgets.QApplication(sys.argv)MainWindow = QtWidgets.QMainWindow()ui = Ui_MainWindow()ui.setupUi(MainWindow)MainWindow.show()mw = MyWindow()cb.SetClipboardViewer(mw.hwnd) #注册为剪切板监听窗口win32gui.PumpMessages()sys.exit(app.exec_())

使用效果:

原图片:

图片文本: 水没した際の応急処置水抜き内部に侵入した水を抜いてください。2.水洗い…19ページ「海での使用後の基本的なメンテナンス順序」をご参照ください。3.乾燥…19ページ「海での使用後の基本的なメンテナンス順序」をこ参照ください。4.オイル注油…16~17ページ「注油についてのご注意」をご参照ください。オイルの付け過ぎはかえって回転を悪くする場合があります。※長く噴霧させると逆流します。決してグリススプレーは使用しないでください●お願い以上はあくまで応急処置です。不意に水没された場合は、できるだけ早く当社のメンテナンスを受けられるよう、最寄りの小売店にお預けくださいa※メンテナンス価格はおおよそ¥3,500プラス部品代になりますが、状態によって異なります。

翻译结果是: ['请在水中进行应急处理拔出进入内部的水。2.水洗……请参照19页“在海使用后的基本维护顺序”。3.干燥……请参照19页“在海使用后的基本维护顺序”。4.加油!请参照16~17页“关于加油的注意”。如果你涂太多油,反而会造成旋转速度变差。※长时间喷雾的话逆流。绝对不要使用润滑剂●拜托以上的话只是应急处理。如果是突然被水淹没的话,为了能尽早接受本公司的维修,请寄放在最近的零售店。a *维护价格大约为3,500加的零部件价格,根据状态不同会有所不同。']

感谢大神https://github.com/1061700625/OCR, 代码主体是参照这个的,微信dll在里面有下载。

日语截图翻译软件(百度ocr+python3+pyqt5)相关推荐

  1. php验证码百度ocr识别,利用百度OCR实现验证码自动识别

    在爬取网站的时候都遇到过验证码,那么我们有什么方法让程序自动的识别验证码呢?其实网上已有很多打码平台,但是这些都是需要money.但对于仅仅爬取点数据而接入打码平台实属浪费.所以百度免费ocr正好可以 ...

  2. python 百度识图_python截图+百度ocr(图片识别)+ 百度翻译

    python截图+百度ocr(图片识别)+ 百度翻译 一直想用python做一个截图并自动翻译的工具,恰好最近有时间就在网上找了资料,根据资料以及自己的理解做了一个简单的截图翻译工具.整理一下并把代码 ...

  3. python 百度识图_python截图+百度ocr(图片识别)+ 百度翻译(可选择翻译语言)...

    一直想用python做一个截图并自动翻译的工具,恰好最近有时间就在网上找了资料,根据资料以及自己的理解做了一个简单的截图翻译工具.整理一下并把代码放在github给大家参考.界面用python自带的G ...

  4. python截图识别文字_用百度ocr+微信截图实现文字识别

    作用:将图片中的文字识别出来 一.调用微信截图dll控件 将微信截图插件复制到项目文件,使用ctypes加载(胶水语言就是给力) def capture(): try: dll = ctypes.cd ...

  5. Qt5实现可配置截图及基于百度OCR自动识别标题保存文件

    需求:当我在看视频学习的时候,需要屏幕指定区域的内容保存起来,采用常见的XX截图软件,你需要选择区域选择路径保存,把文件命名为有意义的名称,效率极其低下.作为一名计算机专业人员强调思考能力.动手能力和 ...

  6. Python基于百度OCR的疫情防控截图自动分析检查

    通过腾讯文档收集人员信息,下载后,使用Python基于百度OCR对填报的疫情防控截图信息进行识别和统计分析,5分钟搞定每天人工1小时的检查工作量,提高效率,还提高准确率. 前言 疫情期间,各地.各单位 ...

  7. 用Python编写百度ocr图像识别程序

    涉及的知识点:Python.调用百度API.PyQt5 运行环境:Mac+Python3.7+PyQt5 程序截图: 实现步骤: 第一步:获得自己的百度OCR的AK和SK 1.利用百度 AI 开发平台 ...

  8. 百度OCR(文字识别)服务使用入坑指南

    百度OCR使用入坑指南 一.背景:什么是OCR 二.在线调用百度api接口 1. 注册百度智能云账号,创建应用获取key 2. 调用api发送请求,获取文字识别结果 2.1 构造请求 2.2 识别结果 ...

  9. 有这个OCR程序,不用再买VIP了,Python 调用百度OCR API

    最近学习,很多东西都是视频,截图后,又想做成文档保存起来. 刚开始不多,打一下字就很快解决了. 随着时间的推移,现在越来越多的图了,管理起来确实不方便,打字有时也不能很快的解决. 所以就弄了个OCR. ...

最新文章

  1. jenkins构建一个maven项目[五]
  2. 关卡设计快速入门_3. 创建一个新关卡
  3. 2018.12.15 bzoj3676: [Apio2014]回文串(后缀自动机)
  4. 用友ERP服务器的连接
  5. 太极团队内部邮件曝光:iOS8完美越狱重大突破
  6. winform实现Echart统计图(基于webBrowser)
  7. EditPlus注册码在线生成,强大
  8. Android Camera 3D效果
  9. negative binomial(Pascal) distribution —— 负二项式分布(帕斯卡分布)
  10. USB大容量存储设备禁用后恢复不了问题解决方案
  11. (报错解决)Exception encountered during context initialization
  12. 5个实力超群的手机APP,有这几个足够用了(系统类、阅读类)
  13. Oracle中Blob转换成Clob
  14. SQL server 升序与降序
  15. 舆情发展规律如何把控?
  16. 2020/2/23如何高效使用Axure绘制原型图
  17. 视频中地点位置标题文字标记介绍动画AE字幕模板
  18. 「镁客·请讲」小不点刘筱璇:新制造时代,用3D打印让世界个性起来
  19. 60个相见恨晚的神器工具
  20. 物联网毕设选题 - 单片机智能远程宠物喂养系统(物联网 esp8266 stm32)

热门文章

  1. KB 与 kb 的区别
  2. ipencil 无法与iPad配对
  3. 观察 | 经济学诺奖的启示:金融科技的核心任务是什么?
  4. 2021届毕业生还没找到Android开发工作,看这一篇就够了!
  5. 有什么软件可以搜JAVA题答案_可以搜简答题答案及解析的软件app或者公众号有吗?...
  6. 深度学习之空洞卷积(Dilated/Atrous Convolution)
  7. 杀不死的人狼——我读《人月神话》(一)
  8. 2021年度软件企业 100 强榜单(附全名单)看看有你家公司没
  9. 计算机设备预计净残值,电子设备折旧年限及残值率
  10. 普通的单模光纤和单模光纤跳线是否可以达到万兆速度?