有道爬虫接口
基本思路:接受用户输入,以字符串形式通过爬虫接口连接到有道翻译,把网页反馈结果输出即可。
第一步先踩点,找到相关参数。有道翻译界面,鼠标右键点击审查元素(现在浏览器基本附带这个功能)。像这样输入一句话,找到NETWORK(网络)部分的POST请求(如上图红框部分)。右边消息头我们可以找到网址,我这里是请求网址部分。这是待会要用的爬虫网址。

点击右边的参数部分,可以看到一个字典的数据形式。其中的i键对应的值是我们请求翻译的内容。如图:

关于代理问题:有些网站加入了反爬机制,我们可以用本机的名称取代python,防止被检测出来禁止python访问。消息头下拉就可以找到我们主机的User-Agent.注意使用的时候要完整的代理,如果复制的时候中间有省略号可能会出现错误。

完整代码

import sys
import urllib.request
import urllib.parse
import json
import pytesseract
from PIL import Image#图片文字识别,要想识别中文则参数要加入lang='chi_sim'
realize_content=pytesseract.image_to_string(Image.open('F:/文字识别/4.png'),lang='chi_sim')
print('图片识别结果:',realize_content)#伪装一下user-Agent名称,防止被主机禁止
head={'User-Agent ':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:62.0) Gecko/20100101 Firefox/62.0'}#上图找到的请求网址,也就是爬虫要访问的网址。如果原来的网址http://fanyi.youdao.com
# /translate_o?smartresult=dict&smartresult=rule请求错误,就把中间的_o删掉。
url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'#完整的网站参数部分的字典,i键的值就是我们要输入的翻译内容
date={
'action': 'FY_BY_REALTIME',
'client': 'fanyideskweb',
'doctype':'json',
'from':'AUTO',
'i':realize_content,
'keyfrom':'fanyi.web',
'salt':'1538893285995',
'sign':'88f4c9c260cc8948e53ce19689fbdf8c',
'smartresult':    'dict',
'to': 'AUTO',
'typoResult': 'true',
'version' :'2.1',
}
#对date进行编码
date=urllib.parse.urlencode(date).encode('UTF-8')#网络请求返回的结果
req=urllib.request.Request(url,date,head)#打开网络请求返回的结果
response=urllib.request.urlopen(req)
#把网络返回的请求结果进行read
result=response.read().decode('utf-8')#翻译返回的结果被json数据结果封装了,需要导入json模块读出翻译的结果
target=json.loads(result)
target_list1=target["translateResult"][0]
target_list1_length=len(target_list1)
print('翻译结果为:',end='')
for i in range(target_list1_length):print('%s'% target["translateResult"][0][i]['tgt'])

文字识别图片
例如(电脑中的图片)

#文字识别图片,Image.open()第一个参数是图片的存放路径。识别返回内容是字符串的形式。
realize_content=pytesseract.image_to_string(Image.open('F:/文字识别/eat.png'),lang='chi_sim')

我把图片识别后的返回值当做用户输入值赋值给date中的i进行翻译。

程序运行识别后的结果和翻译的结果效果如下:

文字识别要用到pytesseract和pillow库以及安装Tesseract-OCR引擎。我是直接把图片识别后的内容赋值给date中的i,不想文字识别的可以直接用input()函数接受用户自己想输入的内容赋值给i就可以进行翻译。

爬虫有道翻译接口+图片文字识别相关推荐

  1. Python3 图片文字识别翻译——调用百度AI、百度翻译和有道翻译的API

    文章目录 Python3 图片文字识别翻译--调用百度AI.百度翻译和有道翻译的API 一.演示 二. API准备 三. 图片文字识别--调用百度AI文字识别API 四. 文字翻译 1. 百度翻译 请 ...

  2. python调用百度接口实现ocr识别_Python调用百度OCR实现图片文字识别的示例代码

    百度AI提供了一天50000次的免费文字识别额度,可以愉快的免费使用!下面直接上方法: 首先在百度AI创建一个应用,按照下图创建即可,创建后会获得如下: 创建后会获得如下信息: APP_ID = '* ...

  3. 免费OCR图片文字识别小工具,一键提取图片中文字,支持多语言翻译和发票识别

    最近用周末和下班后的时间,开发了一款图片文字识别的小程序( 扫描识字宝 ),可以直接拍照或者扫描识别图片上的文字,并支持提取成文档.还加上了图片翻译功能,支持图片上文字提取后翻译成多国语言.也加入了增 ...

  4. 调用百度ai接口实现图片文字识别详解

    调用百度ai接口实现图片文字识别详解 首先先介绍一下这篇博文是干嘛的,为了不浪费大家时间.公司最近和短视频公司合作,需要监控app的截图上的文字是否符合规范,也就是确保其没有违规的文字.到网上找了一些 ...

  5. 要如何图片文字识别翻译?这些软件能帮你

    生活中我们常会碰到要将图片中的文字进行翻译的情况,这个时候你是怎么做的?一个个对照去浏览器翻译吗?这样太浪费时间了.其实我们只需要借助一个图片识别翻译软件就可以轻松搞定我们的翻译工作.那么,哪些图片识 ...

  6. 阿里云 OCR 图片文字识别接口使用案例(java)

    阿里云 OCR 图片文字识别接口使用案例(java) 阿里云官方接口文档 前期需要完成 购买阿里云服务 购买服务 可以购买测试服务.每个阿里云用户可以购买1次免费的500次接口请求进行测试 购买完成之 ...

  7. Android图片文字识别(阿里OCR接口)

    最近使用了阿里云的OCR文字识别API 先来看看效果 我使用的是通用类文字识别,具体实现过程如下: 1.购买阿里云的通用类文字识别 目前是0元免费的,可以使用500次.购买成功后到->控制台-& ...

  8. 图片文字识别OCR模型免费API接口工具及DEMO

    jiaying系列 网页版演示地址:ai.moneymeeting.club 一.简介: paddleocr是一个开源的图片文字识别工具​. 目前我们提供的免费在线API支持png.jpg​文件格式. ...

  9. Android 图片文字识别DEMO(基于百度OCR)

    前言   OCR 是 Optical Character Recognition 的缩写,翻译为光学字符识别,指的是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,通过识别 ...

最新文章

  1. 导入excel文件处理流程节点的解决方案
  2. GetOpenFileName 选择文件夹的解决方法
  3. VMware虚拟机中,RHEL系统下挂载、卸载新硬盘的方法
  4. varnish 缓存php,Varnish Cache不会使用会话缓存PHP除非后端TTL被更改
  5. Anaconda:成功解决Anaconda下载时速度超慢(conda下载慢)的几种方法图文教程
  6. python和sqlserver_利用python实现mysql数据库向sqlserver的同步
  7. bytecode java_Java 字节码解读
  8. Python教学与学习过程中应注意的九句话
  9. 有序充电matlab仿真,电动汽车有序充电策略研究
  10. Android用户界面设计:布局基础
  11. 光纤基础知识;接口类型、光模块、光纤种类、
  12. RISC_V芯片架构
  13. ActiveX是什么?界面开发有哪些好用的ActiveX控件推荐?
  14. Verilog消除毛刺
  15. jetson nano笔记
  16. 【安卓 R 源码】Activity 启动流程及其生命周期源码分析
  17. android x86耗电,X86挑战ARM 29项测试揭秘鲜为人知的功耗
  18. mac使用u盘安装系统
  19. 二叉树,二叉树的归先序遍历,中序遍历,后序遍历,递归和非递归实现
  20. 删除链接文件 linux,rm 删除链接文件的问题

热门文章

  1. USB Type-C引脚解析 CC、DFP、UFP、DRP用途解析
  2. java集成RSA非对称加密数据传输
  3. wap push简介
  4. Matlab中极值I型分布(Gumbel分布)的evcdf和evpdf及evinv函数
  5. IC笔试牛客网verilog刷题总结四
  6. 分布式飞机机电综合系统半实物验证环境ETest
  7. 快应用官网 | 2020年端午假期工作安排
  8. html5网页流行色,Pantone 2018流行色:紫外光色(附紫色的UI设计作品)
  9. 【reverse 函数 python】
  10. HashMap和Iterator迭代器的小用法