【网络爬虫】实现有道翻译提取
利用python 实现有道翻译提取
原料
有道翻译网页:http://fanyi.youdao.com/
具备检查元素的浏览器:基本所有浏览器都有,推荐使用谷歌Chrome
Python版本2.7以上
按照以下操作
在左侧翻译栏中,加入输入你需要翻译的内容,点击Network按自动翻译按钮,在Name栏中选中一个以translate开头的(post方式提交)
关注 Request URL
关注from data (提交的表单数据)
代码
#-*- coding:utf-8-*-
import urllib
import json
import sys#解决UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe5 in position 108: ordinal not in range(128)
defaultencoding = 'utf-8'
if sys.getdefaultencoding() != defaultencoding:reload(sys)sys.setdefaultencoding(defaultencoding)content = raw_input("请输入需要翻译的内容:")url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=null'
data={}
data['i'] = content
data['from'] = 'zh-CHS'
data['to'] = 'en'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '1503458227455'
data['sign'] = 'a68a9d5b5868f2501eb445ded808cec4'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_CLICKBUTTION'
data['typoResult'] = 'true'
data = urllib.urlencode(data).encode('utf-8')
#print "打印数据:", data
response = urllib.urlopen(url, data)
html = response.read().decode('utf-8')
#print html
target = json.loads(html)
#print target
print ("翻译结果:%s" % (target['translateResult'][0][0]['tgt']))
【网络爬虫】实现有道翻译提取相关推荐
- python3爬虫有道翻译_一篇文章教会你利用Python网络爬虫获取有道翻译手机版的翻译接口...
[一.项目背景] 有道翻译作为国内最大的翻译软件之一,用户量巨大.在学习时遇到不会的英语词汇,会第一时间找翻译,有道翻译就是首选.今天教大家如何去获取有道翻译手机版的翻译接口. ![image](ht ...
- IT宅男利用Python网络爬虫获取有道翻译手机版翻译接口
[一.项目背景] 有道翻译作为国内最大的翻译软件之一,用户量巨大.在学习时遇到不会的英语词汇,会第一时间找翻译,有道翻译就是首选.今天教大家如何去获取有道翻译手机版的翻译接口. [二.项目目标] 多国 ...
- python爬虫模拟有道翻译
python爬虫模拟有道翻译 案例目的: 通过模拟有道翻译,介绍携带form表单发送post请求以及破解form表单中的加密数据. 案例实现功能: 模拟有道翻译,实现中英互译. 爬取过程分析: 找到目 ...
- 教你用Python爬虫自制有道翻译词典
Python爬虫能够实现的功能有很多,就看你如何去使用它了.今天小千就来教大家如何去利用Python爬虫自制一个有道翻译词典. 首先打开有道翻译页面,尝试输入hello,就出现翻译了,可以自动翻译.有 ...
- Python爬虫破解有道翻译
有道翻译是以异步方式实现数据加载的,要实现对此类网站的数据抓取,其过程相对繁琐,本节我以有道翻译为例进行详细讲解. 通过控制台抓包,我们得知了 POST 请求的参数以及相应的参数值,如下所示: 图1: ...
- 【Python爬虫】有道翻译
Hello,爬虫 直接贴代码 import urllib.requestimport time import random import hashlib # 上边三个模块是用于生成有道翻译的有效时间戳 ...
- tkinter+爬虫实现有道翻译桌面软件
这是连着上次的写的,不会怎么爬取的可以看看这个连接爬取有道翻译,但这个只能在python环境下使用,有时候我们不想在python环境下运行,想在任何windows平台下使用,要怎么做呢?其实很简单 i ...
- python bs4 find_all_网络爬虫(三)BS4提取之find_all
我们用selector方法对酷狗top500进行爬取,此方法提取数据很不健壮,当对方对html源码修改进行修改,这个爬虫就不能使用了,因为这方法是按照 html 树一层一层元素的选取,当有一个元素修改 ...
- 关于Python网络爬虫与信息提取,除了提取最好大学排名字段,还可以批量下载图片(同步学校名称)
这两天学习了中国大学:https://www.icourse163.org,实例6 中国大学排名,于是操作了下,由于嵩天老师提供的网页目前已经发生变化,给一起学习的小伙伴带来些困扰,按照老师教授的知识 ...
最新文章
- application/x-www-form-urlencoded与application/json区别以及遇到的坑
- 做乘法c语言,【code】C语言_实现输入的矩阵的乘法运算
- hive集群部署以及beeline和hive
- guido python正式发布年份_Python语言适合哪些领域的计算问题? (1.3分)_学小易找答案...
- php redis 设置,php设置redis扩展,你值得拥有
- Robot Framework自动化测试(一)---第一个脚本
- 热启动计算机的快捷键,电脑快捷键的用法
- 《嵌入式 – GD32开发实战指南》第4章 GD32启动流程详解(Keil版)
- 3dmax2018下载3dmax2018下载安装详细教程3dmax2018下载方法
- axis调用webservice服务
- WiFi 2.4G/5G/6G信道分布
- 手把手带你可视化分析 NBA 季后赛
- 计算机c盘可以删除的文件,电脑C盘上的文件哪些可以大胆删除的?
- sqlite3错误原因
- 报错:org.springframework.security.web.firewall.RequestRejectedException: The request was not ......
- 基于百度地图API在AI Studio上的卫星地图块图像处理与分类
- HBuilderX编译微信小程序时报错:WebAssembly.instantiate():
- 三个火枪手专题一:简单搜索
- 腾讯云从业者认证的作用是什么?考试包含哪些内容?
- 压缩 javascript文件js文件