Python requests抓取有道翻译最新版破解js加密

Python requests抓取有道翻译最新版破解js加密

目标网站：http://fanyi.youdao.com/

1.寻找数据
F12 进去Network 调试多次，翻译后的数据放在 json里

数据放在接口下
2.找出js加密的数据
调试多次发现这三个参数会发生变化，
3.破解js加密

观察initiator发现加载的js代码，分析代码发现加密的参数在这里

‘ts’:就是Form Data里的’lts’, 不难发现 r获取的是当前时间的毫秒数并字符串化，i获取的是 r 拼接一个随机的（0， 10)的字符串。sign是由md5加密获取。剩下的请求表单参数就很明显了。bv是md5根据浏览器的版本加密的

4.请求头部Headers
User-Agent， Referer是必须的，另外还需要加上一个Cookie值（这里不加请求错误）
5.实现代码


class youDao(object):def __init__(self, msg):self.url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'self.msg = msgself.lts = self.get_lts()self.salt = self.get_salt()self.sign = self.get_sign()def get_salt(self):return self.lts + str(random.randint(0, 10))def get_sign(self):initial = 'fanyideskweb' + self.msg + self.salt + 'Tbh5E8=q6U3EXe+&L[4c@'# 加密前需要编码 否存可能会出现TypeError: Unicode-objects must be encoded before hashingreturn md5(initial.encode('utf-8')).hexdigest()def get_lts(self):return str(int(time.time() * 1000))def get_res(self):data = {'i': self.msg,'from': 'AUTO','to': 'AUTO','smartresult': 'dict','client': 'fanyideskweb','salt': self.salt,'sign': self.sign,'lts': self.lts,'bv': '3da01a09873456cfb5dba05f2124b148','doctype': 'json','version': '2.1','keyfrom': 'fanyi.web','action': 'FY_BY_CLICKBUTTION'}headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 ''(KHTML, like Gecko) Chrome/88.0.4324.150 Safari/537.36','Referer': 'http://fanyi.youdao.com/','Cookie': 'OUTFOX_SEARCH_USER_ID=-610384760@10.169.0.83'}resp = requests.post(self.url, headers=headers, data=data)return resp.json()['translateResult'][0][0]['tgt']

亲测有效，本文章全系对技术的兴趣爱好,欢迎大家学习交流。

Python requests抓取有道翻译最新版破解js加密相关推荐

python爬虫爬取有道翻译详解
这里我们使用python的urllib来实现首先,我们需要找到我们进行翻译时上传给服务器的数据. 我们可以通过查找审查元素中的Network这一栏目下,选择执行Post方法的选项. 在General ...
Python requests 抓取网页状态返回418(亲测)
是被网站反爬程序返回的解决: 添加请求头headers信息 import requests headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1 ...
python爬取有道翻译
python爬虫爬取有道翻译教程编写环境为了宝宝们能够正确读懂本教程,在正式开始前,宝宝们需要搭建的环境如下: 连接互联网的win10电脑,(win7也可以) Google浏览器(版本无要求) P ...
python爬虫实战之爬取有道翻译
文章目录介绍网页分析代码实战当我们学习python爬虫时我们需要做大量的练习,往后我会发布更多的python爬虫练习实战代码,进一步剖析爬虫的每一个细节介绍本次爬取的是有道翻译,利用pyt ...
基于python爬取有道翻译，并在线翻译
基于python爬取有道翻译,并在线翻译由于我也是爬虫新学者,有什么做的不对的请多加包涵我们需要使用的库如下 from urllib import request import urllib im ...
Python利用requests抓取页面源代码（基础）
Python利用requests抓取页面源代码(基础) Requests模块是一个用于网络访问的模块. 由于使用到的requests库为第三方库,需要事先对其进行安装 1.1安装requests (1 ...
Python爬虫实战，requests模块，Python实现抓取芒果TV弹幕
前言利用Python实现抓取芒果TV弹幕,废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: requests模块: pandas模块以及一些Python自带 ...
Python爬虫实战，requests模块，Python实现抓取腾讯视频弹幕评论
前言利用Python实现抓取腾讯视频弹幕,废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: requests模块: pandas模块以及一些Python自带 ...
python爬取有道翻译的代码_python 简单的调用有道翻译
代码 import json import requests # 翻译函数,word 需要翻译的内容 def translate(word): # 有道词典 api url = 'http://fan ...
Python爬虫实战，requests模块，Python实现抓取知乎热点话题
前言利用Python实现抓取知乎热点话题,废话不多说. 让我们愉快地开始吧~ 开发工具 Python版本: 3.6.4 相关模块: requests模块: re模块: pandas模块: lxml模 ...

Python requests抓取有道翻译最新版破解js加密

Python requests抓取有道翻译最新版破解js加密相关推荐

最新文章

热门文章

Python requests抓取有道翻译 最新版破解js加密

Python requests抓取有道翻译 最新版破解js加密相关推荐

最新文章

热门文章

Python requests抓取有道翻译最新版破解js加密

Python requests抓取有道翻译最新版破解js加密相关推荐