前言

其实在以前就盯上有道翻译了的,但是由于时间问题一直没有研究(我的骚操作还在后面,记得关注),本文主要讲解如何用python调用有道翻译,讲解这个爬虫与有道翻译的js“斗争”的过程!

当然,本文仅供交流学习使用,适合自己做一些小东西娱乐,禁止用于商业用途!转载请注明微信公众号:bigsai。项目github地址:https://github.com/javasmall/python

在这里插入图片描述

分析

对于一个网站,首先肯定要的就是分析,分析其中的网页规则

分析url

进入有道翻译你会发现它的url是没有变化的,也就是说它的请求是通过ajax异步交互的。点击F12,很容易在XHR中找到这个交互的请求,点击查看信息,你会发现一串参数,其中有几个还是加密了的,啥salt盐啥的。先有个数。

在这里插入图片描述

分析参数01

可以大胆猜测:这个关键参数肯定在一块。我们搜索salt,然后正常的点击,格式化展开,在js中再次搜索salt。想找相关salt附近看看能不能找到断点进行调试!当然,最终你可以找到11个相关内容可以在每个附近进行断点调试。你这样乐意找到相关位置关键加密字段和函数。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

分析参数02

这次,咱们使用浏览器调用堆栈的功能,查看js执行的堆栈进行查找。直接点击到对应模块打断点即可进行观察。最终你会找到这个位置generateSaltSign(n)的这个函数,主要加密函数都在里面执行

在这里插入图片描述

在这里插入图片描述

加密分析

其实有道翻译的加密是比较简单的了,你一看,

不知道navigator.appVersion是啥是吧,我打印一看。就是浏览器头进行md5加密的嘛,可以固定不变的,也就是说这个bv(t)参数它可以是固定不变的。

这个ts不就是13位当前时间戳吗!

这个salt不就是时间戳后面加上100内的随机数吗,随便取一个就行。

这个sign不就是"fanyideskweb" + 翻译的字符串 + salt + "n%A-rKaT5fb[Gy?;N5@Tj"这么一串串数字然后md5加密的嘛!

通过后面的分析发现这些参数并没有变化。所以这次生成的是唯一的,但是有一个前提是5000字以内,如果超出5000字他会截取前5000字,这点需要注意一下。

在这里插入图片描述

模拟请求

注意点

既然有了上面的规则,那么咱们就可以通过这部分的规则和抓包的信息整合用python模拟完成js的事件,发送请求。这里面有几点需要注意的。

Fristly,你要搞定python中md5加密模块,时间time模块,能够做出一些等价的一些转化。刚好,py的hashlib和time模块 can fullfill 你。这个问题解决。

In addition,post请求的主体data字典需要进行url编码才能当成data发送请求发过去。

last but not least,解决完加密最重要的就是header,大家一定不要麻批大意。这个content—length,经过我的经验告诉我它如果填错了就会报错,并且不填经过抓包分析系统会自动生成。所以不要计算主体长度的,这个参数一定要省略。不放cookie会报错,放了cookie经过测试你会发现有些可以该甚至可有可无,有些必须遵从其样式。而cookie中必须遵从的就是OUTFOX_SEARCH_USER_ID=-1053218418@117.136.67.240即数字+@+ip形式地址。可能是为了检验而用,这个可以直接进行模拟。

在这里插入图片描述

请求代码

返回结果是一串json,直接拿即可!

import requests

import hashlib

import time

import urllib.parse

# 创建md5对象

def nmd5(str):

m = hashlib.md5()

# Tips

# 此处必须encode

# 若写法为m.update(str) 报错为: Unicode-objects must be encoded before hashing

# 因为python3里默认的str是unicode

# 或者 b = bytes(str, encoding='utf-8'),作用相同,都是encode为bytes

b = str.encode(encoding='utf-8')

m.update(b)

str_md5 = m.hexdigest()

return str_md5

def formdata(transtr):

# 待加密信息

headerstr = '5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'

#print(round(time.time()*1000))

bv=nmd5(headerstr)

ts=str(round(time.time()*1000))

salt=ts+'90'

strexample='fanyideskweb'+transtr+salt+'n%A-rKaT5fb[Gy?;N5@Tj'

sign=nmd5(strexample)

#print(sign)

i=len(transtr)

#print(i)

# print('MD5加密前为 :' + headerstr)

# print('MD5加密后为 :' + bv)

dict={'i':transtr,'from':'AUTO','TO':'AUTO','smartresult': 'dict',

'client':'fanyideskweb',

'salt':salt,

'sign':sign,

'ts':ts,

'bv':bv,

'doctype':'json',

'version':'2.1',

'keyfrom':'fanyi.web',

'action':'FY_BY_REALTlME'

}

return dict

url='http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'

header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36',

'Referer':'http://fanyi.youdao.com/',

'Origin': 'http://fanyi.youdao.com',

'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',

'X-Requested-With':'XMLHttpRequest',

'Accept':'application/json, text/javascript, */*; q=0.01',

'Accept-Encoding':'gzip, deflate',

'Accept-Language':'zh-CN,zh;q=0.9',

'Connection': 'keep-alive',

'Host': 'fanyi.youdao.com',

'cookie':'_ntes_nnid=937f1c788f1e087cf91d616319dc536a,1564395185984; OUTFOX_SEARCH_USER_ID_NCOO=; OUTFOX_SEARCH_USER_ID=-10218418@11.136.67.24; JSESSIONID=; ___rl__test__cookies=1'

}

input=input("请输入翻译内容:")

dict=formdata(input)

dict=urllib.parse.urlencode(dict)

dict=str(dict)

#dict=urllib.parse.urlencode(dict).encode('utf-8')

req=requests.post(url,data=dict,headers=header)

val=req.json()

print(val['translateResult'][0][0]['tgt'])

执行结果

在这里插入图片描述

结语

就这样,我们从0开始优雅的揭开有道翻译的面纱!你可以利用这个做一些有趣的事情(待续------)

当然,这个可能难度不大,对于老鸟老说很简单(勿喷),但是对于新手来说特别适合练手,如果感觉有问题或者不理解的可以通过公众号交流!当然,这个代码不知道能保存多久会失效。所以请抓紧收藏尝试!如果感觉可以还请奉献爱心点点赞!当然,这个只是我脑洞的一个开端,好玩的还在后面!

欢迎关注一波公众号:bigsai 一起学习,一起进步!长期分享更多乐趣!

有道python网课怎么样-如何用python“优雅的”调用有道翻译?相关推荐

  1. python网课什么平台好-python网课什么平台好

    学习计算机方面的网络课程当然要听听行业标杆谷歌怎么说.谷歌公司为了指导新鲜的程序猿们快速入行,开了一份网络课程学习清单Google Technical Development Guide.这份课程清单 ...

  2. python网课一般多少钱-Python培训网课一般学费多少?毕业生能承担吗?

    Python培训网课一般学费多少?Python培训网课学费一般在2万元以内,学费超过2万以上的不要考虑了.所学的课程内容大致相同,低价的培训机构缺乏优质的师资团队和实战项目.按照课程大纲.师资团队.学 ...

  3. python有道-如何用pythonquot;优雅的”调用有道翻译?

    前言 其实在以前就盯上有道翻译了的,但是由于时间问题一直没有研究(我的骚操作还在后面,记得关注),本文主要讲解如何用python调用有道翻译,讲解这个爬虫与有道翻译的js"斗争"的 ...

  4. python编程零基础免费网课-Python网课推荐——免费学习Python编程

    对于想要学习python的初学者,面对网上大量的学习素材无从下手.今天小编就整理了一份详细的python教学视频合集,希望能为初学者提供一些学习的方向. 1.python入门 课程推荐:零基础入门学习 ...

  5. python免费网课-Python网课推荐——免费学习Python编程

    对于想要学习python的初学者,面对网上大量的学习素材无从下手.今天小编就整理了一份详细的python教学视频合集,希望能为初学者提供一些学习的方向. 1.python入门 课程推荐:零基础入门学习 ...

  6. python网课一般多少钱-Python人工智能速成班泛滥 线上网课一个月2千

    最不受欢迎 / 最令人畏惧的编程语言有哪些?这些编程语言为什么令人畏惧?对它们的评价是否公正?在 StackOverflow 的 2020 年度开发者调查中,有一张表格,显示的是"最受欢迎. ...

  7. python调用有道翻译_如何用python“优雅的”调用有道翻译?

    前言 其实在以前就盯上有道翻译了的,但是由于时间问题一直没有研究(我的骚操作还在后面,记得关注),本文主要讲解如何用python调用有道翻译,讲解这个爬虫与有道翻译的js"斗争"的 ...

  8. python网课推荐-python网课什么平台好

    学习计算机方面的网络课程当然要听听行业标杆谷歌怎么说.谷歌公司为了指导新鲜的程序猿们快速入行,开了一份网络课程学习清单Google Technical Development Guide.这份课程清单 ...

  9. 风变编程python18_如何看待风变编程的 Python 网课?

    刚刚结束了风变python网课的基础语法和精进爬虫模块的学习,首先要感谢各位助教的陪伴和鼓励. 我大学的专业是经济学和金融,需要处理很多数据,在大学期间有学习一些经济学专用的软件来处理数据,但是毕业之 ...

最新文章

  1. 八大排序算法的 Python 实现
  2. Intel Optane(tm) Memory Pinning 无法加载DLLiaStorAfsServiceApi.dll:找不到指定模块。(异常来自HRESULT:0x8007007E)。
  3. 天梯赛 L1-027 出租 (20 分)
  4. 关于高级导数的一个不等式估计
  5. HttpContext
  6. 计算机网络基础+重点知识点
  7. VDI序曲八 网关与VDI发布
  8. 使用webpack.require优化vue项目的路由
  9. 汉字的动态编码与显示方案
  10. 【PL/SQL】匿名块、存储过程、函数、触发器
  11. 《Android游戏开发详解》一3.7 里程碑
  12. .NET Remoting 分布式开发实例思想(转)
  13. android 挖孔屏适配_娜迦丨不只满足Android 10版本的完美适配,更积极与鸿蒙系统超前对接...
  14. 梳理常见硬盘存储 I/O 接口相关简称
  15. 厉害了!小学生用大数据研究苏轼,结论出人意料
  16. window.print();去除页眉页脚及网址。
  17. 从0到10W粉,这一年我在csdn的成长之路
  18. 文件输出流,文件拷贝,资源释放
  19. 为什么要学习汇编语言?
  20. 腾讯云服务器安装java服务部署环境

热门文章

  1. python爬取资料_Python爬取FLASH播放器中的资料
  2. SpaceVim的配置+ e121:undefined variable:g:spacevim global config path
  3. 开发日记-20190918 关键词 努力
  4. (转载)TL-WN725N V3无线网卡驱动移植与wireless工具wpa_supplicant-2.6
  5. 深度学习将会变革NLP中的中文分词——TODO 待好好细看
  6. shared_ptr 用法
  7. SoC嵌入式软件架构设计之中的一个:系统内存需求评估
  8. mongodb教程二
  9. 中石油-高精度除法-java版
  10. ASP.Net 获取当前时间