目录:

1.爬虫前的分析

因为要实现有道翻译的翻译功能,就需要找到它的接口,打开审查元素,来到网络监听窗口(Network),查看API接口。

我们可以找到有道翻译的API接口,同时是以Post方式提交

Data的内容Form Data

i:你好

from:AUTO

to:AUTO

smartresult:dict

client:fanyideskweb

salt:1503049820576

sign:f21c50e08db736608d3ec3899678a725

doctype:json

version:2.1

keyfrom:fanyi.web

action:FY_BY_CLICKBUTTION

typoResult:true

通过翻译'你好'和'hellow'的对比查看不同的地方

i:需要进行翻译的字符串,这个地方我们输入的是‘’你好‘’。

salt:当前的时间戳

action: 判断你是按回车提交或者点击按钮提交的方式

通过查看网页源代码的方式查看有道翻译的js文件,来查看salt和sign是怎么生成的。查看网页源代码找到js文件

找到js文件,然后点击这个文件,跳转到这个源文件中,然后全选所有的代码,复制下来打开站长工具,把代码格式化把格式化后的代码,复制下来,用sublime或者pycharm打开都可以,然后搜索salt,找到相关的代码

2.Python使用MD5加密字符串

1. 介于有道翻译使用了MD5加密,就对MD5加密进行了学习#导入md5加密所需模块

import hashlib

#创建md5对象

m = hashlib.md5()

#生成加密串,其中 password 是要加密的字符串

m.update('password')

#获取加密串

pw = m.hexdigest()

print(pw)

#打印结果

5f4dcc3b5aa765d61d8327deb882cf99

2 . 我们可以写成函数,直接传入要加密的字符串调用即可,由于传入的参数不是字符串会报错,所以应先对参数进行判断import hashlib

import types

def md5(str):

if type(str) is types.StringType:

m = hashlib.md5()

m.update(str)

return m.hexdigest()

else:

print(‘您传入的参数不是字符串’)

3.代码操作基于python3.5# -*- coding:utf-8 -*-

import urllib.request

import urllib.parse

import json

import time

import requests

import hashlib

class YoudaoFanyi:

def translate(self,key):

d = key

m = hashlib.md5()

u = 'fanyideskweb' #判断是网页还是客户端

# 由于网页是用的js的时间戳(毫秒)跟python(秒)的时间戳不在一个级别,所以需要*1000

f = str(int(time.time()*1000))

c = "rY0D^0'nM0}g5Mm1z%1G4"

#根据md5的方式:md5(u + d + f + c),拼接字符串生成sign参数。

m.update((u + d + f + c).encode('utf-8')) #生成加密串

data= {

'i':d,

'from':'AUTO',

'to':'AUTO', #判断是自动翻译还是人工翻译

'smartresult':'dict',

'client':u,

'salt':f, #当前时间戳

'sign':m.hexdigest(), #获取加密串

'doctype':'json',

'version':'2.1',

'keyfrom':'fanyi.web',

'action':'FY_BY_CLICKBUTTION', #判断按回车提交或者点击按钮提交的方式

'typoResult':'true'

}

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36',

'Origin':'http://fanyi.youdao.com/', #请求头最初是从youdao发起的,Origin只用于post请求

'Referer':'http://fanyi.youdao.com/', #Referer则用于所有类型的请求

}

#print(data)

#接口

post = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule&sessionFrom=null'

youdaojson = requests.post(post,headers = headers,data=data).json()

#print(youdaojson)

print('翻译的结果是:%s'%(youdaojson['translateResult'][0][0]['tgt']))

time.sleep(2)

if __name__== "__main__":

youdao = YoudaoFanyi()

while True:

key =input("请输入你要翻译的文字('quit':退出): ").strip()

if key=='quit':

break

youdao.translate(key)

实现翻译功能

python如何爬有道翻译_Python网络爬虫(八) - 利用有道词典实现一个简单翻译程序...相关推荐

  1. java爬取网页数据_Python网络爬虫实战(二)数据解析

    Python网络爬虫实战 (二)数据解析 本系列从零开始阐述如何编写Python网络爬虫,以及网络爬虫中容易遇到的问题,比如具有反爬,加密的网站,还有爬虫拿不到数据,以及登录验证等问题,会伴随大量网站 ...

  2. 爬虫python爬取页面请求_Python网络爬虫第三弹《爬取get请求的页面数据》

    一.urllib库 urllib是Python自带的一个用于爬虫的库,其主要作用就是可以通过代码模拟浏览器发送请求.其常被用到的子模块在Python3中的为urllib.request和urllib. ...

  3. python爬取有道词典_python 爬虫+有道词典实现一个简单翻译程序

    #coding=utf-8 importurllibimporturllib2importjson'''功能说明: 根据输入要翻译的文字,进行有道自动翻译: 实现中文->英文.英语及其他语言-& ...

  4. python动态爬取知乎_Python新手爬虫:爬取搜狗图片(动态)

    先上最后成功的源码: import requests import urllib import json from fake_useragent import UserAgent def getSou ...

  5. python如何爬有道翻译_如何利用Python网络爬虫来获取有道翻译翻译接口--手机版的哦!...

    [一.项目背景] 有道翻译作为国内最大的翻译软件之一,用户量巨大.在学习时遇到不会的英语词汇,会第一时间找翻译,有道翻译就是首选.今天教大家如何去获取有道翻译手机版的翻译接口. ​ image [二. ...

  6. python网络爬虫基础知识_Python网络爬虫基础知识

    一.网络爬虫 网络爬虫又被称为网络蜘蛛,我们可以把互联网想象成一个蜘蛛网,每一个网站都是一个节点,我们可以使用一只蜘蛛去各个网页抓取我们想要 的资源.举一个最简单的例子,你在百度和谷歌中输入'Pyth ...

  7. Python3网络爬虫教程8——有道在线翻译项目(JS加密)

    上接: Python3网络爬虫教程7--SSL数字证书 https://blog.csdn.net/u011318077/article/details/86538116 6. js加密(有道在线翻译 ...

  8. 有道翻译反反爬虫(python)

    有道翻译反反爬虫(python) 该博客创作于2021/6/30,之后有失效可能 作为一个初学者,花两天时间破解了有道翻译的反爬虫系统,故为之文以记之. 参考文章:博客1博客2 以上博客均已失效但有助 ...

  9. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

最新文章

  1. Hash冲突处理终极版
  2. C# 获取鼠标相对当前窗口坐标的方法
  3. Makefile中三个自动变量$^,$@,$
  4. 别再用Else语句写代码了!
  5. 《Python编程快速上手——让繁琐工作自动化》——2.5 控制流的元素
  6. 利用贝叶斯分类器进行文本挖掘---笔记
  7. Agile敏捷开发Planning Poker简介
  8. Silverlight 4 Tools中文版下载
  9. 软件License设计思路与实现方案
  10. 二叉树:二叉树的最近公共祖先
  11. Linux——Linux账号与群组
  12. python可视化库matplotlib_Python可视化库matplotlib(基础整理)
  13. 完数什么意思_数学中质数和合数是什么意思
  14. 硬盘主分区、扩展分区和逻辑分区
  15. 安装Zcashd Zcash-cli体验
  16. 用Python学《微积分B》(定积分)
  17. 中国科学院大学计算机学科评估,中国科学院大学学科评估结果排名
  18. OSChina 周四乱弹 —— 把青春献给身后那座辉煌的都市
  19. halcon10求周长
  20. The IIIustrated Word2vec

热门文章

  1. EXCEL 边框 去不掉的解决方法
  2. 云和恩墨校园招聘开始啦!
  3. 晚上不能入睡有什么办法改善?这些助眠好物你要知道
  4. CS231n系列之 Lecture1:Introduction
  5. Springboot - 处理LocalDateTime的入参和出参格式
  6. 【历史上的今天】3 月 11 日:谷歌推出 Google Voice;互联网先驱诞生日;Foursquare 上线
  7. 如何在CAD软件中绘制连续的导线?
  8. 安卓11客制需求:<MtkSettings:添加桌面设置,并且能够正常切换桌面APK>
  9. 用这个C语言骰子代码做选择
  10. “黑科技”(ipad + termius + 100 元的蓝牙键盘)