这次我们模拟真实用户向服务器发送请求

爬虫步骤演示

  • 爬虫步骤演示
    • 浏览器真实用户向服务器发送请求
    • 模拟浏览器真实用户向服务器发送请求
    • 解析数据

爬虫步骤演示

浏览器真实用户向服务器发送请求

在有道翻译的在线翻译上使用翻译功能并查看浏览器是发送了什么数据给服务器,以便等等能模仿浏览器发送请求给服务器
在这里的网页使用了ajax技术异步向服务器发送请求,当点击翻译的时候,浏览器就向服务器发送请求

在浏览器按下F12,选中Network查看浏览器当前的相关网络请求信息


左下方选中翻译信息的请求

右下方查看浏览器当前请求发送的请求内容,可以看到浏览器的请求地址和请求方式还有请求数据,到时我们模仿浏览器发送请求给服务器时要用到这些数据


请求之后获得的服务器响应数据,因为在之前的请求头中设置了返回数据要求是json,所以返回来的数据为json格式

{"translateResult":[[{"tgt":"吻","src":"kiss"}]],"errorCode":0,"type":"en2zh-CHS","smartResult":{"entries":["","n. (Kiss) (匈牙利、美、罗马尼亚)基什(人名)\r\n","v. 吻,接吻;(风等)轻拂,轻触;(球)轻轻擦过(另一球)\r\n","n. 吻;(风等)轻拂;(一球与另一球)轻擦;小甜酥饼\r\n"],"type":1}}

将返回来的json整理一下,看得更加清楚

模拟浏览器真实用户向服务器发送请求

等待用户的输入

txt = input("请输入要翻译的内容:")

设置模拟浏览器发送请求给服务器时候用到的数据(这些数据由上一步获得)

 # 设置请求地址url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"# 设置请求头信息req_header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36',}# 设置请求数据data = {'i': txt,'from': 'AUTO','to': 'AUTO','smartresult': 'dict','client': 'fanyideskweb','salt': '15929110878565','sign': '1d1d9f0591adb16ac8785ce540208db6','ts': '1592911087856','bv': 'cc652a2ad669c22da983a705e3bca726','doctype': 'json','version': '2.1','keyfrom': 'fanyi.web','action': 'FY_BY_REALTlME'}

请求数据加载好了之后就开始发送请求,这里就使用到了requests模块里面的post函数,获取到响应对象

res = requests.post(url=url, data=data,headers=req_header)

利用响应对象获取响应码

res = requests.post(url=url, data=data,headers=req_header)

解析数据

Requests 中有一个内置的 JSON 解码器,利用json()函数处理 JSON 数据,转换为列表,操作列表中的元素

js = res.json()
print("翻译结果:" + js['translateResult'][0][0]['tgt'] + '\n')

此时运行查看结果,成功操作转换后的列表元素

Python爬虫小项目——实现英语翻译功能(四)相关推荐

  1. python爬虫小项目挣钱兼职,python程序员兼职平台

    python爬虫去哪接单 python爬虫接单的方式有两种一.接定制需求的单子爬虫定制的需求其实很多,比如 "爬取某某电商网站的评论",这类需求一般是按照爬取数据量的大小来收费,价 ...

  2. python爬虫小项目挣钱兼职高雅推荐日结_我用Python爬虫挣钱的那些事

    在下写了10年Python,期间写了各种奇葩爬虫,挣各种奇葩的钱,写这篇文章总结下几种爬虫挣钱的方式. 1.最典型的就是找爬虫外包活儿. 这个真是体力活,最早是在国外各个freelancer网站上找适 ...

  3. python爬虫小项目--飞常准航班信息爬取variflight(上)

    很久不更新博客,分享下最近一个小项目 飞常准 .飞常准是飞友科技旗下一个航班信息数据网络品牌.主要为用户提供航空相关数据.目前核心业务为航班动态和便宜机票搜索引擎.飞友科技旗下总有飞友网.飞常准.Va ...

  4. python爬虫小项目: 爬取百度贴吧帖子

    本文同样是基于静觅系列的python3.x版,具体步骤请前往静觅系列学习 关于encode()与decode()的问题:可以参照xanderzhang 及921800467的专栏 可完成静觅系列相同功 ...

  5. 【Python 爬虫小项目 01】租房数据

    思路描述: 整体观测:某网后台数据是自动从数据库里抓取的:比如我选中[深圳]-[南山区]-[竹子林],共有250套房源,每页呈现30套房源数据,这30套在每一次点击进去数据都会略有不同. url方面: ...

  6. 20201126时隔一年半更新 python爬虫小项目--飞常准航班信息爬取variflight(下)

    时隔一年多,再更新飞常准的信息抓取,看了下其实就是和去年的没有太多变更的地方.打开首页.发现页面变了 入口在哪里了?之前首页有城市和航班信息入口,一开始怀疑是浏览器内存不支持加载一些脚本,更换了其他内 ...

  7. Python小项目:实现日历功能

    Python小项目:实现日历功能 功能:(1)输入年月日,输出这一天是星期几 (2)输入年份,打印该年日历 months=[0,31,28,31,30,31,30,31,31,30,31,30,31] ...

  8. python爬虫项目-32个Python爬虫实战项目,满足你的项目慌

    原标题:32个Python爬虫实战项目,满足你的项目慌 爬虫项目名称及简介 一些项目名称涉及企业名词,小编用拼写代替 1.[WechatSogou]- weixin公众号爬虫.基于weixin公众号爬 ...

  9. 虎嗅 24 小时点赞器,一个案例附带一个爬虫技巧,Python 爬虫小课 7-9

    很多平台都有点赞功能,今天提供的这个思路可用于很多平台,希望可以掌握该技巧,实现你自己的点赞器.本案例目标为虎嗅 24 小时频道点赞. 爬虫小课系列文章导读链接 第一篇:Python 爬虫小课 1-9 ...

  10. 32个Python爬虫实战项目,满足你的项目慌(带源码)

    学习Python爬虫的小伙伴想成为爬虫行业的大牛么? 你想在网页上爬取你想要的数据不费吹灰之力么? 那么亲爱的小伙伴们肯定需要项目实战去磨练自己的技术,毕竟没有谁能随随便便成功! 小编前段时间精心总结 ...

最新文章

  1. 高铁转地铁不想重复安检?多地已有举措
  2. python内点法_Python_Day_02 str内部方法总结
  3. SSH之Hibernate总结篇
  4. 升级到 Tomcat 8 后 Cookie 可能出现的问题
  5. iLogtail使用入门-K8S环境日志采集到SLS
  6. 高速建成Android开发环境ADT-Bundle和Hello World
  7. perl 中文处理 乱码
  8. 王者峡谷一呼百应,弹幕“666”,背后都离不开长连接,如何实现千万级高性能的长连接网关?...
  9. 总结(6)--- python基础知识点小结(细全)
  10. 在thinkphp中引入自定义的敏感词库
  11. python 会议室预约系统解决方案_会议室预约管理系统方案书.pdf
  12. Java对接支付宝的支付、退款、提现
  13. 单片机课设中期报告_基于单片机的火灾自动报警系统 中期报告
  14. chrome 谷歌 浏览器 更新后页面布局变大处理
  15. 《优柔有情人》读后感6000字
  16. Vue缓存路由(keep-alive)以及新的生命周期
  17. 由电脑经常出故障,可见人类星际航行的不可能
  18. python3数据处理(一)-- 解析XML,Excle文件
  19. 2016年4月编程语言排行榜 Visual Basic正渐行渐远
  20. SqlServer-STUFF理解基础知识

热门文章

  1. linux读取触摸屏事件数据
  2. 我对“心即理,致良知,知行合一”和《王阳明四句教》的的理解。
  3. Zabbix监控网站
  4. 深度学习半年学习心得(如何入门)
  5. java web 自己开发NAS个人网盘、视频网站视频播放服务端大视频文件处理逻辑解决方案和思路
  6. 运营到底是做什么的?
  7. JavaScript求和函数
  8. ArcGIS亚洲字体(CJK)垂直显示
  9. HTTP 和 HTTPS 有什么区别?
  10. ExtJs4(3)——带搜索和操作按钮的表