英文不好一直是我的一个短板,尤其是在学习代码的阶段,经常需要查询各种错误,很是苦逼,一直就想自己做个翻译的脚本,省去打开网页的时间,但是查询之后发现网上的教程都是百度翻译改版之前的爬虫,不得已只好自己上手了!

目标:制作自己的翻译脚本

前期准备:pycharm、python3.6、库:requests、json

思路:

首先找到百度翻译的网页,抓到以下内容:该包内有输出文字的判断,比如输入中文自动翻译为英文,则返回“en”,反之则返回“cn”。

构造post访问url的data数据,用到3个参数:"query"、"from"、"to",from和to参数就是你输入的内容和返回的内容的语种,我们上一步已经获取到相关的参数了,所以用个判断分别返回to参数即可

Lan就是抓包后返回的内容,直接提取出来

然后注意,因为是访问移动端的url,所以用到的UA不能是电脑的ua了,需要自行查找手机端的ua,这里提供给大家一个:

{"User-Agent":"Mozilla/5.0(Linux; Android 5.1.1; Nexus 6 Build/LYZ28E) AppleWebKit/537.36 (KHTML, likeGecko) Chrome/63.0.3239.84 Mobile Safari/537.36"}

将需要翻译的内容提交后,网站返回的数据是json格式的内容,当翻译的文字大于1个时,会有每个关键字的翻译,这里也可以抓取下。

Josn内容如下:

{'errno': 0, 'from': 'zh', 'to': 'en','trans': [{'dst': 'Python learning communication group: 542110741','prefixWrap': 0, 'src': 'python学习交流群: 542110741', 'relation': [], 'result': [[0, 'Python learningcommunication group: 542110741', ['0|32'], [], ['0|32'], ['0|46']]]}], 'dict':[], 'keywords': [{'means': ['巨蛇,大蟒'], 'word': 'python'}, {'means': ['study', 'learn', 'emulate','learning'], 'word': '学习'}, {'means': ['exchange', 'interflow', 'interchange','alternating', 'AC (alternating current)', 'communion'], 'word': '交流'}]}

我们可以分别抓取'trans'和'keywords'的值,我们所需要的内容,就在这两个值里。

好了,直接上代码和运行结果

好了,内容到这里就完了~如果对大家有帮助,就关注下呗

python在线翻译脚本_用Python抓取百度翻译内容并打造自己的翻译脚本!相关推荐

  1. python 爬虫课程推荐_关于递归抓取的课程推荐

    Python爬虫包 BeautifulSoup 递归抓取实例详解概要:爬虫的主要目的就是为了沿着网络抓取需要的内容.它们的本质是一种递归的过程.它们首先需要获得网页的内容,然后分析页面内容并找到另一个 ...

  2. python在线搭建教程_理解python web开发,轻松搭建web app!

    大家好,今天分享给大家的是理解python web开发,轻松搭建web app,希望大家学有所获! 因为 python代码的优雅美观且易于维护这一特点,越来越多的人选择使用 Python做web开发. ...

  3. python淘宝爬虫_简单的抓取淘宝图片的Python爬虫

    写了一个抓taobao图片的爬虫,全是用if,for,while写的,比较简陋,入门作品. 从网页http://mm.taobao.com/json/request_top_list.htm?type ...

  4. 使用CURL构建爬虫,抓取百度百科内容

    实现这个功能的步骤: 首先打开百度百科,在搜索框输入"php"关键词,得到搜索列表,一般都是10条: 然后使用火狐的Firebug分析百度列表的内容组成,主要是html标签,发现去 ...

  5. python语言翻译-教你用Python抓取百度翻译

    最近一直在一个平台学习Python,所以分享下课程里面抓取百度翻译的操作.原理其实也很简单,就是将浏览器请求的操作我们用python进行模拟,从而获取到返回的数据,我们将返回的数据进行提取,从而得到我 ...

  6. 教你用Python抓取百度翻译

    最近一直在一个平台学习Python,所以分享下课程里面抓取百度翻译的操作.原理其实也很简单,就是将浏览器请求的操作我们用python进行模拟,从而获取到返回的数据,我们将返回的数据进行提取,从而得到我 ...

  7. python 百度词典_python在线抓取百度词典的翻译结果翻译单词

    这段代码通过抓取百度词典的翻译结果达到翻译单词的目的 这个小工具使用Python语言编写完成,其中使用到这 些类库(urllib,BeautifulSoup ),前者主要负责网络通讯方面,后者负责HT ...

  8. python爬取百度贴吧中的所有邮箱_使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号...

    原标题:使用 Python 编写多线程爬虫抓取百度贴吧邮箱与手机号 不知道大家过年都是怎么过的,反正栏主是在家睡了一天,醒来的时候登QQ发现有人找我要一份贴吧爬虫的源代码,想起之前练手的时候写过一个抓 ...

  9. python怎么爬虎牙_使用python爬虫框架scrapy抓取虎牙主播数据

    前言 本文利用python的scrapy框架对虎牙web端的主播.主播订阅数.主播当前观看人数等基本数据进行抓取,并将抓取到的数据以csv格数输出,以及存储到mongodb中 思路 观察虎牙网站后确认 ...

最新文章

  1. 解决putty中文乱码并远程访问linux界面功能
  2. 编程名言(有些趣味性)
  3. 2019.1.11英语笔记1
  4. js浮点数运算不精确 如何解决_解决 浏览器处理数字运算时精度丢失的方法
  5. 数据库水平切分的实现原理解析---分库,分表,主从,集群,负载均衡器
  6. [蓝桥杯2017初赛]跳蚱蜢-map标记+bfs+环形数组
  7. Java RESTful API集成测试
  8. 小白学jquery Mobile《构建跨平台APP:jQuery Mobile移动应用实战》连载四(场景切换)...
  9. Java基础教程:IO流与文件基础
  10. MATLAB 句柄函数记录——多变量
  11. [codeforces538E]Demiurges Play Again
  12. flask的各种装饰器
  13. WPF中DataGrid中的DataGridCheckBoxColumn用法(全选,全否,反选)
  14. 云服务器功能检验方法
  15. 猜拳java,猜拳小游戏(Java代码实现)
  16. 简历求职01:STAR法则
  17. 玉米社:SEM竞价搜索推广移动优先还是PC优先,怎么设置?
  18. 浪尖断更两天回家过年了!
  19. R语言读写中文编码方式
  20. 车内看车头正不正技巧_【交通安全提示】科二曲线行驶技巧图解,蜀黍手把手教你过关!...

热门文章

  1. 什么叫做java程序中的继承_【Java】基础16:什么叫继承?
  2. 案例解读:利用12c渐进式DASH分析ON CPU
  3. 迁移实战:一次AntDB(基于pgxl分布式架构的数据库)数据库迁移经验分享
  4. 2019年11月数据库流行度排行:前三甲大幅下跌 PM 应云而升 国产续领风云
  5. MySQL从零到一解读增量同步数据到elasticsearch canal adapter方式(binlog)实现
  6. 史上最全近百条Oracle DBA日常维护SQL脚本指令
  7. Oracle SQL性能优化40条,值得收藏
  8. 从Memcache转战Redis,聊聊缓存使用填过的“坑”
  9. MySQL 是如何实现RC事务隔离级别的
  10. 实现服务器和客户端数据交互,Java Socket有妙招