python爬百度翻译-Python爬取百度翻译(利用json提取数据)
本篇文章给大家带来的内容是关于Python爬取百度翻译(利用json提取数据),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助。
工具:Python 3.6.5、PyCharm开发工具、Windows 10 操作系统
说明:本例为实现输入中文翻译为英文的小程序,适合Python爬虫的初学者一起学习,感兴趣的可以做英文翻译为中文的功能,如单词查询功能等。推荐使用谷歌浏览器或火狐浏览器检查元素。使用之前需要先安装模块:pip
install request pip install json。
数据提取方法:json
1、数据交换格式,看起来像Python类型(列表,字典)的字符串
2、使用json之前需要导入
3、json.loads
(1)、把json字符串转化为Python类型
(2)、json.loads(json字符串)
4、json.dumps
(1)、把Python类型转化为json字符串
(2)、json.dumps({})
(3)、json.dumps(ret1,ensure_ascii=False,indent=2)
ensure_ascii让中文显示成中文
indent:能够让下一行在上一行的基础上空格
代码:
import requests
import json
url = "https://fanyi.baidu.com/basetrans"
query_str = input("请输入要翻译的中文:")
data = {
"query":query_str,
"from":"zh",
"to":"en"}
headers = {
"User-Agent": "Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1",
"Referer": "https://fanyi.baidu.com/?aldtype=16047&tpltype=sigma"
}
response = requests.post(url,data=data,headers=headers)
html_str = response.content.decode()#json字符串
#json数据交换格式,使用json之前需要导入
#把json字符串转化为Python类型
dict_ret = json.loads(html_str)
#print(dict_ret)
#print(type(dict_ret))
ret = dict_ret["trans"][0]["dst"]
print("翻译结果是:",ret)
运行效果:
以上就是Python爬取百度翻译(利用json提取数据)的详细内容,更多请关注php中文网其它相关文章!
本文转载于:博客园,如有侵犯,请联系a@php.cn删除
python爬百度翻译-Python爬取百度翻译(利用json提取数据)相关推荐
- Python办公自动化实践1:从多个excel表中提取数据并汇总到一个工作表页中,表格,抽取,sheet
Python办公自动化实践1:从多个excel表中提取数据并汇总到一个工作表页中,表格,抽取,sheet 发表时间:2020-04-26 问题:从当前目录或子目录中查询符合条件的excel表格,并从这 ...
- python爬取百度搜索_Python-Scrapy抓取百度数据并分析
抓取智联招聘和百度搜索的数据并进行分析,使用visual studio编写代码mongodb和SQLServer存储数据.使用scrapy框架结合 selenium爬取百度搜索数据,并进行简要的数据的 ...
- python类百度百科_Python抓取百度百科数据
抓取策略 确定目标:确定抓取哪个网站的哪些页面的哪部分数据.本实例抓取百度百科python词条页面以及python相关词条页面的标题和简介. 分析目标:分析要抓取的url的格式,限定抓取范围.分析要抓 ...
- php抓取百度搜索百度快照,php抓取百度快照、百度收录、百度热词程序代码,抓取百度快照_PHP教程...
php抓取百度快照.百度收录.百度热词程序代码,抓取百度快照 /* 抓取百度收录代码 */ function baidu($s){ $baidu="http://www.baidu.com/ ...
- matlab如何取对数坐标,利用Matlab提取图片中曲线数据(线性修正,支持对数坐标)
利用Matlab提取图片中曲线数据 前一段时间看到一篇文章"利用Matlab提取图图片中的数据",觉得思路挺好,遂下载下来研究了一番,发现作者所编写的程序没有考虑原始图片非水平放置 ...
- python爬去百度音乐_Python抓取百度音乐。
今天挑战下百度音乐抓取,先用Chrome分析下请求的链接. 最关键的就是这个链接 http://play.baidu.com/data/music/songlink 请求这个带上songid就能返回给 ...
- 代理php爬百度快照,php抓取百度快照、百度收录、百度热词程序代码
$domain = "http://www.hzhuti.com/nokia/5230/ *欲查询的域名*/ $site_url = 'http://www.baidu.com/s?wd=s ...
- python爬虫4:json提取数据
JSON JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式.它基于 ECMAScript(European Computer Manufact ...
- 如何使用矢量图形数据导出可以在高德百度等互联网地图上加载的JSON格式数据
本文以广东省行政区划为例介绍如何使用矢量图形数据导出可以在高德百度等互联网地图上加载的省级行政区划边界JSON数据. 第一步用GIS相关工具,如ArcGIS.MapGIS.QGIS等工具加载广东省域的 ...
最新文章
- 设计模式学习每天一个——Factory模式 和 Abstract Factory模式
- 长尾关键词挖掘工具和使用方法
- 【Nginx】基本数据结构
- 数组线性表ArrayList的内部实现
- Linux安装Gradle
- 配置web项目session永不超时
- 聚合中返回source_大数据搜索与可视化分析(9)elasticsearch聚合分析Metric Aggregation...
- windows qt 使用openssl API
- 认真学习系列:数据结构与算法——慕课网笔记
- 相比于深度学习,传统的机器学习算法难道就此没落了吗,还有必要去学习吗?...
- 帆软Tab控件与控制组件隐藏的异同点
- 设计模式-第四篇之代理模式
- 2021年,产品需求文档PRD模板
- 知识点滴 - 什么是彩票
- Go语言适合做什么?
- 【Nav2中文网】五、普通教程(九)Groot与行为树互动
- javacv 人脸追踪_基于JavaCV的人脸识别程序
- vs2008+vss2005实现代码管理
- 自己构建iSCSI磁盘阵列
- 微信小程序教学管理系统+后台管理系统
热门文章
- python 网络编程第二版
- [翻译] CSStickyHeaderFlowLayout
- C# 二种方法控制系统音量/麦克风大小
- [QA] MySQL Error 1050(42S01): Table already exist
- 《Pro Ogre 3D Programming》读书笔记 之 第十章 布告板与粒子 第一部分 (转)
- 工程师进阶之路(二)
- 通过URL判断文件是否有存在
- (译)360全景视频制作专题-介绍
- GetOpenFileName 选择文件夹的解决方法
- iOS UI基础-11.0 UINavigationController