F12打开网页调试工具:

选择“网络”选项卡后,发现有很多响应,我们筛选一下,只看XHR响应。(XHR是Ajax中的概念,表示XMLHTTPrequest)然后我们发现少了很多链接,随便点开一个看看:我们选择city,预览中有一串json数据:

我们再点开看看:

原来全都是城市的列表,应该是加载地区新闻之用的。现在大概了解了怎么找JS请求的接口的吧?但是刚刚我们并没有发现想要的新闻,再找找看:有一个focus,我们点开看看:

与首页的图片新闻呈现的数据是一样的,那么数据应该就在这里面了。

看看其他的链接:

这应该是热搜关键词

这个就是图片新闻下面的新闻了。

我们打开一个接口链接看看:http://www.toutiao.com/api/pc/focus/

返回一串乱码,但从响应中查看的是正常的编码数据:

有了对应的数据接口,我们就可以仿照之前的方法对数据接口进行请求和获取响应了2、请求和解析数据接口数据

先上完整代码:# coding:utf-8

import requests

import json

url = 'http://www.toutiao.com/api/pc/focus/'

wbdata = requests.get(url).text

data = json.loads(wbdata)

news = data['data']['pc_feed_focus']

for n in news:

title = n['title']

img_url = n['image_url']

url = n['media_url']

print(url,title,img_url)

返回出来的结果如下:

照例,稍微讲解一下代码:

代码分为四部分,

第一部分:引入相关的库# coding:utf-8

import requests

import json

第二部分:对数据接口进行http请求url = '

wbdata = requests.get(url).text

第三部分:对HTTP响应的数据JSON化,并索引到新闻数据的位置data = json.loads(wbdata)

news = data['data']['pc_feed_focus']

第四部分:对索引出来的JSON数据进行遍历和提取for n in news:

title = n['title']

img_url = n['image_url']

url = n['media_url']

print(url,title,img_url)

如此,就完成了从JS网页中爬取数据。如有帮助,欢迎微信打赏微信公众号

州的先生

python爬虫动态解析js_Python爬虫实战入门五:获取JS动态内容—爬取今日头条相关推荐

  1. python爬虫爬取今日头条_Python爬虫实战入门五:获取JS动态内容—爬取今日头条...

    之前我们爬取的网页,多是HTML静态生成的内容,直接从HTML源码中就能找到看到的数据和内容,然而并不是所有的网页都是这样的. 有一些网站的内容由前端的JS动态生成,由于呈现在网页上的内容是由JS生成 ...

  2. python爬取今日头条热点新闻事件,Python爬虫实战入门五:获取JS动态内容—爬取今日头条...

    之前我们爬取的网页,多是HTML静态生成的内容,直接从HTML源码中就能找到看到的数据和内容,然而并不是所有的网页都是这样的. 有一些网站的内容由前端的JS动态生成,由于呈现在网页上的内容是由JS生成 ...

  3. python爬取今日头条后台数据_Python爬虫实战入门五:获取JS动态内容—爬取今日头条...

    之前我们爬取的网页,多是HTML静态生成的内容,直接从HTML源码中就能找到看到的数据和内容,然而并不是所有的网页都是这样的. 有一些网站的内容由前端的JS动态生成,由于呈现在网页上的内容是由JS生成 ...

  4. python编程100例头条-python爬虫演示:以爬取今日头条为例

    编者按 众所周知,Python是一门编程语言,操作简洁而清晰.功能专业而强大.入门容易又严谨.2018年,教育部正式将人工智能.物联网.大数据处理划入高中课程,这就意味着,现在的中学生开始就要学习编程 ...

  5. [Python3网络爬虫开发实战] --分析Ajax爬取今日头条街拍美图

    [Python3网络爬虫开发实战] --分析Ajax爬取今日头条街拍美图 学习笔记--爬取今日头条街拍美图 准备工作 抓取分析 实战演练 学习笔记–爬取今日头条街拍美图 尝试通过分析Ajax请求来抓取 ...

  6. python爬虫今日头条_python爬虫—分析Ajax请求对json文件爬取今日头条街拍美图

    python爬虫-分析Ajax请求对json文件爬取今日头条街拍美图 前言 本次抓取目标是今日头条的街拍美图,爬取完成之后,将每组图片下载到本地并保存到不同文件夹下.下面通过抓取今日头条街拍美图讲解一 ...

  7. python爬取今日头条街拍,Python3今日头条街拍爬虫

    学习了大才哥的在线视频教程,特来这里总结分享一下. 不同于上一篇糗事百科的爬虫,这里爬取今日头条街拍需要分析ajax请求得来的数据. 首先这里是爬取的起始页 可以看到当我们往下拉滚动条的时候,新数据是 ...

  8. 利用Ajax爬取今日头条头像,街拍图片。关于崔庆才python爬虫爬取今日头条街拍内容遇到的问题的解决办法。

    我也是初学爬虫,在看到崔庆才大佬的爬虫实战:爬取今日头条街拍美图时,发现有些内容过于陈旧运行程序时已经报错,网页的源代码早已不一样了.以下是我遇到的一些问题. 1.用开发者选项筛选Ajax文件时预览看 ...

  9. 用python爬取今日头条上的图片_Python爬虫:抓取今日头条图集

    今天我们来爬取今日头条图集,老司机以街拍为例. 运行平台: Windows Python版本: Python3.6 IDE: Sublime Text 其他工具: Chrome浏览器 1.网页分析 从 ...

最新文章

  1. IBM Watson 的中国生意
  2. MongoDB工具最新开发 源代码更新 兼 进展报告 - 集群功能开发
  3. RAID 0、1、5、1+0总结
  4. 技术动态 | 人工智能开源软件发展现状连载——知识图谱开源软件
  5. 虚拟服务器无限网站个数,一个虚拟主机最多可以放几个网站
  6. Linux自学之旅-安装篇(磁盘分区)
  7. 国开大学计算机应用基础形考作业三答案,国开学习指南形考作业答案
  8. GeoTools-GeoJson转ShapeFile
  9. 熟悉RT-Thread的软硬件环境【RT-Thread学习笔记 1】
  10. 单耳蓝牙耳机怎么连接_蓝牙耳机怎么切换单耳
  11. Unity制作简单3D图表
  12. 计算机与模拟实验的论文,作业模拟论文,关于森林作业的计算机模拟相关参考文献资料-免费论文范文...
  13. Apache Spark源码走读(九)如何进行代码跟读使用Intellij idea调试Spark源码
  14. plsql/developer12如何放大字体
  15. Chinadaily双语新闻爬取
  16. 技术分享 | 实战 MySQL 8.0.17 Clone Plugin
  17. python爬虫快速添加请求头、随机生成user-agent
  18. 解决ssh连接经常掉线
  19. Python中遍历列表remove漏删解决方案
  20. ubuntu ibus安装极点五笔

热门文章

  1. React Native实例之房产搜索APP
  2. 耗时n年,38页《数据仓库知识体系.pdf》(数据岗位必备)
  3. 安卓逆向_19( 二 ) --- APK保护策略【重新签名后安装打开失败 --- 书旗小说.apk、浦发银行.apk的过签名校验【so 文件修改保存】】
  4. datagrip替换字_DataGrip使用进阶-导航及搜索(一)
  5. 协议簇: Media Access Control(MAC) Frame 解析
  6. python 3d绘图库_python – 用于科学3d绘图的Mayavi的替代品
  7. 小程序switch内部加上文字_文字游戏大全:模拟游戏会长经营公会的小程序,你会管理公会吗?...
  8. 如何把meshlab中的圆环去掉_如何设计一座太空城?
  9. div字体居中_div和span的使用
  10. java 中文 音序,java 中文字符串数组按照音序排列