用python爬取i春秋的课程名
看课中内容是用get请求进行爬取课程,自己实践的时候发现已经被改成post请求了,下面开始
打开课程页面
我用的火狐,然后就是F12,点击网络,可能会有很多包,但不影响,点击删除就行,然后点击第二页,其他页面也行,可以看出总共是有17页的
然后会出现很多包,找到下面这个,点击查看
点击后会看到消息头请求网址,这个就是我们要用的url
复制到代码中
i_url = 'https://www.ichunqiu.com/courses/ajaxCourses'
接下来查看参数
然后发现“pageIndex”,很明显是指的第几页,可以试一下第四页数值是4,,,。这是post要用的表单数据,搞进代码,因为pageIndex值需要改变,我将它设为空值
post_data = {'courseTag':'','courseDiffcuty':'','IsExp':'','producerId':'','orderField':'','orderDirection':'','pageIndex':'','tagType':''}
由于i春秋设置了防爬虫处理,因此我们需要添加headers,headers就不多说了(不想暴露自己的配置,我不会告诉你我还用的xp),用火狐很简单,点击编辑重发,复制就行。接下来就是查看响应
很明显这是json数据,先import json再说,可以找到课是在course中的result下,从0开始,我们可以用“len(raw_data['course']['result'])”查看该页面有几个课程,用raw_data['course']['result'][0][‘courseName’]来获取第一个课程名字,下面是代码
#------------- #Author:Glasses #------------- import requests import jsondef getData():i_url = 'https://www.ichunqiu.com/courses/ajaxCourses'headers = {} #headers 自己填for p_index in range(1,18):post_data = {'courseTag':'','courseDiffcuty':'','IsExp':'','producerId':'','orderField':'','orderDirection':'','pageIndex':'','tagType':''}post_data['pageIndex'] = p_indexr = requests.post(i_url,headers=headers,data=post_data,timeout=10)raw_data = json.loads(r.text)for i in range(len(raw_data['course']['result'])):print raw_data['course']['result'][i]['courseName']getData()
来i春秋一起学习吧,
进阶吧!小白,只要摔不死我就继续摔!
转载于:https://www.cnblogs.com/glasses/p/8492459.html
用python爬取i春秋的课程名相关推荐
- i春秋python_用python爬取i春秋的课程名
看课中内容是用get请求进行爬取课程,自己实践的时候发现已经被改成post请求了,下面开始 我用的火狐,然后就是F12,点击网络,可能会有很多包,但不影响,点击删除就行,然后点击第二页,其他页面也行, ...
- i春秋python_用python爬取i春秋的课程
看课中内容是用get请求进行爬取课程,自己实践的时候发现已经被改成post请求了,下面开始 我用的火狐,然后就是F12,点击网络,可能会有很多包,但不影响,点击删除就行,然后点击第二页,其他页面也行, ...
- Python爬取网站用户手机号_利用python爬取慕课网站上面课程
1.抓取网站情况介绍 抓取网站:http://www.imooc.com/course/list 抓取内容:要抓取的内容是全部的课程名称,课程简介,课程URL ,课程图片URL,课程人数(由于动态渲染 ...
- Python爬取中国大学MOOC课程信息
问题:获取中国大学MOOC平台的课程信息,包括开课学校.课程类别(标签).课程名称.课程评分.评价人数和已参加课程人数. 思路: 1.进入中国大学MOOC首页,点击"学校",进入学 ...
- Python 爬取中国大学 MOOC 课程
MOOC 课程存在有效期,设定的学期结束即无法观看. Course Crawler 这个爬虫工具的出现,则提供了极大的便利. 准备 第一步:安装 Python 3 环境 进入 Python 3 官网( ...
- python大学课程-Python 爬取中国大学 MOOC 课程
中国大学 MOOC 是网易旗下一款慕课视频教育网站.实话说,这是网易几款教育类产品中,我最喜欢的一个.自己也使用了一年多,观看视频都是需要联网的,但部分 MOOC 课程存在有效期,设定的学期结束即无法 ...
- Python爬取天猫店铺的企业名1:根据店铺名获得店铺链接
2020年12月31日更新 项目说明: 最近遇到一个项目,项目需求大致是这样的:有一批天猫店铺名,需要根据店铺名获得店铺的认证企业名. 项目分析: 这个项目可以分为以下几个步骤: 1.根据店铺名搜索获 ...
- python爬取MOOC课程信息
MOOC课程信息爬取 时间 :2019-10-12 一.任务与目标 网站地址 http://www.imooc.com/course/list/ 2. 采用scrapy爬虫框架 爬取信息包括:课程名称 ...
- python关于二手房的课程论文_基于python爬取链家二手房信息代码示例
基本环境配置 python 3.6 pycharm requests parsel time 相关模块pip安装即可 确定目标网页数据 哦豁,这个价格..................看到都觉得脑阔 ...
最新文章
- HttpClient basic authentication
- 从职责归属看数据库中关系设计
- python去除rpm仓库中同名低版本的包
- 加密货币与智能合约的隐私 (二): 混音器和ring签名
- 利用Matlab求解线性规划问题
- python的主要功能_Python的主要功能是什么?
- intern_充分利用Outreachy Intern申请流程
- 支付结算之路由系统设计
- Java描述设计模式(12):外观模式
- js返回上一页的实现方法
- pandas 数据结构与基础功能
- Day768.大佬推荐的经典的Redis学习资料 -Redis 核心技术与实战
- H5微信分享、自定义微信分享
- Latex 中文Beamer模板
- 标准结构篇:7)塑料齿轮轮系设计总章
- mysql 字符集 表情_MySQL字符集(表情包)
- ucweb7.0 5800
- 视频教程-PHP零基础七天入门视频课程(免费50章)-PHP
- 厦门理工学院oj1717
- Java里鲜为人知的“机器人”类库
热门文章
- linux rpm安装不成功,rpm 包不能成功安装
- 企业网络推广浅析外包企业网络推广如何有效布局关键词优化?
- 网络推广外包专员浅析为何网站网络推广外包中有排名却没有转化率
- 创建linux目录,Linux目录的创建方法
- 开发日记-20190506 关键词 汇编语言(五)Hello World!
- Kotlin学习 PART 1:kotlin定义和目的
- 神经网络防止过拟合的方法
- 阿里云数据库产品HybridDB简介——OLAP数据库,支持行列混合存储,为用户提供基于开源 OLTP、OLAP、BigData 生态的一站式解决方案...
- AttributeError: module 'jwt' has no attribute 'ExpiredSignatureError'
- 兼容ie跟谷歌上传文件