python爬取网易云课堂python课程
import requests
import xlsxwriterdef get_json(index):# 爬虫功能url = "https://study.163.com/p/search/studycourse.json"payload = {"activityId": 0,"keyword": "python","orderType": 5,"pageIndex": index,"pageSize": 50,"priceType": -1,"qualityType": 0,"relativeOffset": 0,"searchTimeType": -1,}headers = {"accept": "application/json","content-type": "application/json","origin": "https://study.163.com","user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36"}try:response = requests.post(url,json=payload,headers=headers)content = response.json()if content and content["code"] == 0:return contentreturn Noneexcept:print("出错了")def get_course(content):course_list = content["result"]["list"]return course_listdef save_excel(course_list):# 填充爬取的课程信息# page1 行数 1 50 50*(1-1) + 1# page2 行数 51 100 50*(2-1) + 1# page3 行数 101 150 50*(3-1) + 1for num,course in enumerate(course_list):row = 50*(index-1)+ num+1worksheet.write(row, 0, course["productId"])worksheet.write(row, 1, course["courseId"])worksheet.write(row, 2, course["productName"])worksheet.write(row, 3, course["provider"])worksheet.write(row, 4, course["score"])worksheet.write(row, 5, course["learnerCount"])worksheet.write(row, 6, course["lectorName"])worksheet.write(row, 7, course["originalPrice"])worksheet.write(row, 8, course["discountPrice"])worksheet.write(row, 9, course["bigImgUrl"])worksheet.write(row, 10, course["description"])def main(index):content = get_json(index) # 获取json数据course_list = get_course(content) # 获取第index页的50条件记录save_excel(course_list) # 写入到excelif __name__ == "__main__":# 存入excelworkbook = xlsxwriter.Workbook("网易云课堂Python课程数据.xlsx") # 创建excelworksheet = workbook.add_worksheet("first_sheet")worksheet.write(0, 0, "商品id")worksheet.write(0, 1, "课程id")worksheet.write(0, 2, "课程名称")worksheet.write(0, 3, "机构名称")worksheet.write(0, 4, "评分")worksheet.write(0, 5, "学习人数")worksheet.write(0, 6, "讲师名称")worksheet.write(0, 7, "原价")worksheet.write(0, 8, "折扣价")worksheet.write(0, 9, "图片")worksheet.write(0, 10, "课程描述")total_page_count = get_json(1)["result"]["query"]["totlePageCount"] # 总页数for index in range(1,total_page_count+1):main(index)workbook.close()
python爬取网易云课堂python课程相关推荐
- Python爬取网易云热歌榜所有音乐及其热评
获取特定歌曲热评: 首先,我们打开网易云网页版,击排行榜,然后点击左侧云音乐热歌榜,如图: 关于如何抓取指定的歌曲的热评,参考这篇文章,很详细,对小白很友好: 手把手教你用Python爬取网易云40万 ...
- python爬取网易云音乐热评_python爬取网易云音乐评论
本文实例为大家分享了python爬取网易云音乐评论的具体代码,供大家参考,具体内容如下 import requests import bs4 import json def get_hot_comme ...
- python爬取网易云评论最多的歌_python爬取网易云音乐评论
本文实例为大家分享了python爬取网易云音乐评论的具体代码,供大家参考,具体内容如下 import requests import bs4 import json def get_hot_comme ...
- python爬取网易云音乐飙升榜音乐_python爬取网易云音乐热歌榜 python爬取网易云音乐热歌榜实例代码...
想了解python爬取网易云音乐热歌榜实例代码的相关内容吗,FXL在本文为您仔细讲解python爬取网易云音乐热歌榜的相关知识和一些Code实例,欢迎阅读和指正,我们先划重点:python,网易热歌榜 ...
- python爬取网易云音乐飙升榜音乐_python爬取网易云音乐热歌榜实例代码
首先找到要下载的歌曲排行榜的链接,这里用的是: https://music.163.com/discover/toplist?id=3778678 然后更改你要保存的目录,目录要先建立好文件夹,例如我 ...
- Python爬取网易云音乐热歌榜(爬虫)
Python爬取网易云音乐热歌榜歌曲,并下载到本地 找到要下载歌曲排行榜的链接,这里用的是: https://music.163.com/discover/toplist?id=3778678 然后更 ...
- python爬取网易云热歌榜
Python爬取网易云音乐热歌榜歌曲,并下载到本地 找到要下载歌曲排行榜的链接,这里用的是: https://music.163.com/discover/toplist?id=3778678 #网易 ...
- python爬取网易云音乐生成王力宏歌曲词云
python爬取网易云音乐生成王力宏歌曲词云 # -*- coding:utf-8 -*- # 网易云音乐,通过歌手id生成词云 import requests import sys,re,os fr ...
- python爬取网易云音乐排行榜数据
python爬取网易云音乐排行榜歌曲及评论 网易云音乐排行榜歌曲及评论爬取 主要注意问题:selenium 模拟登录.iframe标签定位.页面元素提取. 在利用selenium定位元素并取值的过程中 ...
- [爬虫]Python爬取网易云音乐搜索并下载歌曲!
Python爬取网易云音乐搜索并下载歌曲! 文章目录 Python爬取网易云音乐搜索并下载歌曲! 1.准备工作 2."实地"观察 3.开始码代码! 4.搜索并下载 结束语 1.准备 ...
最新文章
- poj 1306 Combinations
- uniapp 创建与配置 tabbar
- 搭建xxpay支付平台
- android 百度定位 sdk 3.3demo,BaiduMapApi_Sample_Android_1.3.3\demo无法启动
- 个人对回调函数的理解(personal understanding of callback function)
- oss文件普通下载-断点下载
- unity3d UI粒子特效裁剪
- wps无法使用F4重复上一步操作的解决方法
- STAR、6W1H、SMART、PDCA、MKASH原则在精准招聘中的应用
- java程序员待遇怎么样_现在的java程序员薪资待遇怎么样?
- 学计算机还是机电一体,上技校学计算机应用好还是机电一体化好?
- MCU】可怕,别人把我MCU固件给反汇编了!(逆向)J-FLASH通过下面的选项路径,即可读取所选Flash区域或者所有Flash区域(Entire Chip)安装IDA Pro逆向工具
- java调用kettle脚本ktr
- ASP.NET Development Server的Directory Browsing模式HTML垃圾代码
- 将word转换html格式的文件,word 保存成 html格式文件
- 微型计算机从外观上看可以分为,冯.诺依曼计算机 1.3 计算机系统的组成 计算机系统概述 EDVAC的3个特点:...
- 雷军—我十年的程序员生涯
- NOIP2016普及组复赛第一题——买铅笔
- android百度离线地图,Android SDK
- 喷墨打印机的使用 hp LaserJet 1010 HB 打印顺序
热门文章
- 吴恩达机器学习课后作业6——使用支持向量机(svm)构建一个垃圾邮件分类器
- 征途服务器维护时间,《征途》服务器重组几大怪现象
- network secruity studay day4
- C语言求n的阶乘(n!)
- 使用PowerGUI管理你的VMware ESX
- 菜鸟c语言app,菜鸟学C语言app下载-菜鸟学C语言下载 3.0.0 手机版 - 河东软件园
- python爬取京东商品图片_爬取京东和天猫下载商品图片
- 腰围2尺1,2,3,4,5,6,7,8寸各自等于是多少厘米/英寸(对比表)
- html5+css3.5手机站标准写法,移动端手机网站基本模板
- 汽车CAN总线-基础