Python爬取QQ音乐单曲

爬虫步骤
1.爬虫准备
python安装了request模块,Chrome浏览器,明确目标,本次爬取的是QQ音乐《你不要担心》的前十页评论及对应的用户。
2.爬虫分析
首先我们打开 (QQ音乐网页),然后搜索 你不要担心,点击第一个结果进入歌曲的详情页(你不要担心——李迪),歌曲评论在详情页下方。然后我们打开 QQ 音乐的 robots.txt,看看是否禁止我们爬取,内容如下:
看上去只是禁止爬取 playlist 相关的信息,我们爬取歌曲评论应该问题不大。
点击 Network 中的 XHR 过滤其他类型的请求,得到我们想要的API链接。

评论数据就在 comment 下的 commentlist 中,commentlist 中的每一项都有 nick、avatarurl、rootcommentcontent等数据。我们可以确认评论的数据就是通过它获取的。

3.编写代码

import requests
import time
#请求头
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.162 Safari/537.36'}
lasthotcommentid = ''
#加快爬取速度
pagesize = '15'
# 前十页
for pagenum in range(10):params = {"g_tk_new_20200303":"5381""g_tk":"5381","loginUin":"0","hostUin":"0","format":"json","inCharset":"utf8","outCharset":"GB2312","notice":"0","platform":"yqq.json","needNewCode":"0","cid":"205360772","reqtype":"2","biztype":"1","topid":"105689469","cmd":"8","needmusiccrit":"0","pagenum":pagenum,"pagesize":pagesize,"lasthotcommentid":lasthotcommentid,"domain":"qq.com","ct":"24","cv":"10101010"
}res = requests.get('https://c.y.qq.com/base/fcgi-bin/fcg_global_comment_h5.fcg',headers=headers,params=params)data = res.json()for item in data['comment']['commentlist']:print('{}:{}'.format(item['nick'],item['rootcommentcontent']))lasthotcommentid = data['comment']['commentlist'][-1]['commentid']#防止爬取太快被封time.sleep(2)

4.爬虫结果

利用API爬取QQ音乐评论相关推荐

  1. python爬取qq音乐评论_爬虫:QQ音乐评论

    QQ音乐评论 有些小伙伴反馈,对于爬虫的完整流程,还是不清楚,这边就按顺序,给大家梳理一下 反爬 首先查看一下,我们要爬取的网页,是否反爬(各种侵害人家服务器的事情,我们不能干) QQ音乐网址:htt ...

  2. python爬取QQ音乐评论信息

    QQ音乐评论爬取分析 1.随便选个音乐 2. g_tk函数介绍 3. topid 4. python 代码 5. 结果 1.随便选个音乐 https://y.qq.com/n/yqq/song/003 ...

  3. python爬取qq音乐评论_教你用Python爬去QQ音乐评论

    有态度地学习 去年夏天,好像于我而言,重要的事就是毕业来临,从此踏上了搬砖之路,从学校到职场,之间身份的转变,让我又多了一份责任.当然还有一段感情经历,现在回头去看,只能说且行且珍惜,或许以后未必能再 ...

  4. 爬取qq音乐评论完整代码

    import requests,openpyxl wb=openpyxl.Workbook() #创建工作薄 sheet=wb.active #获取工作薄的活动表 sheet.title='resta ...

  5. 【Python爬虫实战】使用Selenium爬取QQ音乐歌曲及评论信息

    本文对使用到的技术仅做简单的介绍,若想了解更多,请前往相应的官网网站进行学习. 本文适合对爬虫相关知识接触不多的新手,主要是普及Selenium如何做爬虫,大佬请跳过. 1.Selenium简单介绍 ...

  6. 爬取qq音乐的评论并生成词云——以《听妈妈的话》为例

    爬取qq音乐的评论并生成词云 我们选取的是歌曲的周杰伦的 听妈妈的话 先看效果图 首先,我们进去qq音乐找到这首歌 网易云出来挨打 https://y.qq.com/n/yqq/song/002hXD ...

  7. 练习---爬取QQ音乐某首歌的评论,并存入Excel表中---以《消愁》为例

    import requests from bs4 import BeautifulSoup import json import xlwt#存储成Excel表格的函数 def save_excel(c ...

  8. 爬虫入门——爬取QQ音乐某一歌手前五首歌曲信息及相关评论

    文章目录 前言 一.查看信息 二.代码实现 总结 前言 python课作业 请使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(可以是任意歌手)最受欢迎的前5首歌曲的歌词.流派.歌 ...

  9. 【python】实验2项目2:使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(陈奕迅)

    请使用爬虫Selenium模拟浏览器获取爬取QQ音乐中你喜欢的某位歌手(可以是任意歌手)最受欢迎的前5首歌曲的歌词.流派.歌曲发行时间.评论条数.评论时间.评论点赞次数.评论内容具体(每一首歌的评论& ...

  10. Python网络爬虫数据采集实战:Scrapy框架爬取QQ音乐存入MongoDB

    ​    通过前七章的学习,相信大家对整个爬虫有了一个比较全貌的了解 ,其中分别涉及四个案例:静态网页爬取.动态Ajax网页爬取.Selenium浏览器模拟爬取和Fillder今日头条app爬取,基本 ...

最新文章

  1. Facebook开源Torchnet,加速AI研究
  2. 8.3. 测试 opensips
  3. 软件测试和系统试验,实验四 软件系统性测试
  4. 太强了!用200个LED做一个智能手表
  5. Python线程指南 ---转自 http://www.cnblogs.com/huxi/archive/2010/06/26/1765808.html
  6. autoresetevent java_[原创]AutoResetEvent, ManualResetEvent的Java模拟
  7. java stream filter map collector使用
  8. 「技术人生」第3篇:解决问题的规律总结
  9. 计算机网络太难?如何系统自学计算机网络?
  10. android中设置控件的搞,Android中如何自定义控件
  11. mysql 组内排名_【原】MySQL分组排序(包含组内排名、求中位数)
  12. Linux学习笔记014---文件及文件夹权限设置_以及文件、文件夹的删除_移动_复制操作
  13. 一台电脑两种jdk_jdk和jre有什么区别?
  14. 【李宏毅2020 ML/DL】P82 Generative Adversarial Network | Improving Sequence Generation by GAN
  15. Oracle管理存储架构(二)--Oracle管理数据块空间
  16. 5G到底厉害在什么地方?和4G有什么不同?
  17. 19 统计量及其抽样分布——样本均值的分布与中心极限定理
  18. 戴维斯分校 计算机硕士,申请加州大学戴维斯分校计算机研究生的入学条件是什么?...
  19. Kubernetes:(十四)安全机制(一定要做好安全措施哦)
  20. Bitbucket 添加ssh密钥

热门文章

  1. BURP APP HTTPS抓包xposed+justtrustme工具篇
  2. 用U盘安装Windows server 2012 R2
  3. mysql用户主机设置密码_MySQL用户账号管理(添加、删除、限制、设置密码、远程访问)...
  4. C++ 学生信息管理程序练习
  5. 分享:快捷方便的函数命名网站
  6. 【学习笔记】多目标优化问题分解成若干简单多目标子问题--MOEA/D-M2M
  7. Excel学习1:图表配色
  8. 小米、百度、bigo 、滴滴 、快手等iOS 面试后的一次阶段性总结
  9. matlab 获取文件毫秒时间,在Matlab中经过的时间,以毫秒为单位,具有不同的日期...
  10. hdu2073 无限的路 瞎搞