上一篇文章我已经教大家一种比较偷懒的方式爬取网易云歌曲链接 , 接下来我们继续以这种方式爬取网易云的评论 , 歌单 , 专辑 和搜索结果 这一篇主要讲网易云的评论爬取 ,

打开要爬的歌曲网页 , 右键检查 , 进入network选项卡 , 刷新页面


通过上一篇的分析我们知道整个网易云音乐post参数的获取只需要一个变量就行了,其他的参数都是死的 , 好了继续使用之前的方法看看可变的那个参数是什么吧:

d函数进入 d => {"rid":"R_SO_4_1342798229","offset":"0","total":"true","limit":"20","csrf_token":""}  e=>010001 f=>00e0b509f6259df8642dbc35662901477df22677ec152b5ff68ace615bb7b725152b3ab17a876aea8a5aa76d2e417629ec4ee341f56135fccf695280104e0312ecbda92557c93870114af6c9d05c4f7f0c3685b7a46bee255932575cce10b424d813cfe4875d3e82047b97ddef52741d546b8e289dc6935b3ece0462db0a22b8e7  g=>0CoJUm6Qyw8W8jud
a函数进入 a => 16
b函数进入 a => {"rid":"R_SO_4_1342798229","offset":"0","total":"true","limit":"20","csrf_token":""}  b=>0CoJUm6Qyw8W8jud
b函数进入 a => gHPVST6jk9PvEgIDjnZzQm5eol/ky4Ziny9q0k+2OJZ8nridUSTC/qZT9OPaG347Nzk60/ZG/6a8rRCQTf/49+EZtiKnkvi24KuSdDKia2sKLeFF28Zyj5GZBwWC260A  b=>i8hkVttH5BgdJMYw
c函数进入 a => i8hkVttH5BgdJMYw  b=>010001 c=>00e0b509f6259df8642dbc35662901477df22677ec152b5ff68ace615bb7b725152b3ab17a876aea8a5aa76d2e417629ec4ee341f56135fccf695280104e0312ecbda92557c93870114af6c9d05c4f7f0c3685b7a46bee255932575cce10b424d813cfe4875d3e82047b97ddef52741d546b8e289dc6935b3ece0462db0a22b8e7encSecKey:"4db476c4059d59a35dbabe6c1e1588ffffc80d964f9da8b709056b193b0d72d4535a15cbb52287efd39addb51f9db0a059af317be1878235bccc38d77580a91416c791dccd199374251a10c0f1244a53a5cbc7499a36af0ae1a73a3c00a50bb99c4f79b1985aaac0856aa6268089ee379de3be2a249908676b46c25e4564561d"
encText:"6ZNWq6L+AjYiujItwQE2lTCLJc2x/C5Z+hjodS9UaOZrpNyoKJXdMoFFrpnoU4JaEqSNs/ir5nv/0ajZWFxZ9HiasEY76XbDH4WvmvaoLfuZE69cHFUbhVpKUY7eS8cOJniKK82Blc0aVsgiad02qWx5WP4kdpIq7OtRtwIK0ZGNsn4RE6rtvBcFYwEj3zlr"

可变参数是进入d函数的d参数 :
{“rid”:“R_SO_4_1342798229”,“offset”:“0”,“total”:“true”,“limit”:“20”,“csrf_token”:""}

接下来就是最核心的一步了 , 构造params参数 (以PHP为例):

$songData = '{"rid":"R_SO_4_1342798229","offset":"0","total":"true","limit":"20","csrf_token":""}';
//固定参数
$v1 = '0CoJUm6Qyw8W8jud';
$v2 = '0102030405060708' ;
//下面这个参数使用上一篇中的cui5UlB0Hp5Osovk
$v3 = 'cui5UlB0Hp5Osovk';
$songData = openssl_encrypt($songData, 'aes-128-cbc', $v1 , false, $v2);
$params   = openssl_encrypt($songData, 'aes-128-cbc', $v3, false, $v2);

参数都已经获取了下一步就是构造请求了:

$header = array(
#    'Referer'         => 'https://music.163.com/song?id=1342798229','User-Agent'      => 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36',"Host"            => "music.163.com"  ,
);
$encSecKey = "b62d8aeac7f4cd0a2653997c76ec40103504a6b3ccd6df45230ba0c9ffba53f21574676726c37a4c3910d394e21e9a71604b084f4e1105d6c4db7e7da1af9d4e2357fb80ebcdeb13d8bc268288a5d9ae23bec681c1f15fa7eb9a03c9229e9a94efd887e46b332f4c3421567bf9236cf847cd7708b4d39a03bff95cb194879635";$curl = curl_init("https://music.163.com/weapi/v1/resource/comments/R_SO_4_1342798229?csrf_token=");curl_setopt($curl , CURLOPT_HEADER , false);
curl_setopt($curl , CURLOPT_SSL_VERIFYPEER , false);
curl_setopt($curl , CURLOPT_RETURNTRANSFER , true);
curl_setopt($curl , CURLOPT_POST , true);
curl_setopt($curl , CURLOPT_HTTPHEADER , $header);
curl_setopt($curl , CURLOPT_POSTFIELDS , http_build_query(array("params" => $params , "encSecKey" => $encSecKey)));$response = curl_exec($curl);echo $response;

结果:

好了评论爬取到了 , 下面贴上全部代码:

define("PARAME1" , "0CoJUm6Qyw8W8jud");
define("PARAME2" , "0102030405060708");
$songData = '{"rid":"R_SO_4_1342798229","offset":"0","total":"true","limit":"20","csrf_token":""}';$header = array(
#    'Referer'         => 'https://music.163.com/song?id=1342798229','User-Agent'      => 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36',"Host"            => "music.163.com"  ,
);
$header = array_map(function($k,$v){return $k.": ".$v ;
} , array_keys($header) , $header);$a_back = "cui5UlB0Hp5Osovk" ;$songData = openssl_encrypt($songData, 'aes-128-cbc', PARAME1 , false, PARAME2);
$params   = openssl_encrypt($songData, 'aes-128-cbc', $a_back , false, PARAME2);$encSecKey = "b62d8aeac7f4cd0a2653997c76ec40103504a6b3ccd6df45230ba0c9ffba53f21574676726c37a4c3910d394e21e9a71604b084f4e1105d6c4db7e7da1af9d4e2357fb80ebcdeb13d8bc268288a5d9ae23bec681c1f15fa7eb9a03c9229e9a94efd887e46b332f4c3421567bf9236cf847cd7708b4d39a03bff95cb194879635";$curl = curl_init("https://music.163.com/weapi/v1/resource/comments/R_SO_4_1342798229?csrf_token=");curl_setopt($curl , CURLOPT_HEADER , false);
curl_setopt($curl , CURLOPT_SSL_VERIFYPEER , false);
curl_setopt($curl , CURLOPT_RETURNTRANSFER , true);
curl_setopt($curl , CURLOPT_POST , true);
curl_setopt($curl , CURLOPT_HTTPHEADER , $header);
curl_setopt($curl , CURLOPT_POSTFIELDS , http_build_query(array("params" => $params , "encSecKey" => $encSecKey)));$response = curl_exec($curl);echo $response;

网易云音乐歌曲评论爬虫相关推荐

  1. 网易云音乐歌曲评论爬虫(附python源码)

    ♚转载: 作者:志颖 ,一个狂热的python爬虫热爱者 GitHub:github.com/zyingzhou 用过网易云音乐听歌的朋友都知道,网易云音乐每首歌曲后面都有很多评论,热门歌曲的评论更是 ...

  2. 网易云音乐歌曲评论爬虫(附源码)

    数据科学俱乐部 中国数据科学家社区 ♚ 作者:志颖 ,一个狂热的python爬虫热爱者 GitHub:github.com/zyingzhou 用过网易云音乐听歌的朋友都知道,网易云音乐每首歌曲后面都 ...

  3. 简单的网易云音乐热门评论爬虫

    简单的网易云音乐热门评论爬虫 注:本文没有什么技术含量,就是一个普通的AJAX数据爬虫,适合新手练习 目标:爬取网易云音乐歌曲的热门评论 分析:本次爬虫不难,思路是请求和获取数据,网易云音乐的评论是通 ...

  4. python爬虫-爬取网易云音乐歌曲评论

    本文借鉴了@平胸小仙女的知乎回复 https://www.zhihu.com/question/36081767 以及@lyrichu的博客 https://www.cnblogs.com/lyric ...

  5. python爬取网易云音乐歌曲评论信息

    网易云音乐是广大网友喜闻乐见的音乐平台,区别于别的音乐平台的最大特点,除了"它比我还懂我的音乐喜好"."小清新的界面设计"就是它独有的评论区了------各种故 ...

  6. 爬取网易云音乐歌曲评论并生成特定词云图

    import requests import json import jsonpath import csv import time import jieba import numpy # 图片的转换 ...

  7. python爬取音乐并保存_Python爬取网易云音乐上评论火爆的歌曲

    前言 网易云音乐这款音乐APP本人比较喜欢,用户量也比较大,而网易云音乐之所以用户众多和它的歌曲评论功能密不可分,很多歌曲的评论非常有意思,其中也不乏很多感人的评论.但是,网易云音乐并没有提供热评排行 ...

  8. 用python爬取网易云评论最多的歌_巧用Python爬取网易云音乐歌曲全部评论

    一.首先分析数据的请求方式 网易云音乐歌曲页面的URL形式为https://music.163.com/#/song?id=歌曲id号,这里我用Delacey的Dream it possible 为例 ...

  9. python爬虫爬取网易云音乐歌曲_Python网易云音乐爬虫进阶篇

    image.png 年前写过一篇爬网易云音乐评论的文章,爬不了多久又回被封,所以爬下来那么点根本做不了什么分析,后面就再改了下,加入了多线程,一次性爬一个歌手最热门50首歌曲的评论,算是进阶版了- 思 ...

  10. 抓取网易云音乐歌曲热门评论生成词云(转)

    非原创作品,转载自:http://blog.csdn.net/marksinoberg/article/details/70809830 前言 网易云音乐一直是我向往的"神坛",听 ...

最新文章

  1. linux esd转iso,window_Win10 TH2正式版10586官方ESD映像怎么转换成ISO镜像?,今天phpstudy分享了Win10 TH2(Build - phpStudy...
  2. dubbo配置(一)
  3. 用jedis访问Redis进行对象存取示例
  4. 当当网头部和尾部——CSS源码
  5. 超时空机战服务器配置信息错误,超时空机战熔炉篇FAQ教你如何合理的使用熔炉...
  6. 类的构造器-init和new
  7. python+selenium处理chrome显示通知弹框
  8. 趋势程序大赛第 六七 天
  9. NVIDIA 控制面板闪退问题解决
  10. 中级软件测试笔试题100精讲_软件测试工程师笔试题目(含答案)
  11. win10 退出误登的微软账号,无需改注册机,无需重置系统
  12. c 教程网 linux,Linux基本命令C教程网cppcoursecom.ppt
  13. macbook用户注意了,这个行为可能导致显示屏损坏
  14. Linu修改系统时间
  15. java 构造器 血药主题_Day08-面向对象编程,Java构造器
  16. 什么是世界协调时间UTC
  17. 基于WebSocket和Redis实现Bilibili弹幕效果
  18. 【运筹优化】调用Gurobi求解LP问题(Java代码示例)
  19. 二手交易管理系统SSM
  20. 考研计算机最低分数,考研最低录取分数线是多少

热门文章

  1. NLTK文本分割器是如何工作的
  2. 鸿蒙之始有几个老婆,先天五太
  3. 拼多多出现重大BUG,几小时内损失超千万,但处理方式让用户怒了
  4. 《图解http》读书笔记
  5. linux 配额不起作用,Linux 配额
  6. python opencv rgb值判断红色_Python-opencv实现红绿两色识别操作
  7. QT颜色对照表,RGB颜色对照表
  8. 怀旧服ouf头像插件_wow怀旧服头像美化插件下载
  9. 计算机添加本地安全组用户名和密码错误,win7系统访问远程共享文件夹提示未知的用户名或密码错误的解决方法...
  10. 添加过滤器后登录界面无法登录的bug--已解决