今天,我们利用Python 中的selenium爬取网易云音乐中林俊杰《将故事写成我们》的评论,具体界面如下:

私信小编01 获取数十套PDF!爬虫 web都有的呢!

具体代码如下:

#此程序用来爬取网易云音乐中《将故事写成我们》的评论,主要包含用户名和评论
#其中csv文件保存了用户名和评论,txt文件只保存了评论
from selenium import webdriver
import time
import csv
import bs4
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
url='https://music.163.com/#/song?id=1391477429'
#翻页的函数
def next_page():ckl = driver.find_element_by_link_text('下一页')driver.execute_script("window.scrollTo(0,document.body.scrollHeight)")ckl.click()wait = WebDriverWait(driver, 10)wait.until(EC.presence_of_element_located((By.CLASS_NAME,'itm')))content = driver.page_sourcecontent = content.replace('<br />', 'n')  # 输出时按照网页上的格式换行保存评论内容html = bs4.BeautifulSoup(content, 'lxml')return html
if __name__ == '__main__':driver = webdriver.Chrome()driver.get(url)time.sleep(5)list_info = []time.sleep(1)#首先找到g_iframe这个框架,不然直接找找不到frame = driver.find_element_by_id('g_iframe')driver.switch_to.frame(frame)time.sleep(2)#翻页是因为第一次直接显示最火的15条评论,翻页再翻回去就没有那15条评论了# 先翻一页sec=driver.find_element_by_link_text('下一页')driver.execute_script("window.scrollTo(0,document.body.scrollHeight)")sec.click()time.sleep(1)#再回到第一页fir=driver.find_element_by_link_text('上一页')fir.click()time.sleep(1)# 先爬取首页的评论datas = driver.find_elements_by_css_selector('div.cntwrap > div:nth-child(1) > div')for i in datas:data=i.textname=data[:data.index(':')]comment=data[data.index(':')+1:]list_info.append([name,comment])# print(list_info)# 爬取后续的页面评论for i in range(200):time.sleep(0.5)ht=next_page()ncom=ht.find_all('div',class_='cnt f-brk')for k in ncom:data1=k.textname1=data1[:data1.index(':')]comment1=data1[data1.index(':')+1:]list_info.append([name1,comment1])print(list_info)#将其保存成csv文件with open('将故事写成我们','a') as f:writer=csv.writer(f)writer.writerows(list_info)#将其中的评论comment部分保存成txt文件with open('将故事写成我们的评论.txt','a') as f:for i in list_info:f.write(i[1])list_info=[]print('Done')

运行结果如下(只爬取了前201页):

这是csv文件中保存的内容,txt的内容如下:

好了,明天我们利用词云对《将故事写成我们》的评论进行绘图,找到其中的高频词,并制作一个词云图

python爬取音乐_利用Python对网易云音乐进行爬取!无所不爬的爬虫啊!相关推荐

  1. 网易云音乐android api_网易云音乐怎么发布个人Mlog?网易云音乐发布个人Mlog的教程介绍...

    现在很多人都喜欢发Mlog,网易云音乐中也可以发布mlog啦,下面小编就为大家带来网易云音乐发布个人Mlog的具体操作方法,想知道的话就来看看吧. 网易云音乐怎么发布个人Mlog?网易云音乐发布个人M ...

  2. 电脑网易云音乐,拿下华研,网易云音乐终于解决1%的大难题,可阿里音乐以后咋办?...

    3月1日,网易云音乐和华研国际宣布达成战略合作,将在华语音乐的宣传推广和原创音乐人的扶持培养方面,展开多样化的合作.其中,在音乐版权合作方面,网易云音乐已获得华研国际旗下目前全量音乐曲库的授权. 这件 ...

  3. python爬虫爬取音乐_利用python爬虫实现爬取网易云音乐热歌榜

    利用python爬虫实现爬取网易云音乐热歌榜 发布时间:2020-11-09 16:12:28 来源:亿速云 阅读:102 作者:Leah 本篇文章给大家分享的是有关利用python爬虫实现爬取网易云 ...

  4. python爬取歌词_利用Python网络爬虫抓取网易云音乐歌词

    今天小编给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌曲ID: 调用网易云歌曲API,获取歌词: 将歌词写入文件,并存入本地 ...

  5. 利用Python爬取基于AES对称加密算法的网易云音乐用户评论数据

    本文利用Python2.7根据网易云音乐歌曲ID爬取了该歌曲的所有用户评论数据.以id是28875120的歌曲<小岁月太着急>为示例,通过Chrome的DevTools工具获取已加密评论数 ...

  6. java爬取网易云歌单_[原创]基于Java网易云音乐评论抓取~【悠着点玩啊~】

    本帖最后由 wushaominkk 于 2018-3-20 10:40 编辑 一般我们爬虫都是采用Python,自己闲的无聊就有Java编写一个简单的网易云音乐评论的抓取,这个仅仅是我开发的一个小小调 ...

  7. python要学什么英文歌_Python分析网易云音乐近5年热门歌单

    由于同一歌单可能会有不同的分类,所以按这72种分类抓取的数据会有重复数据,剔重之后6.6万个热门歌单. 我按不同分类下歌单的相似度做了排行榜如下(红色部分表示相似度): 从相似度排行榜中看出流行音乐. ...

  8. 【NLP】利用jieba对网易云音乐的评论进行词云分析

    这是一篇代码文章,因为所有的文字将会以类似注释的方式进行叙述,文字是对代码的补充说明和解读. 这是一篇避坑文章,尤其对于新人来说,这些坑你一定会遇到,希望你不会犯下跟我一样的问题,从另一个角度来讲,你 ...

  9. html制作网易云音乐登录系统,JavaScript实现[网易云音乐Web站登录窗口]拖拽功能...

    说明 你可能发现有很多网站他们的登录窗口或者说是登录框是可以拖动的, 更有甚者他们的站点提示框都可以拖动, 你也许可能会对这个功能的实现感兴趣, 那么这篇文章可能会对你有所帮助!具体的网站示例以 网易 ...

最新文章

  1. php 实现查询百度排名,PHP实现获取百度top50的搜索排行关键字
  2. 【深度学习】基于Torch的Python开源机器学习库PyTorch回归
  3. ViewPager (下)-- 利用 Fragment 实现美丽的 页面切换
  4. Python 【搜狐号】短视频的自动上传与发布实例演示,同时支持抖音、快手、哔哩哔哩、小红书、微视、西瓜视频、微信视频号等平台的视频自动化同步发布
  5. qstring 字符相同 不相等_我的编程手册 -- Java 基础篇·字符串 String
  6. 「C++」C++ Primer Plus 笔记:第一章 预备知识
  7. 【线上分享】安防视频上云趋势、痛点,华为云视频接入服务探索及实践
  8. Kali Linux下安装VMware
  9. 语言条件语序心得_考研分享 | 王远新语言学教程要点总结(第五章)
  10. python生成器与迭代器。
  11. 听说你是程序员的,给我做个网站呗
  12. 第5章 MySQL高可用架构设计
  13. Linux格式化硬盘为nvme0n1,安装ubuntu16.04系统及解决/dev/nvme0n1p7:clean...block黑屏问题...
  14. python面向对象(特征,原则)01
  15. 查看创建的hive表对应的hdfs文件路径
  16. 匿存函数,内存函数,递归函数,二分法查找
  17. 再议 封装、继承、多态
  18. SEGGER调试软件
  19. 【EMC专题】共模和差模
  20. Mac 安装 Icarus-Verilog 报错解决方案参考

热门文章

  1. (68)自旋锁 , cmpxchg8b 指令
  2. 自行开发驱动如何进行驱动签名
  3. 用每个月的下载量超过300亿次的NPM,窃取密码是一种什什么样的体验!
  4. MySQL唯一约束(UNIQUE KEY)
  5. 8、 IS NULL:空值查询
  6. 4、(日期和时间类型)DTAETIME、TIMESTAMP、DATE、TIME、YEAR
  7. 利用栈完成中缀表达式到后缀表达式的转换
  8. @ConfigurationProperties与@Value注解
  9. jQuery的同胞遍历
  10. vuepress侧边栏配置_VuePress搭建静态博客网站