做题思路

1. 分析源码,确定信息所在位置

2.进行内容解析

3.将获取到的信息字典的方式保存到列表,然后再将列表信息保存到.csv文件中

import csv
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains'''
https://music.163.com/#/song?id=399354373
目标:评论者的网名,与评论
需要切换iframe
鼠标行为连点击下一页
'''class WYYmusic:  # 音乐# 初始化类def __init__(self):self.driver = webdriver.Chrome()self.driver.get('https://music.163.com/#/song?id=399354373')  # 打开链接self.driver.implicitly_wait(3)self.driver.switch_to.frame(self.driver.find_element(By.ID, 'g_iframe'))# 操作def operate(self):# 歌评论for self.i in range(10):self.SongReview = []divlist = self.driver.find_elements(By.XPATH, '//*[@class="itm"]/div[2]')# print(divlist)for item in divlist:# print(i)# 评论try:commentdict = {}comment = item.find_element(By.XPATH, './/div[@class="cnt f-brk"]').textname = comment.split(":")commentdict['name'] = name[0]commentdict['comment'] = name[1]self.SongReview.append(commentdict)# print(comment)# print(name)except Exception as e:print()self.save()# print(SongReview)#定位下一页按钮button_tag=self.driver.find_element(By.XPATH,'//*[@class="m-cmmt"]/div[3]/div/a[11]')action=ActionChains(self.driver)action.move_to_element(button_tag)action.click()action.perform()self.driver.quit()def save(self):if self.i == 0:self.mod='w'else:self.mod="a"headers=['name','comment']with open('评论.csv',self.mod,encoding='utf-8-sig',newline='')as f:writers=csv.DictWriter(f,headers)if self.i==0:writers.writeheader()writers.writerows(self.SongReview)# 程序主入口
if __name__ == "__main__":# 爬虫reptile = WYYmusic()reptile.operate()

博主B站链接:本座小白TT的个人空间_哔哩哔哩_Bilibili

GitHub链接: GitHub - MeteorPRC/Reptile

Python爬虫之实例---用selenium爬取网易云评论相关推荐

  1. Python爬虫——教你js逆向爬取网易云评论

    大家好!我是霖hero 正所谓条条道路通罗马,上次我们使用了Selenium自动化工具来爬取网易云的音乐评论,Selenium自动化工具可以驱动浏览器执行特定的动作,获得浏览器当前呈现的页面的源代码, ...

  2. Python爬虫——selenium爬取网易云评论并做词云

    大家好!我是霖hero 到点了上号网易云,很多人喜欢到夜深人静的时候,在网易云听音乐发表评论,正所谓:自古评论出人才,千古绝句随口来,奈何本人没文化,一句卧槽行天下!评论区集结各路大神,今天我们来爬取 ...

  3. 从入门到入土:Python爬虫学习|实例练手|爬取百度翻译|Selenium出击|绕过反爬机制|

    此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...

  4. 从入门到入土:Python爬虫学习|实例练手|爬取猫眼榜单|Xpath定位标签爬取|代码

    此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...

  5. 从入门到入土:Python爬虫学习|实例练手|爬取新浪新闻搜索指定内容|Xpath定位标签爬取|代码注释详解

    此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...

  6. 从入门到入土:Python爬虫学习|实例练手|爬取百度产品列表|Xpath定位标签爬取|代码注释详解

    此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出.欢迎各位前来交流.(部分材料来源网络,若有侵权,立即删除) 本人博客所有文章纯属学习之用,不涉及商业利益.不合适引用,自当删除! 若 ...

  7. python爬取网易云歌单_详解python selenium 爬取网易云音乐歌单名

    目标网站: 首先获取第一页的数据,这里关键要切换到iframe里 打印一下 获取剩下的页数,这里在点击下一页之前需要设置一个延迟,不然会报错. 结果: 一共37页,爬取完毕后关闭浏览器 完整代码: u ...

  8. Selenium爬取网易云音乐评论

    Selenium爬取网易云音乐评论 一.爬取工具 1.1 selenium ​ selenium这是一个第三方库我们可以通过 pip install selenium来安装这个第三方库. ​ Sele ...

  9. python+execjs爬取网易云评论

    python+execjs爬取网易云评论 分析网站 JS分析 execjs解密js 运行结果 代码 分析网站 首先打开网易云首页,随便点一首歌曲进入到评论区. 接着按F12进入开发者工具,重新刷新页面 ...

最新文章

  1. 分布式锁--Redis小试牛刀
  2. C语言--static修饰变量
  3. append函数_高质量python代码:考虑用生成器来改写直接返回列表的函数
  4. Flash正式成为Googel Chrome浏览器内置插件
  5. chrome默认为浏览器并且设置外部调用默认的启动参数
  6. 线程安全和对应的核心概念
  7. 从零实现深度学习框架——实现Debug功能与no_grad
  8. 解决:error C1083: 无法打开包括文件: “opencv2/opencv.hpp”: No such file or directory
  9. tcpudp测试工具的使用,串口转wifi模块udp测试
  10. Hive报错记录——林子雨教材
  11. WinMTR使用教程(附图)
  12. 南京建邺、秦淮等7个区公布校外培训机构白名单
  13. Python使用Turtle画帕劳共和国国旗
  14. 最好用的网易邮箱工具-网易邮箱助手
  15. JZOJ 6305.最小值【思维】【dp】
  16. git 配置origin_Git常规配置与用法
  17. MySql数据库的下载安装及使用(2020最新版)
  18. php 如何实现分页功能,php如何实现分页功能
  19. CVE-2019-3648漏洞分析
  20. 控制三色LED灯的闪烁——Arduino

热门文章

  1. 电子元器件的种类与作用(超全)
  2. gradient设置上下渐变_图解CSS: CSS渐变
  3. python 远程关机_Python 远程开关机
  4. matlab修改坐标轴刻度间隔大小
  5. LDA主题模型困惑度计算
  6. Linux内存管理(二)
  7. day12函数进阶作业
  8. python机票_某哪儿机票JS解密(3)--python调用node产生正确的航线和pre
  9. MBUS总线数据采集器
  10. PHP接入微信公众号(一)