本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理

以下文章来源于腾讯云 作者:企鹅号小编

( 想要学习Python?Python学习交流群:1039649593,满足你的需求,资料都已经上传群文件流,可以自行下载!还有海量最新2020python学习资料。 )

python爬虫库的选择

如果你已经了解一些python的基础,那不妨来搞点事情做,比如说做个爬虫,python的爬虫库相当的多,我建议初学者从requests库学起就好,为什么这么说,因为这个库对新手来说特别的友好,Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。

安装requests库

要安装 Requests,只要在你的终端中运行这个简单命令即可:pip install requests,前提是你已经安装好pip了。

发送请求

一开始要导入 Requests 模块:

import requests

然后,尝试获取某个网页:

r = requests.get(‘https://www.baidu.com’)

我们可以从r这个对象中获取所有我们想要的信息,但这也仅是 Requests 的冰山一角,requests的中文文档也很全,建议读一下,你会感觉这个库是真的好用,让我们来实战操作一下,可以让你掌握的知识有用武之地。

抓取网易云音乐的歌词

打开网易云随便点开一首歌,找到它的链接,比如:

网页地址栏那里就是当前音乐的地址,点击F12进入开发者模式,找到实际的歌词网址,红色箭头指向的才是它实际的网址:

python爬虫代码

下面这段代码是params,你可以直接复制到下面的代码中

fz7s/Zfb0YZFub+HjxWhGTCjvUmBeXpJB6pSTFhn/ffM0DNClA5LMv1JhWC8pi4WrAICWGMQlcVcV0zrsPaJZo8P4fq7mhieN43eP9iluDrDrCmFSwvCju7uYsPOn/qU','encSecKey':'33604d40f5300f64c2acc4f620fcb31f82c1dd5d04ef019f158c46f17b5c0b32ef129df6549cba55a71dec47bbb407120e59850a9c3380c98a06b6d087a56c169873ec930a55212314e9c91b56b4dedf6709e3ef7e7608055aa8511a6afbc31514f5fe353bbc3900e7a735f4d61263e4051a6c96afc0725187b21e6a7a38d5ce

下面这段代码是headers的代码,我的是谷歌浏览器

Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.96 Safari/537.36

正式代码如下:

#首先导入用到的库import requestsimport reimport jsondef download_music(): #找入口链接,抓数据 lrc_url = 'http://music.163.com/weapi/song/lyric?csrf_token=' #这是需要传递的form data 和 headers 参数 data = {'params': params} headers = {'User-Agent': headers} #构造requests请求,传入它需要的参数 html = requests.post(lrc_url, data=data, headers=headers) #获取歌词,可以得到歌词字符串 json_obj = html.text #用json.loads方法把str转换成dict json_dic = json.loads(json_obj) #可以看到它是包裹在'lrc'>'lyric'中 lrc = json_dic['lrc']['lyric'] #利用正则把时间段替换掉 pattern = re.compilr(r'[.*]') lrc = re.sub(pattern, '', lrc) print(lrc) #调用download_music函数if __name__ == '__main__': download_music()

代码运行完毕

到这里代码就完成了,你可以自己试着敲一下,里面涉及到的知识点有点多,你可以去网上找一下正则和json方面的知识,了解一下。到这里这篇教程就结束了,下篇文章会给大家带来一样精彩的内容,喜欢的可以点个关注!!!

python爬歌词_python爬虫抓取某易云音乐歌词,从此不在下载相关推荐

  1. python爬取歌词_利用Python网络爬虫抓取网易云音乐歌词

    今天小编给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌曲ID: 调用网易云歌曲API,获取歌词: 将歌词写入文件,并存入本地 ...

  2. python爬虫网易云音乐最热评论并分析_Python3实现爬虫抓取网易云音乐的热门评论分析(图)...

    这篇文章主要给大家介绍了关于Python3实战之爬虫抓取网易云音乐热评的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. ...

  3. python爬虫网易云音乐评论最多的歌_Python3实战之爬虫抓取网易云音乐的热门评论...

    前言 之前刚刚入门python爬虫,有大概半个月时间没有写python了,都快遗忘了.于是准备写个简单的爬虫练练手,我觉得网易云音乐最优特色的就是其精准的歌曲推荐和独具特色的用户评论,于是写了这个抓取 ...

  4. Python3爬虫抓取网易云音乐热评实战

    前一段时间刚刚入门python爬虫,有大概半个月时间没有写python了,都快遗忘了.于是准备写个简单的爬虫练练手,我觉得网易云音乐最优特色的就是其精准的歌曲推荐和独具特色的用户评论,于是写了这个抓取 ...

  5. python基础教程网易云_Python爬虫教程:网易云音乐歌词

    开发工具 **Python版本:**3.5.4 相关模块: requests模块: bs4模块: win_unicode_console模块: jieba模块: matplotlib模块: xlwt模 ...

  6. 使用爬虫抓取网易云音乐热门评论生成好玩的词云

    互联网爬虫是一个很有意思的技术,借由爬虫,我们可以做到很多好玩的事情--这其中就包括爬取评论. 词云就是个更好玩的技术,通过技术方法分析词语出现频率,生成可视化的图形,将文字内容用图形呈现,想想就很意 ...

  7. 爬虫抓取网易云音乐民谣歌单,收听量排行

    今天花了一点时间抓取了网易云音乐的热门民谣歌单,共1500热门民谣歌单,后续有时间会爬取其他分类.文末有源代码下载. 下面记录一下过程. 爬虫过程 1.首先抓取各个歌单的url与标题 public s ...

  8. python趣图_Python爬虫抓取暴走漫画上GIF趣图的代码

    本节内容: python爬虫实现代码 用 python3.3 实现的爬虫,主要爬取暴走漫画上的GIF趣图. 方便地下载很有意思的gif以便离线观看. 主要用到了 urllib.request 和 Be ...

  9. python 爬虫保存封面_Python爬虫Demo--获取网易云音乐专辑封面

    #-*- coding: UTF-8 -*- import requests import os from bs4 import BeautifulSoup from selenium import ...

最新文章

  1. Hibernate 学习笔记(二)—— Hibernate HQL查询和 QBC 查询
  2. Linux学习总结 (未完待续...)
  3. k-core与k-shell的区别
  4. 劫起|再谈Linux epoll惊群问题的原因和解决方案
  5. mongodb的架构 副本集搭建
  6. 阶段3 1.Mybatis_05.使用Mybatis完成CRUD_7 Mybatis中参数的深入-使用实体类的包装对象作为查询条件...
  7. laravel 集合从父中移除_在 Laravel 7 中优雅使用 UUID 教程
  8. DaleCloud(原NFine)介绍二:系统菜单及菜单按钮权限控制
  9. Dijkstra算法与Floyd算法
  10. 简单教程-word2vec处理英文语料
  11. 一:log4j2配置文档
  12. Tilemap瓦片地图
  13. MySQL 的查询优化
  14. python浏览器怎么设置_如何用python控制浏览器
  15. selenium报异常:it is not in the current frame context, or the document has been refreshed
  16. Android系统设置单双卡
  17. 李开复:AI 创业的十个真相 | 深度
  18. Mac OS中使用VScode配置C++语言开发环境
  19. 2021.12.11 烹饪
  20. linux操作redis

热门文章

  1. 山东工商学院计算机拟录取,2019年山东工商学院拟录取名单公示
  2. 一步一步了解区块链技术
  3. python如何调用函数计算出成绩的不及格率_Excel利用这个函数轻松完成自动计算及格率、合格率...
  4. 超详细的--STP理论
  5. matlab火星漫游车转向控制,OSG开发笔记(二十四):OSG漫游之平移与转向
  6. 怎样给Tab Control控件加上背景颜色或图片
  7. oracle数据库创建表空间的语句
  8. 【Unity】由预制体实例获取预制体资源及预制体资源路径
  9. 导图解文 从梦想到财富(13)你的运气,为什么一直不好?
  10. echarts修改横轴/xAxis的样式