python讨论qq群:996113038


导语

上次发过一篇关于“python打造电子琴”的文章,从阅读量来看,我们公众号的粉丝里面还是有很多对音乐感兴趣的朋友的。于是,今天我们也发一个与音乐相关的推送。

学过笛子,洞箫的朋友都知道,弹奏音乐的时候我们要按照简谱演奏。因为关于乐曲的信息全部在简谱里面。音调,音量,节奏。这些都是演奏音乐是最重要的元素。

今天,作为技术人。我们就用python爬虫批量下载简谱图片。

我们要爬取的网站是“简谱网”。

网址是:http://www.jianpuw.com/


代码及相关资源获取

1:关注“python趣味爱好者”公众号,回复“ 简谱 ”获取源代吗

2:加入群聊:996113038。在群文件中下载源代码以及相关资料。


开发工具

python3.6.4

相关第三方库:

requests

parsel

re


效果演示


基本原理

爬取简谱,其实说的简单一点就是爬取图片,这个道理很简单,简谱也是图片,以前我们爬取过妹子图。其实道理都差不多

10行代码爬取“小姐姐”图片

我们先通过requests获取网页源代码,然后分析网页。用parsel和re提取其中的图片的信息。

最后用requests获取图片,用f.write保存到本地文件夹里面。


往期精选

python实现“粒子动画”

python暴打“冠状病毒”小游戏


部分代码

首先要获取网页源代码,我们用到的是requests模块,为了防止被网站的反爬系统封掉ip地址,我们伪造了一个ip。

prox={'HTTP': '117.88.5.118:3000'}
response=requests.get(base_url,headers=headers,proxies=prox)

其中prox就是我们用到的代理ip。如果大家想批量下载ip。也可以看看历史消息(我们也发过爬取代理ip的程序)。

获取到源代码以后,我们需要分析其中的源代码:

这样,我们就可以提取到特定的简谱所在的网址,值得注意的是。href里面的网址不是完整的网址,需要和原始网页的网址连接到一起。形成一个新网址。然后获取这个新网址的网页源代码。如图所示

然后我们需要获取src里面的网址,和原始网址连接起来就是简谱图片所在的网址。我们访问这个网址就可以获得这个简谱图片。

最后,我们用一个for循环,循环获取所有的简谱所在的网址,然后批量下载。保存到本地。

其中img_name是获取简谱的图片名。

tu=requests.get(img_url, headers=headers,proxies=prox).content

由于图片是二进制格式,我们用到了content。

        img_name=img_url.split('/')[-1]tu=requests.get(img_url, headers=headers,proxies=prox).contentwith open('img\\'+img_name, 'wb') as f:f.write(tu)

              

感谢大家观看,有钱的老板可以打赏一下小编哦!

扫描下方二维码,关注公众号

参考资料:

图片来源:

https://images.pexels.com/photos/164821/pexels-photo-164821.jpeg?auto=compress&cs=tinysrgb&dpr=1&w=500

python爬虫批量下载“简谱”相关推荐

  1. 新一配:perl循环调用python爬虫批量下载喜马拉雅音频

    新一配:perl循环调用python爬虫批量下载喜马拉雅音频 手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性, ...

  2. 【爬虫实战项目】Python爬虫批量下载音乐飙升榜并保存本地(附源码)

    前言 今天给大家介绍的是Python爬虫批量下载音乐飙升榜并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是 ...

  3. 【爬虫实战项目】Python爬虫批量下载评书音频并保存本地(附源码)

    前言 今天给大家介绍的是Python爬虫批量下载评书音频并保存本地,在这里给需要的小伙伴们代码,并且给出一点小心得. 首先是爬取之前应该尽可能伪装成浏览器而不被识别出来是爬虫,基本的是加请求头,但是这 ...

  4. python爬虫 批量下载高清大图

    文章目录 前言 下载免费高清大图 下载带水印的精选图 代码与总结 前言 在上一篇写文章没高质量配图?python爬虫绕过限制一键搜索下载图虫创意图片!中,我们在未登录的情况下实现了图虫创意无水印高清小 ...

  5. 第二弹!python爬虫批量下载高清大图

    文章目录 前言 下载免费高清大图 下载带水印的精选图 代码与总结 前言 在上一篇写文章没高质量配图?python爬虫绕过限制一键搜索下载图虫创意图片!中,我们在未登录的情况下实现了图虫创意无水印高清小 ...

  6. python爬虫批量下载图片

    使用python的urllib库和正则表达式爬取 学习地址(自行base64解密):aHR0cDovL3BpYy5uZXRiaWFuLmNvbQ== 网站图片,支持批量下载. (本文仅供学习交流,请勿 ...

  7. Python爬虫批量下载文献

    最近在看NeurIPS的文章,但是一篇篇下载太繁琐,希望能快速批量下载下来. 于是想到了之前一直听说的python爬虫,初次学着弄一下. 用到了requests,BeautifulSoup,urlli ...

  8. Python 爬虫批量下载美剧 from 人人影视 HR-HDTV

    本人比較喜欢看美剧.尤其喜欢人人影视上HR-HDTV 的 1024 分辨率的高清双字美剧,这里写了一个脚本来批量获得指定美剧的全部 HR-HDTV 的 ed2k下载链接.并依照先后顺序写入到文本文件, ...

  9. Python爬虫批量下载电影链接

    现在爬虫这么流行,学了点正则表达式的我就想着用(.*?)去实现一切偷懒的事.前两天看上了电影天堂这个网站,于是开始想:要不一次性爬取一页的视频下载链接试试.下面是这个网站的简图,接下来的任务就是把最右 ...

最新文章

  1. presto能连接mysql和hive吗_Presto连接Hive
  2. cuda版本的word2vec
  3. C# 子类实例化基类 基类使用不了子类的方法_老话题:6个方法,检验你有没有正确使用设计模式...
  4. NofairSync.tryAcquire
  5. Html5响应式设计与实现广场
  6. 一个好用的小工具 thefuck
  7. javascript Class-based vs. prototype-based
  8. 【贪心】 【HDU 5821】 Ball
  9. 82相似标准形03——不变因子、行列式因子、相抵标准形的唯一性、用求行列式因子法求标准形
  10. 力扣(SQL)584. 寻找用户推荐人
  11. AW349 黑暗城堡
  12. python魔方程序算法_《Python基础教程》第9章 魔方方法、属性和迭代器
  13. 创业与投资 -谈谈融资这个事儿(下)
  14. 【牛客SQL】SQL45 将titles_test表名修改为titles_2017
  15. 【excel】定位列内差异/定位行内容差异单元格
  16. 网络流中最大流和最小割算法
  17. 怎样快速锁定计算机加密硬盘,教你如何进行BitLocker加密
  18. 图像中里面的Ground Truth是什么意思
  19. 构建大型云计算平台分布式技术的实践
  20. 微信小程序自定义组件数据、方法和属性

热门文章

  1. 高集成AX6800x USB KVM多电脑切换器单片机解决方案介绍视频
  2. 树状数组、线段树、分块 在同一题目中的应用(Acwing 243)
  3. latex公式斜体_LaTeX技巧902:使斜体中的括号保持直立
  4. 巴比特 | 元宇宙每日必读:一文了解虚拟人的3大业务方向和7种赚钱方式
  5. 计算机视觉 常用坐标系一览
  6. Docker容器化开发
  7. JAVA程序员笔试面试题汇总及答案 .
  8. 为什么大学老师只教c语言,开挂的相声演员:做大学老师,主讲计算机C语言,课堂爆笑不断!...
  9. Flooded! POJ - 1877 模拟题
  10. SpringBoot 项目修改html后不需要重新启动(热部署)