#刚入门,大佬莫入
#程序功能:输入歌手名称后,程序会生成一个Word文件,Word文件里包括歌手名称、照片和所有歌曲列表!
import requests, time
import math
from docx import Document
from docx.shared import Inches
from PIL import Image
import urllib.parse
session = requests.session()
doc=Document()
doc.add_heading("歌手简介",0)          #对Word文件设置标题
pnum=1                                 #歌曲列表页数,默认第一页
singer=input("请输入歌手名字:")        #输入歌手名称
print('-----歌手名称获取完毕----'+singer)#设置头文件
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36'}
print("歌曲正在获取中...",end='')#设置爬取网页
url='https://c.y.qq.com/soso/fcgi-bin/client_search_cp?ct=24&qqmusic_ver=1298&new_json=1&remoteplace=txt.yqq.song&searchid=64237867394891329&t=0&aggr=1&cr=1&catZhida=1&lossless=0&flag_qc=0&p='+str(pnum)+'&n=10&w='+singer+'&g_tk_new_20200303=282554382&g_tk=282554382&loginUin=2&hostUin=0&format=json&inCharset=utf8&outCharset=utf-8&notice=0&platform=yqq.json&needNewCode=0'
r = session.get(url, headers=headers)
songname = r.json()['data']['song']['list'][0]['title']               #爬取歌曲名
purl=r.json()['data']['zhida']['zhida_singer']['singerPic']           #爬取歌手照片的网址
singername=r.json()['data']['zhida']['zhida_singer']['singerName']    #爬取歌手名
doc.add_paragraph("姓名:"+singername)             #给Word文件里添加歌手名
r=requests.get(purl,headers)                #请求歌手照片
with open("wang.jpg",'wb') as f:f.write(r.content)             #创建歌手照片
pic='wang.jpg'
try:doc.add_picture(pic, width=Inches(2))     # 添加图, 设置宽度
except Exception:jpg_ima = Image.open(pic)    # 打开图片jpg_ima.save(pic)           # 保存新的图片doc.add_picture(pic, width=Inches(2))     #照片存入到新的Word文件doc.add_paragraph("歌曲列表")      #在Word中存储‘歌曲列表’四个字
for pnum in range(1,20):         #循环歌曲列表页数,页数自己定,页数超范围会报错for j in range(0,10):       #循环每一页歌曲url='https://c.y.qq.com/soso/fcgi-bin/client_search_cp?ct=24&qqmusic_ver=1298&new_json=1&remoteplace=txt.yqq.song&searchid=64237867394891329&t=0&aggr=1&cr=1&catZhida=1&lossless=0&flag_qc=0&p='+str(pnum)+'&n=10&w='+singername+'&g_tk_new_20200303=282554382&g_tk=282554382&loginUin=2&hostUin=0&format=json&inCharset=utf8&outCharset=utf-8&notice=0&platform=yqq.json&needNewCode=0'     #歌曲列表网址r = session.get(url, headers=headers)songname = r.json()['data']['song']['list'][j]['title']   #爬取歌曲名称doc.add_paragraph(songname)     #保存歌曲名称
print('\n-----------歌曲列表获取完毕-----------')doc.add_page_break()
doc.save(singername+'.docx')     #保存Word文件
print('-----------Word文件保存完毕-----------')

python爬虫入门——QQ音乐歌手照片及歌曲列表爬取相关推荐

  1. php 获取字符串首歌,PHP爬虫 网易云音乐歌手和热门歌曲信息抓取

    序章 PM最近问我要网易云的歌手的热门歌曲的信息,作为数据分析.说起网络爬虫我们都不陌生,我们分析网站的HTML的格式和URL的通用格式来写相应的算法.然后请求对应的URL来获取HTML字符串,因此总 ...

  2. Python爬虫入门教程 15-100 石家庄政民互动数据爬取

    写在前面 今天,咱抓取一个网站,这个网站呢,涉及的内容就是 网友留言和回复,特别简单,但是网站是gov的.网址为 http://www.sjz.gov.cn/col/1490066682000/ind ...

  3. Python爬虫入门教程07:腾讯视频弹幕爬取

    前言

  4. Python爬虫入门教程14:喜马拉雅有声书音频爬取

    基本开发环境

  5. Python爬虫 | 对广州市政府数据统一开放平台数据的爬取

    Python爬虫 | 对广州市政府数据统一开放平台数据的爬取 简单爬虫 网页分析 爬虫代码 简单爬虫 本次爬虫演示的是对 广州市政府数据统一开放平台 数据的爬取 网页分析 我们先到url=' http ...

  6. Python爬虫系列之多多买菜小程序数据爬取

    Python爬虫系列之多多买菜小程序数据爬取 小程序爬虫接单.app爬虫接单.网页爬虫接单.接口定制.网站开发.小程序开发> 点击这里联系我们 < 微信请扫描下方二维码 代码仅供学习交流, ...

  7. Python爬虫系列之MeiTuan网页美食版块商家数据爬取

    Python爬虫系列之MeiTuan网页美食版块商家数据爬取 小程序爬虫接单.app爬虫接单.网页爬虫接单.接口定制.网站开发.小程序开发> 点击这里联系我们 < 微信请扫描下方二维码 代 ...

  8. 「Python爬虫系列讲解」十二、基于图片爬取的 Selenium 爬虫

    本专栏是以杨秀璋老师爬虫著作<Python网络数据爬取及分析「从入门到精通」>为主线.个人学习理解为主要内容,以学习笔记形式编写的. 本专栏不光是自己的一个学习分享,也希望能给您普及一些关 ...

  9. python爬虫和数据分析的书籍_豆瓣书籍数据爬取与分析

    前言 17年底,买了清华大学出版社出版的<Hadoop权威指南>(第四版)学习,没想到这本书质量之差,超越我的想象,然后上网一看,也是骂声一片.从那个时候其就对出版社综合实力很感兴趣,想通 ...

最新文章

  1. Eclipse技巧:1.定制toString()模版
  2. 网易云信亮相LiveVideoStackCon 2019,分享BBR在实时音视频领域的应用
  3. 智能循迹避障小车C语言程序编写思路,基于单片机的智能小车红外避障循迹系统设计与制作...
  4. WordPress主题:zibll3.3完美绿色版 子比主题
  5. CentOS添加明细路由
  6. stm32F051系列 单片机引脚定时器输出pwm波形控制风扇转速
  7. html未填写提示,文本框输入信息,未输入的文本框会提示输入,并且未输入的文本框会变红...
  8. [转载] 羽毛球——学打羽毛球 05 正手发后场高远球练习方法
  9. 全球名校AI课程库(36)| 辛辛那提大学 · 离散数学课程『MATH1071 Discrete Math』
  10. Java实现二分查找算法(非递归)
  11. 分布式系统的完整介绍
  12. Vue表格table样式
  13. html点击按钮跳转到另一个界面_网页制作:一个简易美观的登录界面
  14. 360如何查看计算机配置文件,win7中怎么查看路由器配置文件config.bin
  15. antd走马灯组件自定义前进后退按钮
  16. 构之以技术,付之以匠心——读《构建之法》有感
  17. krpano场景拖动时拖动惯性消失的问题
  18. 博林格林大学计算机排名,美国传媒研究生排名简述
  19. swss-bd-interview
  20. ICRA 2021| SLAM方向论文汇总

热门文章

  1. 有限元-朗格朗日和欧拉描述的区别
  2. [数据科学]000.我为什么当数据科学家
  3. PTA 7-114 用if-else语句编程百分制成绩转换为五分制成绩
  4. 铝碳化硅封装材料行业研究及十四五规划分析报告
  5. 【二叉树前/先序DLR中序LDR后序LRD遍历及镜像翻转,so esay~】
  6. 武汉新时标文化传媒有限公司短视频创作者实现突围?
  7. 默哀日网站置灰,支持IE浏览器h5
  8. 【机器学习】模型评估与选择--西瓜书第二章
  9. 乐事薯片:价格涨了,质量降了,年轻人的快乐没有了
  10. Hbuilder 教程