这次的数据分析工具是Python,当然如果你Python不是很熟,用tableau也是可以的,做出的图还会更好看。

一、数据准备

1、导入数据

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df.head()

这些代码都是不需要思考的,只要打开Python做数据分析,你首先就写好,或者直接复制就行,我都是把常用代码保存好,要用的时候就调出来用,这样省时间。

列的名称都是英语,我借助了百度做了下翻译:

  • Track.Name-曲目;

  • Artist.Name-歌手;

  • Genre - 类型

  • Beats Per Minute (BPM) - 每分钟节拍,也就是节奏.

  • Energy - 能量 - 分数越高,代表能量就越大;

  • Danceability - 舞蹈性-分数越高,代表你越容易因歌而舞;

  • Loudness (dB) - 分贝-值越大,说明歌曲越响亮,反之则低沉;

  • Liveness -现场性-值越大,歌曲越有可能是现场录音的;

  • Valence - 情绪-值越大,情绪越激昂,反之越消沉;

  • lentgh-时长;

  • Acousticness -音质;.

  • Speechiness -语言-值越大,说明口语化程度越高;

  • Popularity -火热程度。

2、数据列的名称更改

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘节奏’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df.head(10)

看英语的总是不习惯,所以我们可以把英语的列名改为中文。

二、数据分析

1、2019全球最流行的音乐类型排行

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘音调’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df=df.groupby(‘类型’)[‘曲名’].count().reset_index()

df=df.sort_values(by=‘曲名’,ascending=False).reset_index()

cloud=WordCloud(title=‘2019最流行的音乐类型’,width=800,height=420)

cloud.add(name=‘音乐类型’,attr=df[‘类型’],value=df[‘曲名’],word_size_range=(12,60))

cloud.render(‘2019全球最流行的音乐类型.html’)

cloud

从词云图可以看到,2019年全球最火的还是流行音乐(pop&dance pop)。鉴于其他类型的音乐我都不认识,所以下面的分析,我会直接对pop&dance pop作为主要对象,把他们归为一类。

2、2019年全球流行音乐排行

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘音调’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df=df.replace(‘dance pop’,‘pop’)

df=df[df[‘类型’]==‘pop’].reset_index().drop(‘index’,axis=1)

df

通过上述代码,我已经把dance pop的类型全部换成pop。

#接上面的代码

df=df.replace(‘dance pop’,‘pop’)

df=df[df[‘类型’]==‘pop’].reset_index().drop(‘index’,axis=1)

df.pivot_table(df,index=‘曲名’).sort_values(by=‘火热程度’,ascending=False).reset_index()

How Do You Sleep?

这是全球最流行的15首流行歌曲。

结合前面的图我们可以知道:这些流行歌曲的口语化程度低,歌词普遍比较优美,有意境;同时时长恰当,多在3分钟左右…

3、根据流行程度对歌曲进行分类颁奖

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

from pyecharts import Bar,WordCloud,Pie,Line

%matplotlib inline

%config InlineBackend.figure_format = ‘svg’

df=pd.read_excel(r’C:\Users\Administrator\Desktop\top50.xlsx’)

df=df.rename(columns={‘Track.Name’:‘曲名’, ‘Artist.Name’:‘歌手’, ‘Genre’:‘类型’, ‘Beats.Per.Minute’:‘音调’, ‘Energy’:‘能量’,

‘Danceability’:‘舞蹈性’, ‘Loudness…dB…’:‘分贝’,‘Liveness’:‘现场感’, ‘Length.’:‘时长’,‘Speechiness’:‘语言’, ‘Popularity’:‘火热程度’})

df=df.replace(‘dance pop’,‘pop’)

df=df[df[‘类型’]==‘pop’].reset_index().drop(‘index’,axis=1)

df=df.pivot_table(‘火热程度’,index=‘曲名’).sort_values(by=‘火热程度’,ascending=False).reset_index()

def grade(火热程度):

if

(火热程度>=90):

return ‘年度最热’

if(火热程度>=85):

return ‘年度火热’

else:

return ‘年度流行’

现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习


(火热程度>=85):

return ‘年度火热’

else:

return ‘年度流行’

现在能在网上找到很多很多的学习资源,有免费的也有收费的,当我拿到1套比较全的学习资源之前,我并没着急去看第1节,我而是去审视这套资源是否值得学习,有时候也会去问一些学长的意见,如果可以之后,我会对这套学习资源做1个学习计划,我的学习计划主要包括规划图和学习进度表。

分享给大家这份我薅到的免费视频资料,质量还不错,大家可以跟着学习

Python分析盘点2019全球流行音乐:是哪些歌曲榜单占领了我们?相关推荐

  1. python里的英文歌叫什么_Python分析盘点2019全球流行音乐:是哪些歌曲榜单占领了我们?...

    写在前面:圣诞刚过,弥留者节日气息的大家是否还在继续学习呐~在匆忙之际也不忘给自己找几首好听的歌曲放松一下,缠绕着音乐一起来看看关于2019年流行音乐趋势是如何用Python分析的吧! 昨天下午没事儿 ...

  2. 计算机语言企业使用率,2019年十大企业级编程语言榜单

    硬件与软件的组合是推动技术进步的主要因素.顶级编程语言,更成为当前我们所熟知的众多现代与新兴技术的核心组成部分.时至今日,开发人员面对的编程语言在数量上远超以往任何时期.同样的,各类 IT 外包企业也 ...

  3. 重磅!全球前2%顶尖科学家榜单发布!

    来源:学之策综合整理自Mendeley Data.知乎(@康氏健康说) 全球前2%顶尖科学家榜单(World's Top 2% Scientists 2020)由斯坦福大学John P.A.Ioann ...

  4. 荣誉 | 百望云荣登“2022全球独角兽企业500强”榜单

    一般来说,我们把企业估值超过10亿美元,又没有上市的企业,称作"独角兽"公司.作为衡量一个国家和地区创新能力与创新生态的重要风向标,独角兽企业所独有的创新经济活力,不仅被市场寄予厚 ...

  5. 2018福布斯全球科技女性TOP 50榜单:李飞飞、滴滴柳青上榜

    铜灵 编译整理 量子位 出品 | 公众号 QbitAI 福布斯2018年全球科技女性TOP 50榜单来了. 这份成就高.颜值同样高的全球科技女性榜中,华裔计算机视觉科学家李飞飞.滴滴总裁柳青等熟悉的华 ...

  6. 网易云信入选《SegmentFault 思否 2019 中国技术品牌影响力企业榜单》!

    近日,SegmentFault 思否作为中国最大的新一代开发者社区,依托数百万开发者用户行为数据,及科技企业技术品牌在国内市场的大数据分析,评选出 30 家在开发者领域最具影响力的科技企业,权威发布& ...

  7. 2018全球最强物联网公司榜单揭晓

    2018全球最强物联网公司榜单揭晓 | 20家企业物联网战略大起底 导言:IDG旗下杂志<NetWork World>近期公布了全球最强物联网公司名单.本文根据入选评语,对20家企业战略布 ...

  8. 不能错过的人工智能全球 2000 位最具影响力学者榜单

    本文转载自学术头条(公众号ID:SciTouTiao),未经许可请勿二次转载. 跟踪全球 250,669 位学者 跨越 10 余年研究成果 (2009 - 2019) 筛选 140,377 篇论文数据 ...

  9. 《2018全球自动化系统集成商20强榜单》

    2018年3月22日,享有"物流界奥斯卡"之称的2018中国物流技术奖落幕一个月后,2018年5月,美国权威物料搬运领域杂志<MMH>公布了2017年全球自动化系统集成 ...

最新文章

  1. HDU 2561 第二小整数
  2. 讲讲 group by 的plus版
  3. linux分区表与uboot,Linux和Uboot下eMMC boot分区读写
  4. Python模块之hashlib:提供hash算法
  5. java.sql.SQLException: ORA-00604: 递归 SQL 级别 1 出现错误
  6. LeetCode 135. 分发糖果(DP)
  7. Win7系统账户被禁用的解决方法
  8. Python练习:平方值格式化
  9. eval函数python_Python eval()函数
  10. tm1639c语言程序,51单片机各种汇编延时子程序整理汇总
  11. HTML + CSS + JS知识点复习(第一次)
  12. (转) latch 入门
  13. Ink脚本语言学习笔记(一)
  14. 数据结构课设 (快餐店 POS 机计费系统、成绩分析、算术表达式)
  15. 【原创】VBA学习笔记(6)VBE编辑器,VBA工程,各种窗口
  16. html图片格式有什么,jpeg是一种什么格式?
  17. 【数据应用案例】异动分析——指标逻辑树
  18. Julia 安装,使用教程
  19. HackTheBox MetaTwo 网站框架CVE获取用户shell和破解私钥提权
  20. 外卖O2O的用户画像实践

热门文章

  1. 如何设计可视化搭建平台的组件商店?
  2. 该内存不能为read的解决办法:内存不能为read修复工具
  3. #Sora#peewee管理数据库——笔记
  4. Mongo之中标麒麟V7环境下安装解压版
  5. 为什么说php是个玩具,买玩具的目的是什么
  6. spring中bean的生命周期(简单5步)
  7. win10 操作中心是灰色无法选择 终极解决方法
  8. ForkJoinPool 大型图文现场
  9. java数据字典tag,数据字典
  10. 洛谷 P1914.小书童——密码