大数据分析,带你认识一个你从未见过的周杰伦
周杰伦可以说是大多数90后的青春了,连我妈这种从来不咋看新闻的人也知道他。
你是否曾在初中时抄过他的歌词?你又是否曾经将他的歌词写进作文?
今天我就用大数据来分析一波他的所有歌词,带你认识一个你从未见过的周杰伦。
获取周杰伦的所有歌词
这件事其实不难,我们写个代码从QQ音乐上自动收集就行了。说来也是心酸,以前一直用网易云音乐的,后来周杰伦版权没了,就只能投身了QQ音乐。
代码我都开源出来了,也不用大家自己运行,歌词文件我都放在下面了:
https://github.com/godweiyang/lyric-crawler/tree/master/output
里面有两个歌词文件是关于周杰伦的:周杰伦_歌词.txt
和周杰伦_歌名.txt
,分别保存了他出道以来唱过的所有歌曲的歌词和按照专辑分类的歌曲名称,当然不包括演唱会和Live版本。
一共整整「174」首!这个数量已经是相当多了,当然这里面还包括了蔡依林和他合唱的两首歌:《骑士精神》和《布拉格广场》,还有李玟的《刀马旦》等等,我也都算进去了。
谁作曲最多?
经过简单统计可以惊人地发现,在174首歌曲中,周杰伦亲自作曲的歌曲竟然高达171首!
那三首非本人作曲的分别是袁咏琳作曲的《画沙》、派伟俊作曲的《Try》和Funky Monkey Babys作曲的《你是我的OK绷》。
老杰迷应该都知道杰伦的作曲是有多么的牛批。《夜曲》一响,上台领奖,颁奖词都说的词穷了。时至今日这首歌还是我的手机铃声。
谁作词最多?
统计下来可以发现作曲量排名前五位的分别是:
- 方文山:96首
- 周杰伦:42首
- 黄俊郎:15首
- 徐若瑄:6首
- 宋健彰:4首
大家应该都知道,周杰伦最好的搭档就是方文山。可以说方文山和周杰伦相互成就了对方,方文山的中国风配上周杰伦的曲简直就是天造地和。
而杰伦自己作词的歌也不在少数,虽然很多人都吐槽他的《等你下课》和《不爱我就拉倒》歌词简单土味,但不可否认的是他也能写出《晴天》、《稻香》这样的神级歌曲。
周杰伦最常用的词语
我对周杰伦所有的歌词统计了一下词频,生成了一个词云:
可以看到杰伦最常用的五个词语是:
- 离开
- 回忆
- 微笑
- 世界
- 爱情
周杰伦前期基本都是苦情歌,常使用这些词也不足为奇。比如《退后》中的“天空灰得像哭过,离开你以后,并没有,更自由”,《晴天》中的“好想再问一遍,你会等待还是离开”,《花海》中的“不要你离开,距离隔不开,思念变成海,在窗外进不来”,等等等等。
而到了后期,特别是结婚后,这种歌曲基本就销声匿迹了,更多的是《告白气球》这种甜歌:“花店玫瑰,名字写错谁,告白气球,风吹到对街,微笑在天上飞”。
周杰伦最爱的季节
杰伦最爱什么季节呢?从他所有歌词中可以统计出,春夏秋冬四个季节分别出现的次数是:
- 春天:7次
- 夏天:17次
- 秋天:33次
- 冬天:18次
可以看出,周杰伦最爱写的季节其实还是秋天和冬天,这也符合他大多数歌曲都是苦情歌的实际情况。一首《枫》里的“缓缓飘落的枫叶像思念,为何挽回要赶在冬天来之前”,非常伤感。这首歌也成为了周杰伦唱的难度最高的歌之一,他本人几乎都没有在演唱会上唱过。
周杰伦最爱的天气
粗略统计了一下,周杰伦最爱的三种天气是:
- 雨天:150次
- 雪天:31次
- 晴天:12次
其中雨天更是常客,《晴天》中的“刮风这天,我试过握着你手,但偏偏,雨渐渐,大到我看你不见”,《给我一首歌的时间》中的“雨淋湿了天空,毁得很讲究,你说你不懂,为何在这时牵手”。雨是最能寄托思念的物品,因此也成为了杰伦的最爱。
周杰伦最爱的心情
人有四种心情,喜怒哀乐,分析周杰伦歌词中出现的心情词语,常用的有这么几个:
- 喜(开心):17次
- 怒(生气、怒火):10次
- 哀(难过、忧伤):41次
- 乐(快乐):32次
可以看出周杰伦表达最多的情感是哀,其次是乐,其实这也是前期苦情歌太多导致的。比如《黑色幽默》的第一句“难过是因为闷了很久,是因为想了太多,是心理起了作用”,作为第一张专辑中的主打歌曲,当时就已经走上了苦情歌的路了。
2010年前后周杰伦歌曲对比
网上很多人都持有一个观点,那就是从2010年周杰伦的《跨时代》专辑开始,他的专辑质量就出现了明显下滑。很多人还因此嘲讽,说什么江郎才尽之类的话。那么事实真的如此吗?我们还是用数据来说话。
常用词语变化
首先来看看2010年前后的最常用词语有哪些变化:
可以看到2010年以前最常用的词语是:离开、回忆、微笑、时间,而2010年之后最常用的词语变成了:hey、公公、世界、我会、微笑、靠靠。可以看出确实用词上2010年之后明显变得不如2010年之前了,这也正常,后期方文山为周杰伦作词也不如以前多了。
作词变化
那么方文山后期到底还为周杰伦作了多少词呢?我统计了2010年前后方文山和周杰伦各自作词的数量:
- 2010年之前:方文山52首,周杰伦20首,总共93首
- 2010年之后:方文山29首,周杰伦16首,总共56首
可以看到,周杰伦2010年之后作品数量减少很多,这几年甚至都不出专辑了。这也没办法,杰伦也不小了,但是他的神专已经足够多的让人难以超越了。
而2010年之后方文山虽然作词总数大幅减少,但是占比依然是很高的,同时周杰伦自己作词的占比提升不少。这也抨击了那些说周杰伦成名后就和方文山关系不好了之类的言论,最后一个专辑《周杰伦的床边故事》,方文山都还为周杰伦作词整整6首!
做最好的自己
周杰伦引领了2000年后中国的流行乐坛,开创了中国风歌曲的先河,很多歌曲现在听依然感觉领先整个时代。
他一直坚持自己的风格,很多歌都具有教育意义。《稻香》诉说了对家乡的思念,《止战之殇》诉说了对和平的渴望、《听妈妈的话》诉说了对妈妈的感恩,等等等等。《千山万水》更是被国家博物馆收藏,他也成为了北京奥运会唯一一位独唱的歌手,排面十足。
就像周杰伦在《土耳其冰淇淋》中唱的那样,炫技、牛批就完事了,要做就做不一样的自己:
谁说拍中国风 一定要配灯笼
谁说写中国风 一定要商角徵羽宫
我干脆自己下车 指挥乐坛的交通
管他管他什么曲风
这首也是《周杰伦的床边故事》专辑中周杰伦一手包办了作词、作曲、编曲的炫技歌曲。不像《告白气球》那样为了迎合大众而写的口水歌,这首歌表达出了周杰伦自己的个性,编曲也非常的厉害。
感谢周杰伦,感谢你出现在了我的青春里。如果给我一次机会,我一定要去看一场你的演唱会!
大数据分析,带你认识一个你从未见过的周杰伦相关推荐
- API管理源码一个你从未见过的全新版本界面
介绍: 本源码之前为版本,但是因为作者疏忽被解密后就开源了 上图为后台,前台请看演示站:api.lisweb.cn 因为原本后台获取IP的接口已经失效,所以我把自己改的加上去了 Data/api.ph ...
- R3Query 大数据分析系统2017将发布免费个人版
R3 Query 大数据分析系统介绍: R3 Query大数据分析展现平台是一个解决企业级报表系统问题的新方案,为企业的管理层.决策层展现隐藏在数据背后的信息和规律,为管理的科学化.精细化提供有利的技 ...
- “入门大数据分析:探索海量数据的奥秘“
随着时代的进步,大数据分析逐渐成为了各个领域中重要的工具之一.它不仅能够帮助企业发掘商业价值,还可以为科学研究提供更精确的数据支持.对于初学者来说,入手大数据分析也不是很难,只需掌握一些基本的概念和工 ...
- 旅游APP大数据分析:带你找到最佳旅游路线
如今,旅游App已经成为了现代旅游的必备工具,而在这个数字化的时代,大数据的应用已经成为了旅游App的重要手段.本文将介绍旅游App大数据分析的应用,带你找到最佳旅游路线. 一.大数据在旅游App中的 ...
- qtablewidget 数据量大效率很低_让大牛带你走进大数据分析:R基础及应用的潮流尖端,享受RHadoop...
走进R,走进大数据时代数据分析的潮流尖端,掌握R语言,熟悉大数据的基础概念和R与Hadoop结合进行大数据的处理分析. 大数据时代, R以其强大的数据分析挖掘.可视化绘图等功能,越来越受到社会各个领域 ...
- java的for循环取出数据只是拿到最后一个_新兴大数据分析榆中百合
新兴大数据分析榆中百合 大数据流程 从流程角度上看,整个大数据处理可分成4个主要步骤. 处理流程图 分为三层(数据采集层,数据存储与计算处理层,数据可视化): 表2-1 系统环 ...
- 【金猿产品展】Smartbi一站式大数据分析平台——一个平台、所有数据、无限可能。...
思迈特软件产品 本项目由思迈特软件投递并参与"数据猿年度金猿策划活动--2022大数据产业创新服务产品榜单及奖项"评选. 数据智能产业创新服务媒体 --聚焦数智 · 改变商业 ...
- 搭建一个大数据分析处理平台,主要划分为哪几步?
(1)操作系统的选择操作系统一般使用开源版的RedHat.Centos或者Debian作为底层的构建平台,要根据大数据平台所要搭建的数据分析工具可以支持的系统,正确的选择操作系统的版本. (2)搭建H ...
- 收藏 | 100+篇大数据学习资讯,带你玩转大数据分析!
2019独角兽企业重金招聘Python工程师标准>>> 深度解析如何挑选适合自己的Hadoop平台 什么是Hadoop,怎样学习Hadoop 分布式文件系统HDFS解析 Hadoop ...
- 推荐一个多功能且实用的shopee大数据分析系统―—知虾数据
推荐一个多功能且实用的shopee大数据分析系统―-知虾数据 知虾数据能帮助卖家轻松地掌握各大站点的数据,从而提高选品的准确度,有效引流,最终打造超卖爆单店铺,助力Shopee卖家实现跨境电商的追光之 ...
最新文章
- 24、Java并发性和多线程-信号量
- Linux acl权限
- 超图桌面版打开外部矢量文件
- mano安全_爱立信:O-RAN存在的安全风险
- 深入理解ajax系列第六篇——头部信息
- python paramiko并发_使用Python paramiko模块利用多线程实现ssh并发执行操作
- UNITY3D单词学习 speed和velocity的区别
- [Dart] Flutter开发中的几个常用函数
- locustfile中的User类和HttpUser类
- SQL删除重复数据,保留ID最大的一条
- DDR3的配置及仿真教程
- 一元三次方程求解matlab_为什么一元n次代数方程必有n个根?
- ffmpeg 转换flv压缩大小_ffmpeg 视频压缩 转换
- 龙讯2号 我用带有胡伟武签名的龙芯电脑
- 【学习笔记】Stern-Brocot Tree
- 古之成大事者必经三境界--王国维《人间词话》
- maven手工安装依赖包
- 网络安全之小程序抓包渗透测试流程
- win10上elasticsearch-head显示集群健康值未连接问题
- Java中对索引的知识总结
热门文章
- eclipse 使用maven 创建springmvc + mybatis
- Spark Streaming 源码详解
- matlab 绘制三维离散点云,并根据Z值大小着色,matlab怎样画颜色随着Z大小变化的三维散点图
- MOSFET(一):基础
- java day58【 案例:使用 spring 的 IoC 的实现账户的 CRUD 、 基于注解的 IOC 配置 、 Spring 整合 Junit[掌握] 】...
- MySQL比like语句更高效的写法
- 【转载】linux环境下大数据网站搬家
- Javascript实现鼠标框选元素后拖拽被框选的元素
- 日语阅读-1-如何看ほう的用法
- UVa 10400 记忆化搜索