自古文人皆孱弱,看林夕,果然才多身子弱。一人扛鼎中国流行乐词坛半壁江山。横扫几个时代的大金曲。不论北京奥运,还是上海世博;不论是四十大天王,还是五十大天后,都为林夕叫绝;当真是三头六臂,七步成章,八斗之才,九曲断肠,以一当十。轻易斩获奖项数百,三十多年写情感,讲道理,无人能出其右;他写绝了绝望;且下手果决,毫不留情,直杀人心。林夕一直是我非常喜欢的一位词人,所以今天就是要对林夕写的词,做一次数据分析。数据来源自虾米网站,根据林夕为关键字,一共搜到了2693首歌。

数据抓取比较简单,直接写了一个requests,把这两千多首歌的信息抓取了出来,其中主要字段包括歌名、艺人、所属专辑以及歌词的链接,在通过请求歌词的链接,抓出了所有歌的歌词信息。

使用jieba的搜索模式,对所抓取的歌词进行了分词处理,下面是高频词的统计。

通过自然语言处理对这些高频词进行情绪分析,得到结果如下

这个结果,一点不奇怪。因为林夕就喜欢写那些爱而得不到,失而不复得的虐心故事,这要是能正面才怪了。

林夕都给哪些歌手写过歌,我们也来分析一下

前三名毫无意外,陈奕迅、王菲、杨千桦。

林夕也曾公开说过,他把自己感情的际遇、故事都写给杨千嬅,这些东西被他自己总结提炼成智慧的时候就由王菲来唱,其中的道理让陈奕迅诠释,最后无法诠释的凄美都写给了黄耀明。

由于我所抓取的2693首歌曲里,并没有做去重处理。也就是说,有很多live版的,或者是被其他艺人翻唱的,所以这个统计并不是最精确的,只是做下参考。当然,没去重也有没去重的好处,我们可以分析一下,那些歌演唱、或被翻唱的次数比较多。

对于"约定"这首歌竟然没有上榜,我还是挺意外的!

让我们在对关键词进行一次权重分析,这样应该可以更加直观的看出林夕所写的词所要凸显的主题。

我相信看到这里,即使不用情绪分析,光看这些关键词,都能看出林夕写的爱情都是凄美、悲伤的。

再来看看高频词的词性,都有哪些:

到这里会发现一些很有趣的内容,就是林夕写词很少用主语,这也增加了歌词的魅力。因为没有主语,所以每个人在唱、或者听的时候,才能有感同身受的感觉。

我们在来分析一下,林夕到底是向前看,还是向后看:

可以看出,活在当下,才是林夕的核心观点。

所以,我也可以得出这样的一个结论:

林夕的昨天,是给杨千嬅去阐述的;

林夕的今天,是给王菲去阐述的;

林夕的明天,是给陈奕迅去阐述的。

通过这些分析,我们可以大概得到这样的一个结论:

林夕是一个典型的抑郁型性格,先总结提取负面,在通过这些负面来劝慰别人要积极正面。又是一个现实主义者,也就是一个理智的人,虽然他的负面较大,但都能通过理性来控制。

扫描下方二维码学习更多安全知识:

Ms08067安全实验室

专注于普及网络安全知识。团队已出版《Web安全攻防:渗透测试实战指南》,《内网安全攻防:渗透测试实战指南》,目前在编Python渗透测试,JAVA代码审计和二进制逆向方面的书籍。

团队公众号定期分享关于CTF靶场、内网渗透、APT方面技术干货,从零开始、以实战落地为主,致力于做一个实用的干货分享型公众号。

官方网站:www.ms08067.com

林夕歌词分析数据报告相关推荐

  1. 文本挖掘林夕、黄伟文的43万字歌词,他们到底在唱些什么?

    在我十几年的听歌生涯里,熟悉的歌曲可以说有80%以上的作词,都是出自香港两大金牌词人--林夕和黄伟文之手,粉丝界也出了不少文章从二人的韵脚使用.意识形态.选材议题尤其是爱情观等角度做分析,甚至网络上还 ...

  2. 数据可视化分析票房数据报告_票房收入分析和可视化

    数据可视化分析票房数据报告 Welcome back to my 100 Days of Data Science Challenge Journey. On day 4 and 5, I work ...

  3. 林夕为王菲写的最经典的十句歌词~~~~~~~~~~

    1.不断演变的海岸线,长出了,最哀艳的水仙. 出自<脸>.整首词都填的完美无缺,美的让人恻然,其实这首词又何尝不是华语乐坛词作中一朵最哀艳的水仙呢?选出这一句来算是撷英吧,不愧是奇葩中的奇 ...

  4. 数字冰雹入选2020爱分析·数据智能厂商全景报告

    9月24日,"数据新基建.产业新智能"2020爱分析·数据智能高峰论坛在北京成功举行.本次论坛围绕数据智能发展趋势.数据智能赋能企业数字化升级.以及数据智能在金融.政务.零售等行业 ...

  5. python分析数据的变化趋势_调查报告数据分析怎么做?

    调查报告数据分析怎么做?拿到一份调查报告看选题.选题内容.调查的目的,然后清洗数据,分析数据提炼观点,过数据变化规律,揭示事物内在发展变化和趋势,抓住问题的本质和关键. 一.分析数据提炼观点 数据分析 ...

  6. 抖音数据统计_2019年抖音数据报告的分析探究

    不看抖音的我看完2019抖音数据报告后,我不得不赞叹抖音的覆盖面以及其发展潜力,从抖音的数据我们也能了解到当下的热点和新的趋势,本文我将从十个方面来分析这份数据. 01 抖音日活跃用户增长 在这份报道 ...

  7. 隐私计算唯一代表厂商!洞见科技入选《爱分析·数据智能厂商全景报告》

    近日,国内领先的数字化市场研究与咨询机构爱分析发布<2022 爱分析·数据智能厂商全景报告>.经爱分析在技术研发实力.服务客户数量.收入规模等维度的全面专业评估,洞见科技成功入选该报告数据 ...

  8. IDC MarketScape《决策支持分析数据平台供应商评估》报告发布,亚马逊云科技位列“领导者”

    随着科学技术的不断发展,人们的生活方式也在不断改变.现在,人们可以通过互联网获得更多的信息,也可以通过智能手机随时随地与他人进行交流.此外,人工智能技术的进步也使得机器能够完成一些复杂的任务,从而提高 ...

  9. 2022爱分析· 数据智能厂商全景报告

    报告编委 黄勇 爱分析合伙人&首席分析师 孟晨静 爱分析高级分析师 李冬露 爱分析分析师 冯怡欣 爱分析分析师 兰壹凡 爱分析分析师 目录 \1. 研究范围定义 \2. 厂商全景地图 \3. ...

最新文章

  1. Linux对文件内容基本操作(学习笔记七)
  2. jQuery和Vue的区别(转载)
  3. TCP/IP协议族之应用层协议(FTP、TFTP)
  4. VLOOKUP模糊匹配的妙用
  5. Disruptor高性能缓存队列入门指导
  6. Python小游戏-接苹果
  7. 一个简单的爬虫例子(代码)
  8. part5 vue和HTML5相关知识总结
  9. 【数据结构与算法】- 排序(算法)
  10. CSS外边距塌陷问题,吊打面试官
  11. 如何在Ubuntu 20.04上设置和配置证书颁发机构(CA)
  12. 智星云服务器之云主机使用教程简记
  13. SyntaxError: Missing parentheses in call to ‘print‘. Did you mean print(e)?
  14. NVIDIA BERT推理解决方案Faster Transformer开源了!
  15. 使用Visual Studio 2019创建安装程序的详细教程
  16. CAN-BUS协议粗浅学习
  17. iFixit是被破拆解Galaxy Fold?Galaxy Fold的问题点
  18. JQ QQ表情插件
  19. 论文阅读 [TPAMI-2022] Incremental Density-Based Clustering on Multicore Processors
  20. 巧用书法字帖提高书法造诣

热门文章

  1. 用计算机找到自己的另一半,心理专家教你,如何利用心理学找到自己的另一半?...
  2. 获取33中生活指数数据
  3. 自定义字符串拼接函数my_strcat()
  4. oracle查回收站大小,ORACLE回收站
  5. 【方法】blob类型地址的图片下载
  6. 内挂[未完成的物品过滤器]与[禁止更新]
  7. 景德镇陶瓷大学计算机考研资料汇总
  8. inux中root@...后面跟的是什么意思,比如localhost
  9. 【项目记录】-上门洗车-汽车服务_0
  10. Web前端——HTML中的超链接