阅读文本大概需要 3.8 分钟。

前言

在开始今天的正文前,首先带来一首经典的由奥黛丽·赫本演唱的《Moon River》,也是电影《蒂凡尼的早餐》中的主题曲。

友情提示:在阅读今天文章的过程中,用这段音乐作为BGM,会有不一样的感受。同时为了提高大家的阅读体验,我们只在文章中只展示了部分代码,可以在公众号后台回复“女神”获取完整代码。

一年一度的奥斯卡奖于上月落下了帷幕,截止到今年,奥斯卡已经走过了91年的历程。奥斯卡奖在为我们带来一次又一次的视觉盛宴同时,也为我们提供了更进一步了解活跃在影坛的女神们的机会。

女神节将至,我们首先主要祝愿广大的女性同胞美丽永驻。同时我们来为大家盘点一下那些在奥斯卡闪耀过的女神们,她们“惊艳了时光,温柔了岁月”,带给喜爱她们的人们一段段美好的回忆。

数据来源

特别要感谢小F之前的 奥斯卡,究竟谁一直在陪跑 这篇文章的启发,让我们找到了能够全面地获取女神们奥斯卡相关数据网站 - 时光网,首先我们获取的是时光网上历届奥斯卡最佳女主角的入围及获奖信息,我们从中确定了此次数说的女神们:

获得了历届获奖以及提名名单后,我们就要进入女神们的主页:

女神们的主页信息还是很丰富的,主要是两个部分(a)上图左下角女神们的身高,星座以及出生年份 (b)上图中间网友对女神的喜爱度评分。有了这两部分的信息,我们就可以开始在后面的部分对女神们进行一系列的分析了。

部分的爬取代码如下:

driver = webdriver.Chrome()
driver.maximize_window()
driver.close()
driver.switch_to_window(driver.window_handles[0])  for i in range(queens_name.shape[0]):url = queens_name['profile'][i]js='window.open("'+url+'")'driver.execute_script(js)driver.close() driver.switch_to_window(driver.window_handles[0])try:queens_name['photo'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/div[1]/span/a').get_attribute('href')queens_name['height_star'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/dl[1]').text        queens_name['born_home'][i] = driver.find_element_by_xpath('//*[@id="personDetailRegion"]/dl[2]').text          queens_name['count_score'][i] = driver.find_element_by_xpath('//*[@id="personRating"]/div[2]').textexcept:err_list=err_list+[i]

数说女神 - 欢迎度篇

在开始数说女神与奥斯卡直接的故事前,我们先来看一下女神在大家心中的受欢迎程度,主要看的就是时光网上女神的喜爱度和投票人数两项指标:

奥黛丽·赫本在榜单中的位置体现了她在观众心中无可替代的地位,赫本年轻时用出众的容貌和演技一次次在电影中惊艳这个世界,随着岁月的流逝,她选择了优雅地老去,致力于慈善事业,用一颗善良的心带给这个世界一份温柔。

费雯·丽在榜单中仅次于赫本,塑造的郝思嘉这一经典形象也是影响了一代又一代的观众。同时在榜单中我们也看到了娜塔莉·波特曼和凯特·温斯莱特这些年轻观众更为熟知的女神身影。

数说女神 - 关注度篇

下面我们要看的就是女神们的受关注度,主要看的是有多少人在网站中为女神们进行评价:

这份榜单,相对于之前的受欢迎度,可能出场的女神更为被年轻观众所熟知。同时在两份榜单中出现的只有奥黛丽·赫本和凯特·温斯莱特,她们也分别代表着经典和现代。

值得一提的是,榜单中排名前四的女神们,目前只有娜塔莉·波特曼染指过最佳女主角的奖项。其它三位高人气女神海瑟薇、朱莉和奈特莉,我们希望她们能够在未来拍出更多经典的作品,捧起奥斯卡最佳女主角的小金人奖杯。

数说女神 - 奖运篇

看完了女神的受欢迎度和关注度,我们来看一个大家都会比较关注的问题,那就是究竟哪位女神最受奥斯卡奖的青睐,获得最多次的奥斯卡最佳女主角奖:

可以看到凯瑟琳·赫本以四次获奖的成绩在这个榜单中独占鳌头,说起赫本,可能奥黛丽·赫本的名字要更加熟悉一些,但实际上,在奥斯卡奖的认可度方面,凯瑟琳·赫本要更胜一筹。同时也看到了有13位女神两次获得奥斯卡奖最佳女主角,其中就有大名鼎鼎的费雯·丽、希拉里·斯万克以及 “奥斯卡常青树“ 梅丽尔·斯特里普

只要是和奖项相关的,就总是会“几家欢喜几家愁”,下面我们就来看一下各位女神入围最佳女主角奖的次数:

梅丽尔斯·特里普以17次入围的表现毫无争议地在这项对比中遥遥领先,更加值得注意的是,这项数据可能在未来被继续刷新,我们也拭目以待。通过这份数据,我们也可以感受到奖项竞争的激烈情况,奥黛丽·赫本和葛利亚·嘉逊这种世界巨星也仅仅分在在5次和7次入围中有1次的获奖记录

同时我们也看到黛博拉·寇儿和艾琳·邓恩分别入围6次和5次最佳女主角,最终都与奖项无缘,我们一方面可能会感觉评委会有些不近人情,另一方面也更加体现出了奖项的含金量。

数说女神 - 年龄篇

有人说“年龄是女人的秘密”,但是对于女神们来说,年龄只是一个符号。真正的女神会在不同的年龄去散发不同的光芒,每一束光芒都足以照亮这个世界。首先看一下那些入围时较为年长的女神:

可以看到在这些女神面前,年龄真的只是一个标记,无碍她们散发自己的光芒。朱迪·丹奇更是在自己72、73、80岁的时候三次入围最佳女主角的提名。在10次最年长的提名中,杰西卡·坦迪和凯瑟琳·赫本分别在自己81、75岁的时候最终摘得桂冠。

我们同时也来看一下,那些年少成名,入围时最为年轻的女神们:

有两位都是在自己15岁前就入围最佳女主角的提名,想想大家的15岁,真的是要惊叹于她们把握机遇的能力。在10次最年轻的入围提名中,只有玛丽·玛特琳在1987年最终赢得桂冠,也成为了迄今为止最年轻的影后

我们看一下各个年份入围者的平均年龄

大家可以会从中看到一些有趣的事情,我们就加上一条线性拟合的趋势线来让大家更清晰地去解读这些数据:

这条趋势线是可以通过我们的线性检验,也说明了奥斯卡愈发的看重演员的资历,年龄真的越来越成为了一种符号,真正的女神就是可以在不同的年龄都展现属于自己的光芒。

数说女神 - 身高篇

下面我们就来说说身高,有些人会比较武断地对女神的标准身高下一些定义,然而通过我们的数据分析,会发现女神们的身高实际上是很多元化的。利用好自己身材上的优势,展现出属于自己的魅力,才是最为重要的。

首先看一下身材高挑的女神们:

女神中不乏有许多超过180cm的模特身材,身高其实真的并不能代表所有。榜单中排名前茅的妮可·基德曼身高180cm,然而其前夫汤姆·克鲁斯身高仅仅是173cm,虽然现在已是劳燕分飞,但也不失为一段佳话。

特别值得一提的是榜单中的裴淳华是《消失的爱人》女主角罗莎曼德·派克为自己起的中文名,未来也希望越来越多的女神们为自己起上一个好听的中文名。下面我们来看一下那些身材娇小的女神们:

榜单中出现了许多熟悉的身影,比如伊丽莎白·泰勒、朱迪·福斯特 ,她们的身高都没有超过160cm,但并不妨碍她们成为大家记忆中永恒的女神。

下面我们仿照之前的入围年龄分析,看一下历年入围的影后平均身高

可以看到整体趋势与入围的年龄整体上涨趋势有所不同,所呈现的趋势更像是一个抛物线,我们不妨进行一下二次项拟合:

这条曲线也通过了参数的显著性检验,我们可以看到在1980、90年代的入围名单中,身高趋势线达到了一个峰值,之后有所下降。我们结合着不同时期出生的女神身高情况来进行对比:

1950-1970之间出生的女神身高确实相对比较高,这样可以解释了上面入围者身高趋势的变化情况。我们也希望通过这部分的分析让大家能够尽量不要那么去看重一个人的身高,女神们的成功也证明了成功与否与身高无关

数说女神 - 遗珠篇

纵使我们将奥斯卡最佳女主角所有的提名者放在一起,也会发现有很多留给我们经典回忆的女神们,并没有出现在榜单。下面我们就选取了部分未被提名过的女神们,为大家列出:

名单中有许多我们耳熟能详的女神名字,比如苏菲·玛索、玛丽莲·梦露以及在《肖申克的救赎》中海报中出现的丽塔·海华丝。希望未来奥斯卡能够让更多的女神们得以入围。

部分分析代码如下:

k <- lm(age~year,data = reward)
reward$smooth_age <- predict(k,year = reward$year)
ggplot(reward,aes(x=year))+geom_line(aes(y=age),size=1.5)+theme_bw()+ggtitle('各年度入围者平均年龄')+theme(axis.text.x = element_text(size=18),axis.text.y = element_text(size=18),plot.title = element_text(hjust=0.5,size=35,face='bold'),panel.grid = element_blank(),legend.position = 'none',axis.title  = element_text(size=25))+geom_line(aes(y=smooth_age),col='darkblue',size=1.5)

结语

盘点完这些“惊艳了时光,温柔的岁月”的女神们,我们不妨静下心来,花上一点时间,找个安静的地方,选上一部电影佳作。静静地品味女神们为我们塑造过的经典角色。后台回复“女神”可以获取本文的完整代码。

欢迎大家留言与我们互动,一起聊聊你心中的女神,同时也欢迎大家告诉我们本文封面照片中出现的四位女神的姓名,第一位答对的朋友有奖品哦。

精彩推荐

2018年Python知识圈原创文章合集

数据之美-Python数据可视化

谈谈数据分析 100% 会用到的一个工具

以梦为马,不负韶华

女神节, 数说奥斯卡女神们 : “惊艳了时光 , 温柔了岁月”相关推荐

  1. 数说奥斯卡女神们 : “惊艳了时光 , 温柔了岁月”

    作者:徐麟,某互联网公司数据分析狮,个人公众号数据森麟(id:shujusenlin) 前言 在开始今天的正文前,首先带来一首经典的由奥黛丽·赫本演唱的<Moon River>,也是电影& ...

  2. 女神节,知识女神让你更性感

    2014年末,美国最大的相亲网站okcupid更新了一系列性取向的标签,其中一项是sapiosexual(智性恋)--"不看外貌不看性别,只看智商".由sapio和sexual结合 ...

  3. 绿盟漏洞扫描_二十周年专题|绿盟极光,用专注惊艳了时光

    在安全圈久了,一定听说过绿盟极光漏洞扫描器--一款知名度很高的产品.在近 20 年的发展中,它曾被赋予了一系列标签-- 技术强.好用.团队强大.更新快等,它的市场认可度极高,用现在的话说这是一个爆款产 ...

  4. 人的一生会遇到三种人,一个惊艳了时光,一个温柔了岁月,一个讲懂了“堆”

    堆儿 堆的概念 堆的操作 向下调整 搞一个大堆 向上调整 入堆 出堆 使用Java中的堆 top-K问题 分享一个题目 堆排序 堆的概念 堆就是优先级队列 堆在逻辑上是一棵完全二叉树 堆在物理上是储存 ...

  5. 一个青年,温柔了岁月,惊艳了时光......

    题记:最近每天都会在不同的场合喝很多酒,扮演着不同的角色,但很久没有找到醉的感觉,不管是生活上,工作上都背负着未曾有过的压力,真的很想休息,真的想一个人大醉一场,醉得不省人事. 一连几天都在写写画画, ...

  6. 数据分析奥斯卡女神们,谁是你心中的No.1?

    作者 | 徐麟 转载自数据森麟(公众号 ID:shujusenlin) 前言 在开始今天的正文前,首先带来一首经典的由奥黛丽·赫本演唱的<Moon River>,也是电影<蒂凡尼的早 ...

  7. 3.8女神节:我又送福利 书和化妆品 男女通吃

    3.8女神节快乐 「 关于福利 」 上篇送书福利文留言瞬间超过 100条,微信规定超过100条留言就不能上墙展示,所以手慢,又喜欢我的的同志,可以置顶我的公众号了. 我可以很自信的说:我是所有技术公众 ...

  8. 无法写入最后一个_香港影史无法超越的25个惊艳瞬间,最后一个还是双黄蛋

    香港电影辉煌不再,但过往经典的荧幕画面,却让人日久回甘,感叹往日的美好. 01 朱茵眨眼 片名:<大话西游之大圣娶亲>. 朱茵扮演的紫霞仙子, 对至尊宝眨眼的一瞬间, 惊艳了时光, 她清澈 ...

  9. BetterZip3.8女神节惊艳价 比38折还要低!

    2019独角兽企业重金招聘Python工程师标准>>> 想要支持RAR.ZIP等常用压缩格式 找BetterZip! 想要AES-256文件加密 找BetterZip! 想要支持正则 ...

最新文章

  1. 详解最大似然估计(MLE)、最大后验概率估计(MAP),以及贝叶斯公式的理解...
  2. MYSQL查看 table 表状态常用的命令
  3. boost::noncopyable用法的测试程序
  4. [BZOJ3093][Fdu校赛2012] A Famous Game(不等概率)
  5. 【处理手记】Configuration system failed to initialize异常的另类原因
  6. mtk 驱动开发(71)---Android getevent,sendevent,input keyevent
  7. C++ STL 教程
  8. python list方法说明_对python中list的五种查找方法说明
  9. 今天生日,高興!!!
  10. 第十五章 第十五章 异步A3C(Asynchronous Advantage Actor-Critic,A3C)-强化学习理论学习与代码实现(强化学习导论第二版)
  11. 16/24点阵字库(经典)
  12. gst-inspect-1.0 命令详解
  13. PS实现割掉狗熊耳朵流血效果
  14. 电信院 创新创业实践二 FPGA Verilog vivado 数码显示管 显示译码器
  15. 18.2 增强型图元文件
  16. PyScripter显示行号
  17. 抖音短视频创业,抖音机房怎么样搭建?有哪些技巧
  18. android拷机工具,Android 3DMark大更新:无敌拷机神器
  19. html5把六张图片做成立方体,html5 3D旋转的图片立方体代码
  20. 云起实验室:基于Redis实现在线游戏积分排行榜

热门文章

  1. 谷粒学院项目讲师管理(二)
  2. python中retry的简单用法
  3. CentOS搭建Strongswan
  4. 计算机过程控制系统实例ppt,chap7 前馈控制系统_武汉理工大学:调节仪表与过程控制系统_ppt_大学课件预览_高等教育资讯网...
  5. Form with formKey 'xxx.form' does not exist
  6. 这是把 GitHub 当网盘了么?中国高校攻占榜单
  7. Android: 实现类似QQ、微信的表情输入键盘
  8. Word中替换回车的办法
  9. 剑指offer----C语言版----第一天
  10. 如何在Linux上安装QQ