他用机器学习预测权力游戏结局: 龙妈小恶魔集体领盒饭?
HBO热剧权力的游戏
第、8、季
也是最后一季!
已经定档今年4月14日首播!
相信大家都很好奇,
谁将最终
坐上铁王座!
不管有没有看过GOT,
你应该都有所耳闻,
此剧最大的特色之一就是:
每季都死很多人,
死的全是主要角色,
而且根本猜不到下一个谁死。
(Ned Stark之死,被粉丝评为最令人意外的死亡Top1)
随着最终季定档,网友们也按耐不住,纷纷对剧中几位主人公的命运进行预测。
一位来自美国的数据科学家,甚至通过机器学习算法,用model分析出“最终季,谁最有可能领盒饭”排行榜!
最有可能领盒饭角色Top3
这个预测准吗?
背后的依据又是什么?
让我们来看看这位数据科学家
是如何得出这个结论的。
Taylor Larkin简介
数据科学家。曾参与各种领域的机器学习项目和研究文章。Taylor毕业于阿拉巴马大学,获得商业分析博士学位和应用统计学硕士学位。
Taylor的数据库来自一个由GOT骨灰级粉丝倾力制作的百科全书(Wiki of Ice and Fire)。其中包括角色、家族、性别、贵族身份、年龄、已故亲属等各种信息。
具体分析如下:
01 探索性数据分析
Taylor首先调查了每个角色所属的家族和文化,头衔,性别,贵族身份,年龄,以及他们的亲属是否已经死亡。
在清理数据之后,他使用文本建模器(word cloud)进一步深入了解了哪些家族与死亡的联系更大。
* 字号越大,家族人数越庞大;红字标记的家族与死亡联系大,蓝色标记的家族则相对安全。
我们看到,Targaryen家族是深红色,数据显示67%来自该家族的人物已经死亡。
这并不奇怪,因为Targaryens掌权时期遭遇了叛乱,导致了大部分族人的死亡。
至于Tyrell家族,他们的名字是深蓝色,数据库中只有大约5%的人物被标记为已故。
看到这里,一些粉丝可能会提出质疑:Tyrell家族在第6、7季电视剧中明明死了不少人啊?
这主要是因为,这些数据都是来自已出版的小说原著,而不是剧集。很多前两季电视剧中发生的大部分情节,都发生在还未出版的冰与火之歌小说第六部《凛东的寒风》里。
再看一眼性别分析,我们可以发现,不仅书中的女性角色较少,而且与男性相比,它们的死亡频率也较低。这是因为书中参与战斗的角色主要以男性为主。
02 分析和特征选择
通过特征选择,Talylor列出了影响角色幸存与否的几个重要因素,按先后顺序排列分别是:
1) 所属家族
2) 年龄
3) 是否有死亡亲属
4) 性别
为了进一步探索死亡概率与以上几个因素的确切关系,他使用了一种称为partial dependence的分析方法。该分析法与标准的基于线性的方法(如regression)相比,能够更轻松地捕获数据中的非线性效应。
以角色的年龄为例:
黄线表示当保持其他因素不变,仅改变年龄值时,死亡概率会如何变化。
在确定了以上几个主要影响角色死亡概率的因素之后,就可以开始训练模型,预测结果了。
03 调用模型
在调用模型时,Taylor使用的是一个名为DataRobot的机器学习平台。
DataRobot可以帮助研究者选择机器学习算法,对于每个算法该平台都会构建一个blueprint(如图),自动优化该特定算法的数据。
为了产生更准确的预测,这个blueprint将3个模型混合使用。在这种情况下,预测的结果会比三者中的任何一个独自产生的结果具有更高的准确度。
04 结论
最后,在以上机器学习算法的帮助下,Taylor得出了各个主角的预测死亡概率,以及为什么做出预测的前三个原因(如下图)。
* 红色表示那些增加死亡概率的因素,
蓝色表示降低死亡概率的因素。
通过分析我们发现:
1. 大部分角色被预测死亡的最重要原因是他们都有已故的亲属,这也从侧面体现出某个家族的动荡历史。
2. 在“northmen”文化下成长的主人公似乎风险相对较小,而“valyrian”文化影响下的人物则具有相反的效果。
3. Lannister的兄弟姐妹,Jaime,Tyrion和Cersei都有更高的死亡概率,部分原因是年龄较大。
4. 正如探索性数据分析阶段所见,男性本身就更具风险。
5. 在列出的十个人中,龙母死亡的概率最高,而前国王Robert的私生子Gendry的死亡率最低。
不过对于这样的结果,
Taylor本人表示:
如果想仅仅用机器学习就预测出
那些令人目瞪口呆、九曲十八弯的情节,
那就未免有点小看这部神剧了…
不管吃瓜群众预测地多么热火朝天,
最后维斯特洛大陆上茫茫众生的命运,
还是编剧和导演说了算…
至于剧情最终走向如何,
还是让我们一起静候最终季的到来吧!
E/N/D
更多科技求职资讯,请关注“来Offer”!
他用机器学习预测权力游戏结局: 龙妈小恶魔集体领盒饭?相关推荐
- AI是怎么样的演算的呢?预测《权力游戏》中角色的生死
近两年后,<权力游戏>第八季也是最后一季,终于 15 日回归了.再过 6 个多星期,我们就会知道这部剧 8 年的目标达成与否:多少角色领便当.和这部剧一起回归的还有当年的学生团队,他们使用 ...
- 使用python数据分析_我如何使用Python分析《权力游戏》
使用python数据分析 By Rocky Kev 洛基·凯夫(Rocky Kev) I wanted to learn Python for a long time, but I could nev ...
- 《权力的游戏》第八季——机器学习“剧透”大结局:谁笑到最后?
本周,HBO热门美剧<权力的游戏>终章第八季终于在万众瞩目的中回归了.而参加德国慕尼黑工业大学--计算机科学研讨会的学生们早就开始了一项不同寻常的科学任务:预测剧中哪个角色最有机会坐在梦寐 ...
- 机器学习将在游戏开发中的6种应用
机器学习正在改变几乎每个行业,从农业中的作物规划到医疗保健中的癌症诊断.这些主题通常会得到更广泛的讨论,因为它们已经产生了切实的,对人类有益的影响.对于游戏行业而言,不幸的是,游戏开发中的机器学习仍处 ...
- 使用机器学习预测天气_如何使用机器学习预测着陆
使用机器学习预测天气 Based on every NFL play from 2009–2017 根据2009-2017年每场NFL比赛 Ah, yes. The times, they are c ...
- azure机器学习_我如何打造一款赢得2016 Azure机器学习奖的游戏
azure机器学习 by Déborah Mesquita 由DéborahMesquita 我如何打造一款赢得2016 Azure机器学习奖的游戏 (How I built a game that ...
- Python!使用机器学习预测2022世界杯
使用机器学习预测2022世界杯 文章目录 使用机器学习预测2022世界杯 项目说明 数据集说明 1872年至2022年国际足球成绩 国际足联世界排名1992-2022 数据分析及预处理 对1872年至 ...
- 机器学习预测nba_通过机器学习预测2020年NBA季后赛支架
机器学习预测nba Paul the Octopus was a short-lived (26 January 2008–26 October 2010) cephalopod kept at th ...
- 机器学习预测股市_机器学习在股市中的表现如何
机器学习预测股市 When it comes to using machine learning in the stock market, there are multiple approaches ...
最新文章
- AprilTags二维码的检测与应用
- SQL学习---第一章
- VTK:几何对象之Cylinder
- python 30分钟_一张图30分钟快速Python入门
- python数据结构:进制转化探索
- const 常量_var,let,const 的区别?
- mysql私房菜_老男孩MySQL私房菜深入浅出精品视频第7章备份与恢复基础实践视频课程...
- 提高效率:17款超赞的谷歌chrome浏览器插件、扩展程序
- 图解互联网云脑的前世今生与未来,十幅进化示意图
- 【Spark Core】【RDD】【01】核心属性 执行原理
- 微信公众平台上可以使用的API接口
- Oracle数据库表空间整理回收与释放操作
- 路由器和交换机的工作原理---笔面试
- VUE项目学习(二):学习项目文件结构
- python 倒数两列_100行Python代码实现每天不同时间段定时给女友发消息
- matlab用sym出错,使用sym.int时出错输入参数太多
- Unity Tutorial - Adventure Game
- Chino with Rewrite
- 学习游戏建模的方式有哪些?次世代游戏建模学习路线以及要掌握的3D软件分别是?
- Linux系统引导和服务
热门文章
- 《Single Image Haze Removal Using Dark Channel Prior》一文中图像去雾算法的原理、实现、效果及其他。 ...
- 第六模块 常用邮件沟通场景(2):“冷邮件”的写作模板
- android 方块平移动画,android – 在Surface View中动画和旋转图像
- 基于ssm图书馆管理系统源码和论文
- 嘴对嘴教你:用VS Code写Dart的hello world
- Skywalking系列学习之Trace Profiling源码分析
- MacOS 开发 - NSWorkspace
- OpenAI GPT-2 官方模型下载
- 服务器如何获取IPTV信号源,什么是IPTV
- linux 3.15.2 触摸屏移植之selected device is not a touchscreen I understand