宝可梦数据分析-平民最强宝可梦选择方案

快来和我一起选择属于你最强的宝可梦吧

数据时代的到来刷新了人们探索未知的方式,从基础能源建设到航天航空工程。在关都地区真新镇大木研究所一直孜孜不倦对精灵宝可梦进行研究的大木博士也不例外,在剧中我们就常常可以看到大木博士制作的精灵图鉴一直在给探险家们提供宝可梦的简单分析,包括宝可梦的身高,体重,特性等等。但是作为从小就向往前往大木博士研究所成为宝可梦联盟最强训练师/宝可梦研究大师的我,仅仅是分析单个宝可梦的数据远远满足不了我的需求。

与其他探险家旅游挑战道馆的方式不同,我决定通过使用数据分析的方式来帮助我更好的了解宝可梦这种神奇的生物,然后再选择最经济实惠,简单好抓的宝可梦来挑战联盟。通过使用搜索引擎,我找到了一份包含着从第一代到第七代共801只宝可梦的数据集。然后由于博士的实验室并没有丰富的研究经费,我决定选择有 免费计算资源 且 预置了许多常用数据分析依赖库 的 DSW 探索者版 来帮助我完成分析的过程。 大家可以点击这里去游览整个分析的过程。

数据集下载

然后我们import我们最常用的三大件:Pandas, Seaborn, Matplotlib, 并且读取数据

首先我们观察一下数据的尺寸,可以通过 df.shape 这个来实现。当然 df.info() 能够给我们更加详细的每个列的信息。这里我们通过这个方式,可以发现这个数据集一共收录了801行,41列的数据。说明一共有801只宝可梦,每只宝可梦我们有41个特征来描述它们。

然后就迎来了我们的第一个问题:这么多特征,是否会有数据缺失呢?毕竟有些宝可梦比较神秘感,就连大木博士都不一定知道。这里我们可以通过如下代码来观察每个特征的缺失情况

 通过查看以上数据,我们可以发现,type2 这个字段缺失的比率最高,达到了 48% 左右。说明超过半数的宝可梦还是单纯的只有一个属性,剩下一般的则具有两种属性。

然后第二个问题就是:这么多宝可梦,每代分别有几只?这里我们可以通过简单的 df['generation'].value_counts() 来得到。但是为了更加直观的表现出不同代的宝可梦的数量差别,这里我们可以用pandas自带的画图的功能来绘制一个柱状图:通过查看以上数据,我们可以发现,type2 这个字段缺失的比率最高,达到了 48% 左右。说明超过半数的宝可梦还是单纯的只有一个属性,剩下一般的则具有两种属性。

然后第二个问题就是:这么多宝可梦,每代分别有几只?这里我们可以通过简单的 df['generation'].value_counts() 来得到。但是为了更加直观的表现出不同代的宝可梦的数量差别,这里我们可以用pandas自带的画图的功能来绘制一个柱状图:

不难发现,宝可梦数量最多的是在第5代,最少的是在第6代。然后我们再来看不同的主属性的分布。这里我们可以先做一些简单的假设,比如虫属性的宝可梦种类比较多因为在剧中出现的频率相当高,而且有很多种进化。

这里我们将之前的柱状图横过来了,更便于观察。这里我们可以看到,数量最多的宝可梦是水系,然后是普通,然后是草系。虫系只排在了第四,并没有和预期中那样那么多。

看完了基础的一些分布,接下来我会想做一些简单的相关性分析。我们可以通过以下的代码生成相关性图

来了解不同特征之间的关联,这对我们了解宝可梦的特性很有帮助。比如通过观察 attack 这一个特征和 height_m 是正相关的,我们可以得出:越高的宝可梦,攻击力越高。但是再看 height_m,我们会发现它和 base_happiness 是负相关的。这个时候我们可以作出另外一个结论:长得高的宝可梦可能都不太开心。

接下来我们从宝可梦在实战中的角度来分析这组数据。这里我们只关注六个基础值:血量,攻击力,防御力,特攻,特防,速度。因为只有这六个基础值决定了一只宝可梦的战斗力在不考虑派系克制的情况下。

这里我们可以看到大部分都是成正比例的,一个值的提高往往会拉高另外一个值。这点我们通过相关性热力图也可以看到

看完这些以后,我们就可以开始计算种族值然后来选取我们的平民神兽了。毕竟不是每个人都能收服代欧奇希斯,超梦,梦幻这种传说级别的宝可梦。这里我们可以通过如下方式,先做一个特征类型转化,然后再计算

这样我们就完成了用 total_stats 这个字段来存储种族值这一特征。我们可以做个柱状图可视化来看看种族值的分布是什么样的:

同时我们还可以根据不同的属性来看:

找到非传说宝可梦但是种族值达到了的传说宝可梦级别的

最后我们就可以通过简单的过滤和排序来找到我们应该去捕捉的宝可梦了:

从结果上来看,我们平民宝可梦训练师应该考虑的Top10宝可梦应该是:妙蛙花,喷火龙,水箭龟,比雕,胡地,呆河马,耿鬼,袋兽,大甲,暴鲤龙。这样,我们就通过简单的数据分析,完成了大多数宝可梦动漫中的训练师不可能完成的任务。这么想想,升职加薪,出任CEO,赢取白富美,当上研究所所长的日子简直指日可待呀!

不过要不是有DSW 探索者版这么方便的工具,这真是一个无法完成的任务。现在,这份宝可梦分析已经放在了这里,希望读到这篇文章的你也能像我一样,通过数据分析成为一个伟大的宝可梦训练师。

python10-宝可梦数据分析-平民最强宝可梦系列(从0-1数据分析实战)相关推荐

  1. 宝可梦数据分析-平民最强宝可梦选择方案

    宝可梦数据分析-平民最强宝可梦选择方案 数据集下载 数据时代的到来刷新了人们探索未知的方式,从基础能源建设到航天航空工程.在关都地区真新镇大木研究所一直孜孜不倦对精灵宝可梦进行研究的大木博士也不例外, ...

  2. Python数据分析--平民最强宝可梦

    感谢AI蜗牛车-阿里云天池Python训练营提供的相关学习资料 本节主要介绍python中的数据分析方法,结合之前的学习内容,对于宝可梦精灵中的各种精灵数据进行分析,找寻其中的最强精灵. 十五.数据分 ...

  3. c语言精灵宝可梦对战游戏,精灵宝可梦究极日月模拟器金手指代码大全

    <精灵宝可梦究极日月>终于迎来了它的发售,相信许多玩家对于这款游戏的素质还是不用怀疑的吧.不过由于游戏的内容实在是太过丰富,许多玩家表示在游戏中许多要素都没法体验尽兴,以下就给大家分享具体 ...

  4. 宝德服务器pr2710装系统过程,宝德PR2710R服务器

    即使是同系列服务器产品,不同的内部配置也会带来不同的性能.下面我们来解读一下送测宝德PR2710R服务器产品的规格. 此款宝德PR2710R服务器采用双插槽设计,配备了两颗最新发布的至强E5-2620 ...

  5. 淘宝购物如何找优惠券_淘宝上买衣服怎么省钱

    先领券,再下单.省钱不止一点点! 你购物,我掏钱.天猫淘宝任你选! 荐好友,领佣金.你省我省大家省! 加VX:sqgwkk  一省到底! 宝妈在家也能做兼职_淘宝购物如何找优惠券_淘宝上买衣服怎么省钱 ...

  6. 无线充电宝怎么使用?实用的无线充电宝推荐

    说到无线充电宝这个产品,作为备用电源产品的充电宝配上无线充电技术,使用感觉方便很多再也不用找线充电了,直接放在充宝上就行,而且随着无线充电宝的技术方案的成熟发展,有些还能支持智能快充.在这里,我给大家 ...

  7. 采集淘宝API数据,抓取淘宝商品资料无需申请appkey

    为了进行淘宝的API开发,首先我们需要做下面几件事情. 1)开发者注册一个账号 2)然后为每个淘宝应用注册一个应用程序键(App Key) . 3)下载淘宝API的SDK并掌握基本的API基础知识和调 ...

  8. 轻便容量大的充电宝推荐,额定容量大的充电宝盘点

    自从手机越来越智能化后,手机续航不足的问题就一直困扰着厂商和用户.虽然增大电池容量是增加续航的有效途径,但是考虑到手机厚度等问题,很少有厂商愿意牺牲外观加码电池容量,因此市面上的手机电池容量绝大多数都 ...

  9. 苹果13适合什么充电宝?苹果手机可以用的充电宝推荐

    充电宝是手机的一个重要外设配件,充电宝可以为手机提供更强的移动续航能力;人们在外出远行的时候,通常都会带上一个或多个充电宝.现在市面上的充电宝分为两种,一种是有线充电宝,一种是无线充电宝,其中又以无线 ...

最新文章

  1. 007_支持序列化空值
  2. 关于同时可用git命令clone和TortoiseGit拉取代码不需要密码
  3. 实战演练丨SCN太大引发ORA-600[2252]
  4. GCD使用经验与技巧浅谈
  5. Perl获取前后任意月份月末
  6. 风控体系建设、数字化转型、金融科技应用前,您是如何看待数据问题的?
  7. [asp.net]自定义控件(数据绑定)
  8. linux chmod、chown命令不起作用
  9. jxls中自定义函数的使用
  10. 计算机的云是什么意思_云计算是什么意思?为什么叫云计算?
  11. html可视化布局系统源码,一个开源可视化布局项目,在线生成纯css布局,可阅读的代码。...
  12. 【大二下复习】新视野大学英语(第三版)第四册读写教程答案 + 期末复习翻译的部分题目
  13. 花旗杯决赛第二 + 最佳移动应用
  14. UVA 10118 dfs
  15. svn没有绿色的对勾处理
  16. wac361能否做路由器_WAC360/361系列无线控制器WLAN本地转发配置方法
  17. 冒泡排序Matlab程序超详细注释
  18. ubuntu下qnx7.0交叉编译qt5.9.7源码
  19. Transformer课程 业务对话机器人Rasa 3.x Fallback and Human Handoff
  20. Python 图片2

热门文章

  1. 超过C++、压制Java与C,Python拔得TIOBE年度编程语言!
  2. AI时代,如何缓解CMO的决策焦虑?
  3. 融资2.1亿商汤领投,他要用VR+AR解决无人驾驶的路测难题
  4. 昨天,JetBrains 推出“下一代 IDE”,快看有哪些值得期待的功能!
  5. 百度开源,分布式配置中心
  6. 面试问我,创建多少个线程合适?我该怎么说
  7. 哈哈哈,这个教人写烂代码的项目在 GitHub 上火了...
  8. Coding-排序(sort)
  9. 剑指offer_第3题_从尾到头打印链表
  10. 【模型评估与选择】sklearn.model_selection.train_test_split