阿里云天池大数据：【入门】精灵宝可梦数据集分析

目的

学习，实践，不同机器学习算法

使用的包及安装

pip install numpy
pip install Pandas

数据获取

阿里云天池大数据竞赛官网获取

莫某

引入包

import pandas as pd
import numpy as np

获取数据

poke = pd.read_csv('./pokemon0820.csv')

获取18项定向攻击的伤害指数

# 获取数据
against_ = poke.iloc[:,1:19]
# 转化为NumPy对象
against_.to_numpy()

获取宝可梦的捕捉几率

capture_rate = poke['capture_rate']
capture_rate.to_numpy()

获取宝可梦活跃指数

base_happiness = poke['base_happiness']
base_happiness.to_numpy()

获取基础攻击属性

attack = poke['attack']
attack.to_numpy()

获取基础防御属性

defense = poke['defense']
defense.to_numpy()

获取特殊攻击属性

sp_attack = poke['sp_attack']
sp_attack.to_numpy()

获取特殊防御属性

sp_defense = poke['sp_defense']
sp_defense.to_numpy()

获取基础速度属性

speed = poke['speed']
speed.to_numpy()

获取宝可梦为第几代

generation = poke['generation']
generation.to_numpy()

获取是否为传奇宝可梦

is_legendary = poke['is_legendary']
is_legendary.to_numpy()

获取hp

hp = poke['hp']
hp.to_numpy()

获取孵化阶段

base_egg_steps = poke['base_egg_steps']
base_egg_steps.to_numpy()

获取身高

height_m = poke['height_m']
height_m.to_numpy()

获取体重

weight_kg = poke['weight_kg']
weight_kg.to_numpy()

获取主属性

type1 = poke['type1']
type1.to_numpy()

获取副属性

type2 = poke['type2']
type2.to_numpy()

获取成长经历

experience_growth = poke['experience_growth']
experience_growth.to_numpy()

获取能力

abilities = poke['abilities']
abilities.to_numpy()

获取精灵类型

classification = poke['classification']
classification.to_numpy()

获取宝可梦为男性的比率(空白为无性别属性)

percentage_male = poke['percentage_male']
percentage_male.to_numpy()

获取宝可梦图鉴ID

pokedex_number = poke['pokedex_number']
pokedex_number.to_numpy()

获取宝可梦的日文名

japanese_name = poke['japanese_name']
japanese_name.to_numpy()

获取宝可梦的英文名

name = poke['name']
name.to_numpy()

解决的问题

通过决策树解决18项定向攻击的伤害指数判断其基础攻击属性

# 导入需要的包
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 建立模型
DTCmodel = DecisionTreeClassifier()
DTCmodel.fit(X_train,y_train)
DTCmodel.predict(X_test)
DTCmodel.score(X_test,y_test)# 决策树不适用 准确率很低
0.06486486486486487

通过线性判别分析解决18项定向攻击的伤害指数判断其特殊攻击属性

# 导入需要的包
import pandas as pd
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.model_selection import train_test_split# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 建立模型
LDAmodel = LinearDiscriminantAnalysis()
LDAmodel.fit(X_train,y_train)
LDAmodel.score(X_test,y_test)# 线性判别分析
0.021621621621621623

通过对数几率回归解决18项定向攻击的伤害指数判断其特殊攻击属性

# 导入需要的包
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 建立模型
LRmodel = LogisticRegression(random_state=0, solver='newton-cg')
LRmodel.fit(X_train,y_train)
LRmodel.score(X_test,y_test)# 对数几率回归
0.043243243243243246

通过神经网络回归模块解决18项定向攻击的伤害指数判断其特殊攻击属性

# 导入需要的包
import pandas as pd
from sklearn.neural_network import MLPRegressor
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 数据标准化
ss = StandardScaler()
ss.fit(X_train)
X_train = ss.transform(X_train)
X_test = ss.transform(X_test)# 建立模型
mlpmodel = MLPRegressor(hidden_layer_sizes=(500,1000))
mlpmodel.fit(X_train,y_train)
mlpmodel.score(X_test,y_test,sample_weight=None)
0.159366755682658# 模型2
mlpmodel = MLPRegressor(hidden_layer_sizes=(1000,1000))
mlpmodel.fit(X_train,y_train)
mlpmodel.score(X_test,y_test,sample_weight=None)
0.16249714098191714

阿里云天池大数据：【入门】精灵宝可梦数据集分析相关推荐

阿里云天池大数据长期赛：金融风控-贷款违约预测（含代码）
前言一.赛题介绍二.数据描述性统计 2.1.读取数据 2.2.查看重复值 2.3.统计目标变量比例 2.4.查看数据的统计量 2.5.统计每个变量的种类 2.6.查看训练集与测试集的特征分布是否 ...
【入门】精灵宝可梦数据集分析
数据集下载 !wget -O pokemon_data.csv https://pai-public-data.oss-cn-beijing.aliyuncs.com/pokemon/pokemon. ...
阿里云发布大数据产品ODPS 6小时处理100PB数据
阿里云发布大数据产品ODPS 6小时处理100PB数据阿里云发布ODPS 可分析PB级海量数据新浪科技讯 7月8日下午消息,阿里云计算发布大数据产品--ODPS.通过ODPS在线服务,小型公 ...
数梦工场联手阿里云推出大数据一体机
本文讲的是数梦工场联手阿里云推出大数据一体机[IT168 云计算]8月19日消息,作为全球领先的云计算和大数据场景化开发与服务提供商,数梦工场依托阿里云"飞天"大规模分布式计算系 ...
阿里云ACP大数据工程师认证，ACP，阿里云ACP认证，阿里云认证，大数据工程师认证
阿里云ACP大数据工程师认证先放证书镇楼 ACP认证考试心得阿里云ACP级专业工程师认证考试不难,只要系统性复习官方文档一次考过其实并不难.大家普遍给出的意见都是要着重复习<阿里云官方文档& ...
精灵宝可梦数据集与动漫头像数据集
精灵宝可梦数据集链接:https://pan.baidu.com/s/1O-YBLBeqDpui_FhspnwY3g 提取码:r1ze 动漫头像数据集链接:https://pan.baidu.c ...
基于阿里云之大数据学习：使用DataV制作实时销售数据可视化大屏
学习目标: 了解数据可视化应用场景掌握阿里云DataV可视化工具了解可视化大屏制作流程使用DataV模板制作数据可视化大屏一.数据可视化介绍 1.数据可视化: 是指将相对复杂的数据通过可视的. ...
宝可梦数据集分析及预测
前言以下内容为本人学习过程中记录,仅用于学习,如有错误或者纰漏,请留言指正,谢谢. 数据集和代码下载 – 百度云链接:https://pan.baidu.com/s/1RFUEVcD85J2AQ3_ ...
阿里云飞天大数据产品价值解读——《一站式高质量搜索开放搜索》
一.如何评估搜索质量.体验与业务价值 1.搜索-无处不在生活中多种不同场景需要进行搜索,在企业内部产品中也需要使用多种搜索功能,方便用户快捷地获取企业相关商品.服务.内容等信息.搜索在不同的企业业务 ...

阿里云天池大数据：【入门】精灵宝可梦数据集分析

目的

使用的包及安装

数据获取

莫某

引入包

获取数据

获取18项定向攻击的伤害指数

获取宝可梦的捕捉几率

获取宝可梦活跃指数

获取基础攻击属性

获取基础防御属性

获取特殊攻击属性

获取特殊防御属性

获取基础速度属性

获取宝可梦为第几代

获取是否为传奇宝可梦

获取hp

获取孵化阶段

获取身高

获取体重

获取主属性

获取副属性

获取成长经历

获取能力

获取精灵类型

获取宝可梦为男性的比率(空白为无性别属性)

获取宝可梦图鉴ID

获取宝可梦的日文名

获取宝可梦的英文名

解决的问题

通过决策树解决18项定向攻击的伤害指数判断其基础攻击属性

通过线性判别分析解决18项定向攻击的伤害指数判断其特殊攻击属性

通过对数几率回归解决18项定向攻击的伤害指数判断其特殊攻击属性

通过神经网络回归模块解决18项定向攻击的伤害指数判断其特殊攻击属性

阿里云天池大数据：【入门】精灵宝可梦数据集分析相关推荐

最新文章

热门文章