目的

学习,实践,不同机器学习算法

使用的包及安装

pip install numpy
pip install Pandas

数据获取

阿里云天池大数据竞赛官网获取

莫某

引入包
import pandas as pd
import numpy as np
获取数据
poke = pd.read_csv('./pokemon0820.csv')
获取18项定向攻击的伤害指数
# 获取数据
against_ = poke.iloc[:,1:19]
# 转化为NumPy对象
against_.to_numpy()
获取宝可梦的捕捉几率
capture_rate = poke['capture_rate']
capture_rate.to_numpy()
获取宝可梦活跃指数
base_happiness = poke['base_happiness']
base_happiness.to_numpy()
获取基础攻击属性
attack = poke['attack']
attack.to_numpy()
获取基础防御属性
defense = poke['defense']
defense.to_numpy()
获取特殊攻击属性
sp_attack = poke['sp_attack']
sp_attack.to_numpy()
获取特殊防御属性
sp_defense = poke['sp_defense']
sp_defense.to_numpy()
获取基础速度属性
speed = poke['speed']
speed.to_numpy()
获取宝可梦为第几代
generation = poke['generation']
generation.to_numpy()
获取是否为传奇宝可梦
is_legendary = poke['is_legendary']
is_legendary.to_numpy()
获取hp
hp = poke['hp']
hp.to_numpy()
获取孵化阶段
base_egg_steps = poke['base_egg_steps']
base_egg_steps.to_numpy()
获取身高
height_m = poke['height_m']
height_m.to_numpy()
获取体重
weight_kg = poke['weight_kg']
weight_kg.to_numpy()
获取主属性
type1 = poke['type1']
type1.to_numpy()
获取副属性
type2 = poke['type2']
type2.to_numpy()
获取成长经历
experience_growth = poke['experience_growth']
experience_growth.to_numpy()
获取能力
abilities = poke['abilities']
abilities.to_numpy()
获取精灵类型
classification = poke['classification']
classification.to_numpy()
获取宝可梦为男性的比率(空白为无性别属性)
percentage_male = poke['percentage_male']
percentage_male.to_numpy()
获取宝可梦图鉴ID
pokedex_number = poke['pokedex_number']
pokedex_number.to_numpy()
获取宝可梦的日文名
japanese_name = poke['japanese_name']
japanese_name.to_numpy()
获取宝可梦的英文名
name = poke['name']
name.to_numpy()

解决的问题

通过决策树解决18项定向攻击的伤害指数判断其基础攻击属性
# 导入需要的包
import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 建立模型
DTCmodel = DecisionTreeClassifier()
DTCmodel.fit(X_train,y_train)
DTCmodel.predict(X_test)
DTCmodel.score(X_test,y_test)# 决策树不适用 准确率很低
0.06486486486486487
通过线性判别分析解决18项定向攻击的伤害指数判断其特殊攻击属性
# 导入需要的包
import pandas as pd
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.model_selection import train_test_split# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 建立模型
LDAmodel = LinearDiscriminantAnalysis()
LDAmodel.fit(X_train,y_train)
LDAmodel.score(X_test,y_test)# 线性判别分析
0.021621621621621623
通过对数几率回归解决18项定向攻击的伤害指数判断其特殊攻击属性
# 导入需要的包
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 建立模型
LRmodel = LogisticRegression(random_state=0, solver='newton-cg')
LRmodel.fit(X_train,y_train)
LRmodel.score(X_test,y_test)# 对数几率回归
0.043243243243243246
通过神经网络回归模块解决18项定向攻击的伤害指数判断其特殊攻击属性
# 导入需要的包
import pandas as pd
from sklearn.neural_network import MLPRegressor
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler# 引入数据
poke = pd.read_csv('./pokemon0820.csv')
# 18项定向攻击的伤害指数
against_ = poke.iloc[:,1:19]
against =  against_.to_numpy()
# 基础攻击属性
attack_ = poke['attack']
attack = attack_.to_numpy()# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(against, attack, test_size=0.23, random_state=32)# 数据标准化
ss = StandardScaler()
ss.fit(X_train)
X_train = ss.transform(X_train)
X_test = ss.transform(X_test)# 建立模型
mlpmodel = MLPRegressor(hidden_layer_sizes=(500,1000))
mlpmodel.fit(X_train,y_train)
mlpmodel.score(X_test,y_test,sample_weight=None)
0.159366755682658# 模型2
mlpmodel = MLPRegressor(hidden_layer_sizes=(1000,1000))
mlpmodel.fit(X_train,y_train)
mlpmodel.score(X_test,y_test,sample_weight=None)
0.16249714098191714

阿里云天池大数据:【入门】精灵宝可梦数据集分析相关推荐

  1. 阿里云天池大数据长期赛:金融风控-贷款违约预测(含代码)

    前言 一.赛题介绍 二.数据描述性统计 2.1.读取数据 2.2.查看重复值 2.3.统计目标变量比例 2.4.查看数据的统计量 ​2.5.统计每个变量的种类 2.6.查看训练集与测试集的特征分布是否 ...

  2. 【入门】精灵宝可梦数据集分析

    数据集下载 !wget -O pokemon_data.csv https://pai-public-data.oss-cn-beijing.aliyuncs.com/pokemon/pokemon. ...

  3. 阿里云发布大数据产品ODPS 6小时处理100PB数据

     阿里云发布大数据产品ODPS 6小时处理100PB数据 阿里云发布ODPS 可分析PB级海量数据 新浪科技讯 7月8日下午消息,阿里云计算发布大数据产品--ODPS.通过ODPS在线服务,小型公 ...

  4. 数梦工场联手阿里云 推出大数据一体机

    本文讲的是数梦工场联手阿里云 推出大数据一体机[IT168 云计算]8月19日消息,作为全球领先的云计算和大数据场景化开发与服务提供商,数梦工场依托阿里云"飞天"大规模分布式计算系 ...

  5. 阿里云ACP大数据工程师认证,ACP,阿里云ACP认证,阿里云认证,大数据工程师认证

    阿里云ACP大数据工程师认证 先放证书镇楼 ACP认证考试心得 阿里云ACP级专业工程师认证考试不难,只要系统性复习官方文档一次考过其实并不难.大家普遍给出的意见都是要着重复习<阿里云官方文档& ...

  6. 精灵宝可梦数据集与动漫头像数据集

    精灵宝可梦数据集 链接:https://pan.baidu.com/s/1O-YBLBeqDpui_FhspnwY3g  提取码:r1ze 动漫头像数据集 链接:https://pan.baidu.c ...

  7. 基于阿里云之大数据学习:使用DataV制作实时销售数据可视化大屏

    学习目标: 了解数据可视化应用场景 掌握阿里云DataV可视化工具 了解可视化大屏制作流程 使用DataV模板制作数据可视化大屏 一.数据可视化介绍 1.数据可视化: 是指将相对复杂的数据通过可视的. ...

  8. 宝可梦数据集分析及预测

    前言 以下内容为本人学习过程中记录,仅用于学习,如有错误或者纰漏,请留言指正,谢谢. 数据集和代码下载 – 百度云链接:https://pan.baidu.com/s/1RFUEVcD85J2AQ3_ ...

  9. 阿里云飞天大数据产品价值解读——《一站式高质量搜索开放搜索》

    一.如何评估搜索质量.体验与业务价值 1.搜索-无处不在 生活中多种不同场景需要进行搜索,在企业内部产品中也需要使用多种搜索功能,方便用户快捷地获取企业相关商品.服务.内容等信息.搜索在不同的企业业务 ...

最新文章

  1. Apache Solr schema.xml及solrconfig.xml文件中文注解
  2. 多窗体应用中的注意点
  3. MYSQL中TIMESTAMP类型的默认值
  4. helm部署hadoop报错解决方法
  5. android自动化测试工具之monkey
  6. 理解浮动元素——怎么使用它们、它们有什么问题以及怎么解决这些问题。
  7. 配置struts.xml时extends=struts-default会报错,原因和解决
  8. iphone手机型号获取
  9. java socat_socat安装使用方法
  10. FastDFS学习总结(2)--Tracker与Storage配置详解
  11. 机器学习(西瓜书)读书难点参考资料
  12. python tab键自动补全_设置python中TAB键自动补全方法
  13. java 配置dbcp_java – 使用DBCP进行Tomcat配置
  14. input accept属性控制选择文件类型
  15. 移动安全初探:窃取微信聊天记录、Hacking Android with Metasploit
  16. 北京高级项目经理市场需求
  17. 爬取影评python_爬虫 | 战狼2 影评爬取及分析
  18. exception java_总结java的exception
  19. php企业后台管理系统模板,企业版PHP后台管理模板【清爽型】修改版~
  20. 4种最适合零基础入门的编程语言排行榜

热门文章

  1. WebStorm设置px转换rem,亲测有效!
  2. 2023年全国最新工会考试精选真题及答案46
  3. Linux下只允许用户远程scp
  4. 数据库如何转身云原生数据库
  5. LMS算法实现系统识别
  6. MATLAB中图像邻域处理
  7. 轻风送暖写诗意,梅雨传情送祝福
  8. react native Android端保持APP后台运行--封装 Headless JS
  9. 复习七天通过软考高级「系统架构师」,我是如何做到的
  10. 微信小程序—audio(音频)