鸢尾花分类_K近邻(分类通用 数据挖掘入门与实践-实验4)
文章目录
- 效果
- 代码
效果
代码
from sklearn.datasets import load_iris
import numpy as np#获取数据集
dataset=load_iris()
X=dataset.data
Y=dataset.target#数据转换
X=np.array(X,dtype='float')
Y=np.array(Y,dtype='int')#方法1
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.preprocessing import MinMaxScaler#数据归一化
X_transformed=MinMaxScaler().fit_transform(X)#数据集分割
X_train, X_test, Y_train, Y_test=train_test_split(X_transformed, Y, random_state=14) #模型训练
estimator=KNeighborsClassifier()
estimator.fit(X_train,Y_train)#模型测试
Y_predicted=estimator.predict(X_test)
accuracy=np.mean(Y_test==Y_predicted)*100
print("方法1:The accuracy is {0:.1f}%".format(accuracy))#方法2:流水线
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import MinMaxScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import cross_val_score#归一化
Scale=MinMaxScaler()#模型选择
Predict=KNeighborsClassifier()
scaling_pipeline=Pipeline([('scale',Scale),('predict',Predict)])#模型交叉验证
scores=cross_val_score(scaling_pipeline, X, Y, scoring="accuracy")
accuracy=np.mean(scores)*100
print("方法2:The accuracy is {0:.1f}%".format(accuracy))
鸢尾花分类_K近邻(分类通用 数据挖掘入门与实践-实验4)相关推荐
- 比赛结果预测_决策树_随机森林(通用 数据挖掘入门与实践-实验5)
#数据导入 import pandas as pddata_filename="datasets.csv" dataset=pd.read_csv(data_filename) # ...
- 手写体识别(数据挖掘入门与实践-实验11)
文章目录 数据导入 数据处理 模型训练 神经网络评估 效果 数据导入 #数据导入 from keras.datasets import mnist (X_train,Y_train),(X_test, ...
- 人工神经网络_验证码破译(数据挖掘入门与实践-实验9)
文章目录 一.待优化 二.代码 单字母预测 1.验证码图像生成 2.字符串切割 3.数据集创建 4.多条数据集创建 5.数据集调整 6.数据集分割 & 单字母预测模型训练 7.神经网路评估 单 ...
- scikit-learning_特征分析(数据挖掘入门与实践-实验7)
#数据导入 import os import pandas as pdadult_filename="adult.data" adult = pd.read_csv(adult_f ...
- OneR算法_0(python数据挖掘入门与实践-实验2)
文章目录 结果 代码 结果 代码 from sklearn.datasets import load_iris import numpy as np from collections import d ...
- 人工神经网络_图像加载(数据挖掘入门与实践-实验10)
文章目录 数据集 代码 数据集 链接:https://pan.baidu.com/s/1JyRWXLK3GQDh63RRS_mq6Q 提取码:6w65 代码 #加载图片数据包 import os im ...
- PCA主成分分析_特征创建(数据挖掘入门与实践-实验8)
##############################数据处理 #数据导入 $$ 数据转换 import os import numpy as np import pandas as pd fr ...
- 电影推荐_亲和性分析_规则提取(数据挖掘入门与实践-实验6)
#数据导入 import os import pandas as pdall_ratings=pd.read_csv("ml-100k/u.data", delimiter=&qu ...
- 亲和性分析_0(python数据挖掘入门与实践-实验1)
文章目录 解析 思路 效果 代码 解析 支持度:事件发生的总次数 置信度:一定条件下,事件发生的概率 思路 第一步: 导入数据,并交由变量X维护 创建特征数组 获取特征数量 第二步: 创建字典 val ...
最新文章
- 基于CENTOS7 Linux高可用集群LVS+Keepalived配置
- python输入两个整数按先大后小的顺序输出_指针变量:输入a和b两个整数,按先大后小的顺序输出a和b。...
- 飞鸽改变您的互联网生活
- Native App
- Multi-thread--C++11多线程中std::call_once的使用
- 2017.4.22 进制转换 思考记录
- keybd_event、SendInput笔记
- 线性拟合——从最大似然估计到平方误差到huber loss
- RTMPDump源代码分析 0: 主要函数调用分析
- 爱客影院自动采集程序源码v3.5.5
- GB28181协议之语音对讲
- HTML5期末大作业:在线电影app网页设计——电影票务购票系统WebApp手机模板(12页) HTML+CSS+JavaScript 计算机毕设网页设计源码
- 家用计算机存储容量,计算机内存储器容量有多大?
- 1200兆路由器网速_1200m路由器有必要吗 只要我们选择5GHz频段就可
- 新遇到的问题 , 进程退出代码是 '0xffffffff'
- Android9.0 完全隐藏导航栏、状态栏
- linux服务器基础知识及工作原理汇总
- 【GZOJ】1369——小明跳楼梯
- leetcode:2085. 统计出现过一次的公共字符串
- 如何下载php-cs-fixer,详解使用php-cs-fixer格式化代码
热门文章
- Windows Phone中Wallet钱包的使用
- 软件测试作业7:构建弱健壮的等价类测试用例
- sqli-lab_基础篇_1-23做题反思
- [论文阅读] (06) 万字详解什么是生成对抗网络GAN?经典论文及案例普及
- 【数字图像处理】五.MFC图像点运算之灰度线性变化、灰度非线性变化、阈值化和均衡化处理详解
- 【数据结构与算法】之深入解析“相交链表”的求解思路与算法示例
- MySQL之深入解析一条SQL的执行流程
- Python执行脚本文件将输出既能显示控制台又能重定向到日志
- hive -e ,hive -f 用法
- 小冰发布全球首款人工智能Office,沈向洋:我们不走寻常路