机器学习算法笔记--------建立西瓜数据集
西瓜书里面常用的三个数据集,西瓜数据集2.0,3.0,4.0整理如下,注意中文容易出现乱码。
西瓜数据集2.0
西瓜数据集3.0
西瓜数据集4.0
import pandas as pddef createDataSet_2():dataSet_2 = [# 1['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],# 2['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'],# 3['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],# 4['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'],# 5['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],# 6['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '好瓜'],# 7['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', '好瓜'],# 8['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', '好瓜'],# 9['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜'],# 10['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', '坏瓜'],# 11['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', '坏瓜'],# 12['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', '坏瓜'],# 13['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', '坏瓜'],# 14['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', '坏瓜'],# 15['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '坏瓜'],# 16['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', '坏瓜'],# 17['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜']]# 特征值列表labels_2 = ['色泽', '根蒂', '敲击', '纹理', '脐部', '触感', '好瓜']return dataSet_2, labels_2def createDataSet_3():dataSet_3 = [# 1['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, '好瓜'],# 2['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, '好瓜'],# 3['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, '好瓜'],# 4['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.608, 0.318, '好瓜'],# 5['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.556, 0.215, '好瓜'],# 6['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.403, 0.237, '好瓜'],# 7['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', 0.481, 0.149, '好瓜'],# 8['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', 0.437, 0.211, '好瓜'],# 9['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', 0.666, 0.091, '坏瓜'],# 10['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', 0.243, 0.267, '坏瓜'],# 11['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', 0.245, 0.057, '坏瓜'],# 12['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', 0.343, 0.099, '坏瓜'],# 13['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', 0.639, 0.161, '坏瓜'],# 14['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', 0.657, 0.198, '坏瓜'],# 15['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.360, 0.370, '坏瓜'],# 16['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', 0.593, 0.042, '坏瓜'],# 17['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', 0.719, 0.103, '坏瓜']]# 特征值列表labels_3 = ['色泽', '根蒂', '敲击', '纹理', '脐部', '触感', '密度', '含糖率','好瓜']return dataSet_3, labels_3def createDataSet_4():dataSet_4 = [# 1[0.697, 0.460, '好瓜'],# 2[0.774, 0.376, '好瓜'],# 3[0.634, 0.264, '好瓜'],# 4[0.608, 0.318, '好瓜'],# 5[0.556, 0.215, '好瓜'],# 6[0.403, 0.237, '好瓜'],# 7[0.481, 0.149, '好瓜'],# 8[0.437, 0.211, '好瓜'],# 9[0.666, 0.091, '坏瓜'],# 10[0.243, 0.267, '坏瓜'],# 11[0.245, 0.057, '坏瓜'],# 12[0.343, 0.099, '坏瓜'],# 13[0.639, 0.161, '坏瓜'],# 14[0.657, 0.198, '坏瓜'],# 15[0.360, 0.370, '坏瓜'],# 16[0.593, 0.042, '坏瓜'],# 17[0.719, 0.103, '坏瓜']]# 特征值列表labels_4 = ['密度', '含糖率','好瓜']return dataSet_4, labels_4
机器学习算法笔记--------建立西瓜数据集相关推荐
- python决策树 value_机器学习 | 算法笔记(四)- 决策树算法以及代码实现
概述 上一篇讲述了<机器学习 | 算法笔记(三)- 支持向量机算法以及代码实现>,本篇讲述机器学习算法决策树,内容包括模型介绍及代码实现. 决策树 决策树(Decision Tree)在机 ...
- ML之分类预测:基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测
ML之分类预测:基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测 目录 输出结果 数据集展示 输出结果 1.k-NN 2.LoR 4.DT 5.RF ...
- 机器学习算法笔记——P22 sklearn—LASSO算法
机器学习算法笔记--P22 sklearn-LASSO算法 #!/usr/bin/env python # coding: utf-8# In[1]:import numpy as np from n ...
- 白话机器学习算法——笔记
白话机器学习算法--笔记 第一章 1 数据准备 数据格式 (一般为表格) 变量类型 变量选择 特征工程 降维 缺失数据的处理 2 选择算法 3 参数调优 4 评价模型 总结 第二章 k均值聚类 1 迭 ...
- 机器学习算法笔记(零)
机器学习算法笔记(零) 简介 机器学习的定义:对于某类任务 T 和性能度量 P,一个计算机程序被认为可以从经验 E 中学习是指,通过经验 E 改进后,它在任务 T 上由性能度量 P 衡量的性能有所提升 ...
- 机器学习 | 算法笔记- 集成学习(Ensemble Learning)
前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解. 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法( ...
- 监督性机器学习算法笔记
基础与背景 1 基本概念 2 模型的评估与过拟合 3 泛化 感知机与逻辑回归 1 感知机 11 模型 12 策略 13 算法 14 拓展 2 逻辑回归 21 二项分类模型 22 策略 23 算法 k- ...
- 机器学习算法笔记-聚类
聚类算法 k-means聚类 k-means的基本概念 不稳定结果 评价指标 参数k如何选择 基于kmeans的图像分割 基于kmeans的半监督学习 DBSCAN聚类 DBSCAN的基本概念 如何选 ...
- 【机器学习算法笔记系列】逻辑回归(LR)算法详解和实战
逻辑回归(LR)算法概述 逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法. 逻辑 ...
最新文章
- JAVA CXF、XFIRE、AXIS webservice获取客户端IP
- 树转换为二叉树小技巧
- 中国农业大学计算机专业在陕西录取分数线,陕西考生,400多分被985大学录取,分不高的考生“捡漏“注意这几点...
- vue 判断同一数组内的值是否一直_前端代码+后端API,值得一学的Vue高仿音乐播放器实战项目
- 最佳实践:如何基于MNS和OSS实现无大小限制的消息传输
- 看懂别人的代码,只是成为高效程序员的第一步!
- (38)FPGA原语设计(BUFH)
- 6410的系统时钟设置(中)---相关寄存器介绍
- 让代码看起来更舒服(1):选择适合的配色方案 (转)
- js ajax提交数据php,js中ajax提交到php的json数据,php无法获得
- NYOJ----1591----模拟+map
- 阿里巴巴矢量图标使用
- 决策树中的基尼系数、 熵之半和分类误差率
- 深度详解新iPad八核GPU
- iOS info.plist访问权限设置
- 一文教你如何快速实现声音识别
- (read/write、select、getsockopt、signal)实时判断socket连接状态/是否断开
- android方法入口,Android App多个入口的实现方法
- iphonex美版型号对照表_iPhoneX国行和美版/港版/日版哪个好?苹果X各国家版本区别对比...
- 为什么无法显示其他计算机,为什么网上邻居中看不到同一局域网的其他电脑?...
热门文章
- ssm+jsp计算机毕业设计中药材自学网97023(程序+LW+源码+远程部署)
- 数字游戏(区间dp)
- 【算法之家】——交换排序之冒泡排序与快速排序
- 一看就懂的 学生学籍管理系统(C语言实现)
- 企业微信开发实战(四、OA审批之企业假期管理配置、获取成员假期余额、修改成员假期余额)
- 通过可解释的深度学习预测蛋白质-肽结合残基
- 牛客小白月赛6 - C.桃花(DFS/BFS)
- 《安富莱嵌入式周报》第243期:2021.12.06--2021.12.12
- Android开发中apk开启sdcard的读写权限
- 网易java版存档在哪儿_网易我的世界怎么导入存档 网易中国版手游存档位置