西瓜书里面常用的三个数据集,西瓜数据集2.0,3.0,4.0整理如下,注意中文容易出现乱码。

西瓜数据集2.0

西瓜数据集3.0

西瓜数据集4.0

import pandas as pddef createDataSet_2():dataSet_2 = [# 1['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],# 2['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'],# 3['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],# 4['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '好瓜'],# 5['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '好瓜'],# 6['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '好瓜'],# 7['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', '好瓜'],# 8['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', '好瓜'],# 9['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜'],# 10['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', '坏瓜'],# 11['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', '坏瓜'],# 12['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', '坏瓜'],# 13['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', '坏瓜'],# 14['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', '坏瓜'],# 15['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', '坏瓜'],# 16['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', '坏瓜'],# 17['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', '坏瓜']]# 特征值列表labels_2 = ['色泽', '根蒂', '敲击', '纹理', '脐部', '触感', '好瓜']return dataSet_2, labels_2def createDataSet_3():dataSet_3 = [# 1['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.697, 0.460, '好瓜'],# 2['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.774, 0.376, '好瓜'],# 3['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.634, 0.264, '好瓜'],# 4['青绿', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', 0.608, 0.318, '好瓜'],# 5['浅白', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', 0.556, 0.215, '好瓜'],# 6['青绿', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.403, 0.237, '好瓜'],# 7['乌黑', '稍蜷', '浊响', '稍糊', '稍凹', '软粘', 0.481, 0.149, '好瓜'],# 8['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '硬滑', 0.437, 0.211, '好瓜'],# 9['乌黑', '稍蜷', '沉闷', '稍糊', '稍凹', '硬滑', 0.666, 0.091, '坏瓜'],# 10['青绿', '硬挺', '清脆', '清晰', '平坦', '软粘', 0.243, 0.267, '坏瓜'],# 11['浅白', '硬挺', '清脆', '模糊', '平坦', '硬滑', 0.245, 0.057, '坏瓜'],# 12['浅白', '蜷缩', '浊响', '模糊', '平坦', '软粘', 0.343, 0.099, '坏瓜'],# 13['青绿', '稍蜷', '浊响', '稍糊', '凹陷', '硬滑', 0.639, 0.161, '坏瓜'],# 14['浅白', '稍蜷', '沉闷', '稍糊', '凹陷', '硬滑', 0.657, 0.198, '坏瓜'],# 15['乌黑', '稍蜷', '浊响', '清晰', '稍凹', '软粘', 0.360, 0.370, '坏瓜'],# 16['浅白', '蜷缩', '浊响', '模糊', '平坦', '硬滑', 0.593, 0.042, '坏瓜'],# 17['青绿', '蜷缩', '沉闷', '稍糊', '稍凹', '硬滑', 0.719, 0.103, '坏瓜']]# 特征值列表labels_3 = ['色泽', '根蒂', '敲击', '纹理', '脐部', '触感', '密度', '含糖率','好瓜']return dataSet_3, labels_3def createDataSet_4():dataSet_4 = [# 1[0.697, 0.460, '好瓜'],# 2[0.774, 0.376, '好瓜'],# 3[0.634, 0.264, '好瓜'],# 4[0.608, 0.318, '好瓜'],# 5[0.556, 0.215, '好瓜'],# 6[0.403, 0.237, '好瓜'],# 7[0.481, 0.149, '好瓜'],# 8[0.437, 0.211, '好瓜'],# 9[0.666, 0.091, '坏瓜'],# 10[0.243, 0.267, '坏瓜'],# 11[0.245, 0.057, '坏瓜'],# 12[0.343, 0.099, '坏瓜'],# 13[0.639, 0.161, '坏瓜'],# 14[0.657, 0.198, '坏瓜'],# 15[0.360, 0.370, '坏瓜'],# 16[0.593, 0.042, '坏瓜'],# 17[0.719, 0.103, '坏瓜']]# 特征值列表labels_4 = ['密度', '含糖率','好瓜']return dataSet_4, labels_4

机器学习算法笔记--------建立西瓜数据集相关推荐

  1. python决策树 value_机器学习 | 算法笔记(四)- 决策树算法以及代码实现

    概述 上一篇讲述了<机器学习 | 算法笔记(三)- 支持向量机算法以及代码实现>,本篇讲述机器学习算法决策树,内容包括模型介绍及代码实现. 决策树 决策树(Decision Tree)在机 ...

  2. ML之分类预测:基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测

    ML之分类预测:基于sklearn库的七八种机器学习算法利用糖尿病(diabetes)数据集(8→1)实现二分类预测 目录 输出结果 数据集展示 输出结果 1.k-NN 2.LoR 4.DT 5.RF ...

  3. 机器学习算法笔记——P22 sklearn—LASSO算法

    机器学习算法笔记--P22 sklearn-LASSO算法 #!/usr/bin/env python # coding: utf-8# In[1]:import numpy as np from n ...

  4. 白话机器学习算法——笔记

    白话机器学习算法--笔记 第一章 1 数据准备 数据格式 (一般为表格) 变量类型 变量选择 特征工程 降维 缺失数据的处理 2 选择算法 3 参数调优 4 评价模型 总结 第二章 k均值聚类 1 迭 ...

  5. 机器学习算法笔记(零)

    机器学习算法笔记(零) 简介 机器学习的定义:对于某类任务 T 和性能度量 P,一个计算机程序被认为可以从经验 E 中学习是指,通过经验 E 改进后,它在任务 T 上由性能度量 P 衡量的性能有所提升 ...

  6. 机器学习 | 算法笔记- 集成学习(Ensemble Learning)

    前言 本系列为机器学习算法的总结和归纳,目的为了清晰阐述算法原理,同时附带上手代码实例,便于理解. 目录 k近邻(KNN) 决策树 线性回归 逻辑斯蒂回归 朴素贝叶斯 支持向量机(SVM) 组合算法( ...

  7. 监督性机器学习算法笔记

    基础与背景 1 基本概念 2 模型的评估与过拟合 3 泛化 感知机与逻辑回归 1 感知机 11 模型 12 策略 13 算法 14 拓展 2 逻辑回归 21 二项分类模型 22 策略 23 算法 k- ...

  8. 机器学习算法笔记-聚类

    聚类算法 k-means聚类 k-means的基本概念 不稳定结果 评价指标 参数k如何选择 基于kmeans的图像分割 基于kmeans的半监督学习 DBSCAN聚类 DBSCAN的基本概念 如何选 ...

  9. 【机器学习算法笔记系列】逻辑回归(LR)算法详解和实战

    逻辑回归(LR)算法概述 逻辑回归(Logistic Regression)是用于处理因变量为分类变量的回归问题,常见的是二分类或二项分布问题,也可以处理多分类问题,它实际上是属于一种分类方法. 逻辑 ...

最新文章

  1. JAVA CXF、XFIRE、AXIS webservice获取客户端IP
  2. 树转换为二叉树小技巧
  3. 中国农业大学计算机专业在陕西录取分数线,陕西考生,400多分被985大学录取,分不高的考生“捡漏“注意这几点...
  4. vue 判断同一数组内的值是否一直_前端代码+后端API,值得一学的Vue高仿音乐播放器实战项目
  5. 最佳实践:如何基于MNS和OSS实现无大小限制的消息传输
  6. 看懂别人的代码,只是成为高效程序员的第一步!
  7. (38)FPGA原语设计(BUFH)
  8. 6410的系统时钟设置(中)---相关寄存器介绍
  9. 让代码看起来更舒服(1):选择适合的配色方案 (转)
  10. js ajax提交数据php,js中ajax提交到php的json数据,php无法获得
  11. NYOJ----1591----模拟+map
  12. 阿里巴巴矢量图标使用
  13. 决策树中的基尼系数、 熵之半和分类误差率
  14. 深度详解新iPad八核GPU
  15. iOS info.plist访问权限设置
  16. 一文教你如何快速实现声音识别
  17. (read/write、select、getsockopt、signal)实时判断socket连接状态/是否断开
  18. android方法入口,Android App多个入口的实现方法
  19. iphonex美版型号对照表_iPhoneX国行和美版/港版/日版哪个好?苹果X各国家版本区别对比...
  20. 为什么无法显示其他计算机,为什么网上邻居中看不到同一局域网的其他电脑?...

热门文章

  1. ssm+jsp计算机毕业设计中药材自学网97023(程序+LW+源码+远程部署)
  2. 数字游戏(区间dp)
  3. 【算法之家】——交换排序之冒泡排序与快速排序
  4. 一看就懂的 学生学籍管理系统(C语言实现)
  5. 企业微信开发实战(四、OA审批之企业假期管理配置、获取成员假期余额、修改成员假期余额)
  6. 通过可解释的深度学习预测蛋白质-肽结合残基
  7. 牛客小白月赛6 - C.桃花(DFS/BFS)
  8. 《安富莱嵌入式周报》第243期:2021.12.06--2021.12.12
  9. Android开发中apk开启sdcard的读写权限
  10. 网易java版存档在哪儿_网易我的世界怎么导入存档 网易中国版手游存档位置