鲍鱼数据集https://archive.ics.uci.edu/ml/datasets/Abalone

属性信息:

给出了属性名称,属性类型,度量单位和简要说明。环数是要预测的值:可以是连续值,也可以是分类问题。

名称/数据类型/度量单位/描述
-----------------------------
性别/名义/-/ M,F和I(婴儿)
长度/连续/毫米/最长的外壳尺寸
直径/连续/毫米/垂直于长度
高度/连续/毫米/带有外壳的肉总
重/连续/克/整个鲍鱼
去皮重量/连续/克/重量肉
内脏重量/连续/克/肠重量(出血后)
蛋壳重量/连续/克/干后
环/整数/-/ +1.5给出年龄(以年为单位)

处理难点主要是性别分为三部分,male,female,infant。

首先读取数据,并把数值和字符分开。(也就是第一列单独分出来,处理后再合并回去)

datatable = importdata('dataset.data'); %加载baitxt数据
data = datatable.data; %读取非元胞的数据,data,是du其中一zhi个包
textdata = datatable.textdata; 

我们把M,F,I分别定义为-1,1,0.

s1 = 'M';
tfM = strcmpi(s1,textdata);
tfM = -tfM;
s1 = 'F';
tfF = strcmpi(s1,textdata);
tf = tfM+tfF;

这样就得到一列数据。

合并后输出即可。

data = [tf,data];
filename='data.dat';
for b=1:9dlmwrite(filename,data,'delimiter','\t','newline','pc');
end

鲍鱼数据集处理/matlab相关推荐

  1. 利用决策树算法在鲍鱼数据集上对年龄进行预测

    在上一篇文章中,通过调取sklearn库中的tree模块来构建在鲍鱼数据集上的决策树,并对测试集鲍鱼的年龄进行预测,但是,通过调库的方式只能处理数值型的属性,若数据集中既包含连续型属性和离散型属性,则 ...

  2. 鲍鱼数据集数据分析和可视化,线性回归预测鲍鱼年龄(基于TensorFlow)

    一:数据集描述 Name        Data Type    Meas.    Description     ----        ---------    -----    -------- ...

  3. 鲍鱼数据集案例分析-预测鲍鱼年龄(线性回归/梯度下降法实操)

    数据集来源UCI Machine Learning Repository: Abalone Data Set 目录 一.数据集探索性分析 二.鲍鱼数据预处理 1.对sex特征进行OneHot编码,便于 ...

  4. 岭回归实现鲍鱼年龄预测 MATLAB实现

    最近在研究正则化方法,发现吉洪诺夫正则化就是统计里的岭回归,正好之前上课的时候遇到过鲍鱼年龄预测的问题,那就再跑跑代码吧 鲍鱼的年龄可以通过鲍鱼壳的"环数"来判断,但是获取这个&q ...

  5. 图像分割数据集制作matlab,制作自己的图像语义分割数据集

    本文教你如何正确制作自己的图像语义分割数据集.假设我当前目录下有500张图片,命名从1.jpg开始,一直往上递增,我事先已经调整好了图像的大小. 首先下载Labelme工具:https://githu ...

  6. 鲍鱼数据集的可视化展示

    写在开头:这篇文章有别于上次的岩石与雷的分类问题,是个回归数据集的展示.我们将运用到之前的工具对这个数据集进行一些可视化. 关于数据集:数据集的来源同样是UCI库. 性别(M,F,I)由于鲍鱼年幼时分 ...

  7. pandas内置数据集_Pandas数据分析实战01——Abalone Data Set(鲍鱼数据集)

    > 打算从基础开始学习数据分析,给自己一个整理内容和学习消化的时间,所以,这也将成为我的学习笔记. 1. 数据描述 原始数据集包括六个属性:Gender,Length,Diameter,Heig ...

  8. Pandas数据分析实战01--Abalone Data Set(鲍鱼数据集)

    Pandas数据分析实战01 1. 数据描述 2. 数据读取 3. 数据呈现 4. 数据分析 打算从基础开始学习数据分析,给自己一个整理内容和学习消化的时间,所以,这也将成为我的学习笔记. 1. 数据 ...

  9. CIFAR-10数据集及matlab版本读取

    CIFAR-10和CIFAR-100都是带有标签的数据集(是8千万小图像数据集的子集),由Alex Krizhevsky, Vinod Nair, and Geoffrey Hinton等人创建. C ...

最新文章

  1. javascript如何实现功能的分析
  2. 一张图看懂阿里云网络产品【十五】IPv6 解决方案
  3. Spring(19)——Profile(二)
  4. VB API 之 第十一课 绘制矩形
  5. 1216: 斐波那契数列
  6. 服务器系统日志6008,DELL服务器宕机事件6008
  7. python 设计模式 观察者_【python】设计模式之观察者模式
  8. Html 小插件4 百度搜索代码
  9. “蓝桥杯”练习系统练习题答案(自己做的)
  10. 超宽带 DWM1000模块 简介
  11. 基于多任务深度学习的时空网络流量预测
  12. 计算机网络第七版谢希仁习题,计算机网络 释疑与习题解答 谢希仁 第7七版 计算机网络(第7版)谢...
  13. 用极致业务基础平台研发的族谱管理软件
  14. 2019年java经典面试题(附答案)
  15. android获取本地连接ip地址,参照第二步将本地连接改成自动获取IP地址即可
  16. 阿里巴巴入选的JCP最高执行委员会,何方神圣?
  17. python计算年龄的方法_巧算年龄-随心随性无为而为-51CTO博客
  18. KMP算法的时间复杂度
  19. 锥度用计算机怎么算,大小头体积,表面积,锥度,展开圆心角,质量计算公式与在线计算器_三贝计算网_23bei.com...
  20. 数星星 ← 树状数组

热门文章

  1. 2022-2027年中国房产网络服务行业市场全景评估及发展战略规划报告
  2. 专业学习与职业发展之我见(二)
  3. Android 开发中的日常积累
  4. stormmedia文件夹,360downloads文件夹,FavoriteVideo文件夹是干什么的?
  5. 笔试题33——双队列解决全排列拼接问题
  6. Python-pptx ChartData
  7. 鸢尾花分类python算法_BP算法鸢尾花分类
  8. IDEA 打包 spark 程序 并在远程 hadoop HA 上运行测试
  9. python发送邮件 SMTP socks代理
  10. 新型能力的识别与确定