标称型数据和数值型数据_2017-12-9 机器学习(4)-标称型和数值型
【标称型数据和数值型数据】
监督学习一般使用两种类型的目标变量:标称型和数值型
标称型:一般在有限的数据中取,而且只存在‘是’和‘否’两种不同的结果(一般用于分类)
数值型:可以在无限的数据中取,而且数值比较具体化,例如4.02,6.23这种值(一般用于回归分析)
监督学习中的分类方法输出是标称型数据。
监督学习中的回归方法输出是数值型数据。
【标称属性和数值属性】
属性,表示数据对象的一个特征。
标称属性(nominal attribute)意味着‘与名称相关’,它的值是一些符号或事物的名称。每个值代表某种类别,编码或状态,因此标称属性又被看作是分类的(categorical)。这些值不必具有有意义的序。在计算机科学中,这些值也被看做是枚举的(enumeration)。在标称属性上,数学运算是没有意义的。
二元属性(binary attribute)是一种标称属性,只有0,1两种状态。通常0表示不出现,1表示出现。
序数属性(ordinal attribute),其可能只具有有意义的序或评定(ranking),但是相继值之间的差是未知的,具有先后顺序。序数属性可以通过把数值量的值域划分成有限个有序类别,把数值属性离散化而得到。序数属性的中心趋势可以用它的众数和中位数(有序序列的中间值)表示,但不能定义均值。
以上属性都是定性的。即它们描述对象的特征,而不给出实际大小或数量。
数值属性(numeric attribute)是定量的,即它是可度量的量。数值属性可以是区间标度的或比率标度的。
区间标度属性(interval-scaled attribute)用相等的单位尺度度量。区间属性的值。
比率标度(ratiao-scaled)属性具有固定零点的数值属性。可以进行数值运算。
标称型数据和数值型数据_2017-12-9 机器学习(4)-标称型和数值型相关推荐
- 机器学习学习笔记 --- 标称型数据和数值型数据
[标称型数据和数值型数据] 监督学习一般使用两种类型的目标变量:标称型和数值型 标称型:一般在有限的数据中取,而且只存在'是'和'否'两种不同的结果(一般用于分类) 数值型:可以在无限的数据中取,而且 ...
- 预测数值型数据:回归
之前博客中,我有介绍到分类机器学习算法,分类的目标变量是标称型数据,本篇博客将重点对连续型的数据做出预测及回归算法.有些人会问:"回归能用来做什么?"其实回归能够做任何事情. 本文 ...
- SQL中的五种数据类型:字符型,文本型,数值型,逻辑型和日期型
简要描述一下SQL中的五种数据类型:字符型,文本型,数值型,逻辑型和日期型 字符型 VARCHAR VS CHAR VARCHAR型和CHAR型数据的这个差别是细微的,但是非常重要.他们都是用来储存字 ...
- python 数学期望_数学期望(离散型和连续型)
数学期望的定义 数学期望的计算公式 例题 1.数学期望的定义 在概率论和统计学中,数学期望(或均值)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一.它反映随机变量平均取值的大小. ...
- 【20210805】【数据分析】标称型数据和数值型数据
(参考:两个基本概念 标称型数据和数值型数据) 监督学习使用的目标变量一般有两种:标称型数据 和 数值型数据. 1. 标称型数据 即离散值.只在有限目标集中取值,如:"真" 或 & ...
- 标称型数据和数值型数据_数据的来源与类型以及数据的特征抽取
数据的来源与类型 大部分的数据都来自已有的数据库,如果没有的话也可以交给很多爬虫工程师去采集,来提供.也可以来自平时的记录,反正数据无处不在,大都是可用的. 数据的类型 按照机器学习的数据分类我们可以 ...
- 标称型数据和数值型数据_统计信息中的数据类型-标称,有序,间隔和比率数据类型,并举例说明
标称型数据和数值型数据 If you're studying for a statistics exam and need to review your data types this article ...
- 标称型和数值型(连续型)的区别
在监督学习(supervised learning)的过程中,只需要给定输入样本集,机器就可以从中推演出指定目标变量的可能结果.监督学习相对比较简单,机器只需从输入数据中预测合适的模型,并从中计算出目 ...
- Stata字符型数据转为数值型数据
本文用于记录数据处理过程中出现的问题 目录 一.所用命令 二.实例 1. 使用encode 2. 使用destring 三.可能存在的问题 1. 存在无法转成数值型的数据 2. 取对数时出错 四.参考 ...
最新文章
- prozilla Linux下的下载利器
- linux lcd驱动调试 echo dev/fb0,LCD驱动程序 - osc_msmij2gf的个人空间 - OSCHINA - 中文开源技术交流社区...
- 洛谷 - P4013 数字梯形问题(最大费用最大流+举一反三)
- context set_parameter all_req_parameters /iwfnd/if_sodata_types=gcs_iwf_context
- 奥鹏教育计算机试题,最新奥鹏教育《计算机基础》模拟试卷附答案(11页)-原创力文档...
- php获取虚拟机ip,php如何获取用户的ip地址
- 如何使用OSQP-Eigen
- 如何删除pdf中计算机属性,PDF文件做好后怎么修改
- 计算机基础第1次作业,计算机应用基础 第一次作业
- 矩池云怎么上传文件夹
- MySql command line client 命令系列
- 【时序】LSTNet:结合 CNN、RNN 以及 AR 的时间序列预测模型
- 正弦函数的频谱图matlab,怎样用MATLAB画正弦函数以及怎样看频谱图?
- 阴阳是世界的生成之理,亦是其发展之理。道生一,一生二,二生三,三生万物。...
- 【读书总结】《三体》—— 生存是文明的第一需要
- 群晖系统上的 Docker 使用拾遗
- 获取PC 服务器 可用的GPU
- 合成分红游戏源码_旅行世界遛狗养狗恐龙源码,分红龙源码、红包龙、合成龙...
- CSS粘性定位(sticky)
- element-ui dialog遮罩层在最上层,关掉dialog遮罩层还在
热门文章
- 【刷题日记】网易——牛牛的闹钟
- 支持右翼教科书的日本企业与个人全部名单
- [SDOI2012]拯救小云公主【bfs+二分答案】
- 【夏目鬼鬼分享】springboot搭建阿里Druid数据源监控
- 云服务器的主要性能参数,云服务器参数到配置,一文让您从小白到高手
- python去除excel空行_python中如何删除excel的行?
- Python 第三方模块 统计1 statsmodels模块1 简介,回归
- 图灵机是最早的计算机,图灵机是现代计算机诞生的源头
- 俺是郭德纲先生的忠实非现场 听众+观众
- 酒店管理系统(C语言)