自然划分的3-4-5规则
最高有效位:就是一个数值的最高位。
比如:678的最高有效位:6;-123的最高有效位:-1;
自然划分的3-4-5规则常被用来将数值数据(连续型数据)划分为相对一致、更自然的区间, 规则的划分步骤:
(1) 如果一个区间最高有效位上包含3,6,7或9个不同的值,就将该区间划分为3个等宽子区间;
(为7的话,划分成 2,3,2的宽度比例) ;
(2) 如果一个区间最高有效位上包含2,4,或8个不 同的值,就将该区间划分为4个等宽子区间;
(3) 如果一个区间最高有效位上包含1,5,或10个不同的值,就将该区间划分为5个等宽子区间;
将该规则递归的应用于每个子区间,产生给定数值属性的概念分层
对于数据集中出现的最大值和最小值的极端分布,为了避免上述方法出现的结果扭曲,可以在顶层分段时,选用一个大部分的概率空间。 如 选择5%-95%的数据,再进行以上规则的划分。
实例1:如某公司的销售增量在 -180~383之间,采用该规则进行划分如下,首先取定一个整的左闭右开的区间
向下取整-180 是 -200 ,向上取整383是400
[-200,400)。最高位是百分位,最高有效位有-2、-1、1、2、3,4一共6个,分成3个等宽区间 (注意0的情况)
【-200【最高有效位:-2】,-100【最高有效位:-1】,100【最高有效位:1】,
200【最高有效位:2】,300【最高有效位:3】,400【最高有效位:4】】
a1 [-200,0) a2 [0,200) a3[200,400)
再划分每个区间的最高有效位是2个,子区间划分4个
a1 [-200,0) a2 [0,200) a3[200,400)
a11[-200,-150) a21[0,50) a31[200,250)
a12[-150,-100) a22[50,100) a32[250,300)
a13[-100,-50) a23[100,150) a33[300,350)
a14[-50,0) a24[150,200) a34[350,400)
a14[-50,0) a24[150,200) a34[350,400)
自然划分的3-4-5规则相关推荐
- Android 命名规则
1. 前言 这份文档参考了 Google Java 编程风格规范和 Google 官方 Android 编码风格规范.该文档仅供参考,只要形成一个统一的风格,见量知其意就可. 1.1 术语说明 在本文 ...
- 计算机应用研究潜规则,基于相容矩阵计算的不完备决策系统规则获取算法
基于相容矩阵计算的不完备决策系统规则获取算法 针对不完备信息决策系统问题,引入相容关系下条件属性矩阵和决策属性矩阵的相关概念,并由此提出一种基于矩阵计算的不 (本文共6页) 阅读全文>> ...
- sockboom群_Phonics:自然拼读自然拼读练习表
K12英语教师在线学习社群 优质多元教学资源平台 ▲ 先进理念助力教师成长 点击标题下 爱课堂 关注 学习·交流·分享·成长 1Phonics是什么? Phonics,即字母拼读法(又译自然拼音)是自 ...
- ANSYS WORKBENCH中划分网格的几种方法
如何在ANSYS WORKBENCH中划分网格?经常有朋友问到这个问题.我整理了一下,先给出第一个入门篇,说明最基本的划分思路.以后再对某些专题问题进行细致阐述. ANSYS WORKBENCH中提供 ...
- 【代码源】每日一题 农田划分
2022.05.12 题目链接:农田划分 - 题目 - Daimayuan Online Judge 题目描述 约翰是一个农场主,他的农场有n块田,编号从 1到 n,这 n块田通过 m条双向道路相连( ...
- 微信如何实施微服务?
作者:许家涛,2005 年加入腾讯,见证 QQ 邮箱从百万到数亿用户的整个敏捷开发过程以及架构变迁.2011 年起负责微信后台基础架构,包括分布式存储平台和后台服务框架等,覆盖微信账号 / 消息 / ...
- 面试常考,项目易错,长文详解C/C++中的字节对齐
作者 | 李肖遥 来源 | 技术让梦想更伟大(ID:TechDreamer) 头图 | CSDN 下载自东方IC 引入主题,看代码 我们先来看看以下程序 //编译器:https://tool.lu/ ...
- 如何理解社交效应「蒸发式降温」?
咖友提问:如何理解"社交效应-蒸发式降温"? 经常有人问起新浪微博是如何一步一步衰退的,同时也就有人给出"社交效应-蒸发式降温"这样的回答.请问,究竟该如何理解 ...
- 位地址和字节地址换算_面试常考,项目易错,长文详解C/C++中的字节对齐
(给CPP开发者加星标,提升C/C++技能) 作者:技术让梦想更伟大 / 李肖遥 (本文来自作者投稿) 我们先来看看以下程序 //编译器:https://tool.lu/coderunner///来源 ...
最新文章
- Action 参数的取值及其含义
- 2021-01-26 粒子群优化算法(PSO)以及Matlab实现
- sample solution
- windows subsystem for linux
- 基于 xilinx vivado 的PCIE ip核设置与例程代码详解
- java学习(157):线程的引入
- Java中9种IO的读取方式
- php xml视频教程,传智播客PHP2015-XML视频教程
- mybatis 配置_配置Mybatis在Spring Boot工程中的整合
- [和秋叶一起学ppt]四步做好段落排版(笔记)
- cactiEZ 配置
- 循环神经网络应用举例
- 八大数据分析模型之——用户模型(一)
- cdr软件百度百科_cdr是什么软件?
- HTML 实现仿 Windows 桌面主题特效
- C# 访问ftp地址下载jpg、pdf、文件夹
- 适用于Android智能手机的6大数据保护应用
- 高斯分布数学性质及推导(一):如何证明高斯分布的积分为1
- MSR165数据记录仪让运输透明化
- 笙科电子(AMICCOM)样片申请与经验
热门文章
- Cascade RPN,结构的艺术带来极致提升 | NeurIPS 2019
- 工作5年后才明白的道理:不起眼的技能中,藏着你的未来
- GitHub标星近1万:只需5秒音源,这个网络就能实时“克隆”你的声音
- 加速AI应用落地,英特尔AI 2.0的进阶之道
- 如何像用MNIST一样来用ImageNet?这里有一份加速TensorFlow分布式训练的梯度压缩指南
- 你可能没那么了解 JWT
- 公司新来的同事一顿操作把大家整懵了,问了他的经历细思极恐。。。
- 价值60W 的字节工牌,面试太卷了...
- 来吧,用设计模式来干掉 if-else
- 面试官:你说你精通 Docker,那你来详细说说 Dockerfile 吧