算法入门篇四 桶排序
桶排序
计数排序(基于统计)
- 要求数据是有限的,和数据状况有关,比如对于200个人统计他们的年龄分布,这个时候需要申请200个桶,因此对于输入数据的规模有限制,如果输入规模是不定的,空间申请就会很麻烦。
基数排序
思想
- 要求排序的数字都是十进制的数字,找到最高位的数字,对于其中不满足位数的数字前面补0,例如【100,23,34】就需要改写成【100,023,034】的形式。
- 准备和数字相同数目的桶(类比于先进先出的队列),所有数字按照个位数字进桶,然后按照从左往右的次序依次往出倒数字,如果一个桶内有多个数字按照次序(队列)倒数,再按照十位数字进桶,原理和先前类似,倒出;再按照百位数字进桶,出桶。最后的次序是从小到大的。
落地
- 初始数组为【23,13,3,24,23,14】,申请两个栈,一个为count,一个是help。count按照次序分别是【0,1,2,3,4,5,6,7,8,9】这个用于统计对应的数字的个数,比如上面这个例子的话,个位是3的个数有4个,个位是4的个数有3个。而help指定的是数组中元素的个数。此时一个6个元素,所以将help的大小设置为6。
- 统计完对应的数字数字之后,得到的count为【0,0,0,4,2,0,0,0,0,0】,对其进行加工,对应元素的位置等于自身的值+前面的元素值。如果是0号位置就是本身,1号就是0+0,2号是0+0;3号是4+0;4号是4+0;5号是6+0;依次类推剩余元素的值都是6。经过加工后的count数组含义就是小于等于相应位置上元素的个数。比如小于等于3的有三个元素;小于等于5,6,7,8,9的有6个元素。
操作过程
- 从右往左遍历,第一个元素是14,个位数小于等于6的有6个,所以将14填写在help的5位置上,并且将count数组中的4对应的6减1,变成5。
- 下一个元素是23,个位元素对应的是3,查询count数组,小于等于3的元素有四个,因此将23填写在help数组的3号位置,count中3号位置的4减1;
- 下一个元素是24, 个位元素对应的是4,查询count数组,小于等于4的元素有5个,因此将24填写在help数组的4号位置,count中4号位置的5减1;
- 下一个元素是3, 个位元素对应的是3,查询count数组,小于等于3的元素有3个,因此将3填写在help数组的2号位置,count中3号位置的3减1;
- 下一个元素是13, 个位元素对应的是3,查询count数组,小于等于3的元素有2个,因此将3填写在help数组的1号位置,count中3号位置的2减1;
- 下一个元素是23, 个位元素对应的是3,查询count数组,小于等于3的元素有1个,因此将3填写在help数组的0号位置,count中3号位置的1减1;
完整代码
package class03;import java.util.Arrays;public class Code02_RadixSort {// only for no-negative valuepublic static void radixSort(int[] arr) {if (arr == null || arr.length < 2) {return;}radixSort(arr, 0, arr.length - 1, maxbits(arr));}public static int maxbits(int[] arr) {int max = Integer.MIN_VALUE;for (int i = 0; i < arr.length; i++) {max = Math.max(max, arr[i]);}int res = 0;while (max != 0) {res++;max /= 10;}return res;}// arr[begin..end]排序public static void radixSort(int[] arr, int L, int R, int digit) {final int radix = 10;int i = 0, j = 0;// 有多少个数准备多少个辅助空间int[] bucket = new int[R - L + 1];for (int d = 1; d <= digit; d++) { // 有多少位就进出几次// 10个空间// count[0] 当前位(d位)是0的数字有多少个// count[1] 当前位(d位)是(0和1)的数字有多少个// count[2] 当前位(d位)是(0、1和2)的数字有多少个// count[i] 当前位(d位)是(0~i)的数字有多少个int[] count = new int[radix]; // count[0..9]for (i = L; i <= R; i++) {j = getDigit(arr[i], d);count[j]++;}for (i = 1; i < radix; i++) {count[i] = count[i] + count[i - 1];}for (i = R; i >= L; i--) {j = getDigit(arr[i], d);bucket[count[j] - 1] = arr[i];count[j]--;}for (i = L, j = 0; i <= R; i++, j++) {arr[i] = bucket[j];}}}public static int getDigit(int x, int d) {return ((x / ((int) Math.pow(10, d - 1))) % 10);}// for testpublic static void comparator(int[] arr) {Arrays.sort(arr);}// for testpublic static int[] generateRandomArray(int maxSize, int maxValue) {int[] arr = new int[(int) ((maxSize + 1) * Math.random())];for (int i = 0; i < arr.length; i++) {arr[i] = (int) ((maxValue + 1) * Math.random());}return arr;}// for testpublic static int[] copyArray(int[] arr) {if (arr == null) {return null;}int[] res = new int[arr.length];for (int i = 0; i < arr.length; i++) {res[i] = arr[i];}return res;}// for testpublic static boolean isEqual(int[] arr1, int[] arr2) {if ((arr1 == null && arr2 != null) || (arr1 != null && arr2 == null)) {return false;}if (arr1 == null && arr2 == null) {return true;}if (arr1.length != arr2.length) {return false;}for (int i = 0; i < arr1.length; i++) {if (arr1[i] != arr2[i]) {return false;}}return true;}// for testpublic static void printArray(int[] arr) {if (arr == null) {return;}for (int i = 0; i < arr.length; i++) {System.out.print(arr[i] + " ");}System.out.println();}// for testpublic static void main(String[] args) {int testTime = 500000;int maxSize = 100;int maxValue = 100000;boolean succeed = true;for (int i = 0; i < testTime; i++) {int[] arr1 = generateRandomArray(maxSize, maxValue);int[] arr2 = copyArray(arr1);radixSort(arr1);comparator(arr2);if (!isEqual(arr1, arr2)) {succeed = false;printArray(arr1);printArray(arr2);break;}}System.out.println(succeed ? "Nice!" : "Fucking fucked!");int[] arr = generateRandomArray(maxSize, maxValue);printArray(arr);radixSort(arr);printArray(arr);}}
稳定性
- 相同元素排序保证先后顺序
- 同样数值的个体之间,如果不因为排序而改变相对次序,这个排序就是有稳定性的,否则则没有
- 基于比较的排序,一般都是不稳定的;基数排序(按照个位、十位、百位上的元素的大小进行相对次序的排列)和计数排序(统计相同数值的元素出现的次数,押入对应的元素组成的数据栈,利用栈先入后出的特性,保持元素的相对次序,参考上文统计0-200员工年龄分布问题)是稳定的
- 不具备稳定性的排序:选择排序、快速排序 和 堆排序
- 具备稳定性的排序 :冒泡排序、插入排序 、归并排序 、一切桶排序思想下的排序(计数排序和基数排序)
- 目前没有 时间复杂度为O(N*logN) 额外时间复杂度O(1) 又稳定的排序
- 稳定性 主要体现在 非基础类型数据的排序,比如对自定义结构体学生类型{年龄、班级},先按照年龄排序,再按照班级进行排序
分析:
- 桶排序思想下的排序都是不基于比较的排序
- 时间复杂度为O(N),额外空间负载度O(M)
- 应用范围有限,需要样本的数据状况满足桶的划分
汇总
- 快速排序不是基于比较的排序
时间 | 空间 | 稳定性 | 备注 | |
选择排序 | O(N^2) | O(1) | 不稳定 | {5,5,5,3} 3和第一个5交换,不稳定 |
冒泡排序 | O(N^2) | O(1) | 稳定 | |
插入排序 | O(N^2) | O(1) | 稳定 | {3,4,4,5}新插入元素4,不可以越过与其相等元素的左边,即元素相等的话,只会排在相等区域的最后位置 |
归并排序 | O(N*logN) | O(N) | 稳定 | {1,1,2,2}{1,1,2,2}左边和右边进行比较拼接的时候,先拷贝左边的元素,再拷贝右边的元素 |
快速排序 | O(N*logN) | O(logN) | 不稳定 | {3,4,5,6,6,6,6,6,|2,333} 2会和第一个6进行交换,打破了相对次序 |
堆排序 | O(N*logN) | O(1) | 不稳定 | 树状结构,{5,5,5,5,6}第一个5会和6交换,不稳定 |
桶排序(基数/计数) | O(N) | O(M) | 稳定 | 非比较 |
- 归并、快排、和堆排序最为关键;不在乎稳定性的前提小,使用快速排序最好,时间最快(实验可知);需要稳定性的话,使用归并排序;在乎额外空间的话,使用堆排序
常见的坑
- 归并排序的额外空间复杂度可以变为O(1),但是会失去稳定性的优势,详见《归并排序,内部缓冲法》
- 原地归并排序,很垃圾,会将时间复杂度变成O(N^2)
- 快速排序也可以做到稳定性,但是非常难,详见《01 stable sort》
- 所有的改进都不重要 目前没有 时间复杂度为O(N*logN) 额外空间复杂度为 O(1) 又稳定的排序
- 将一个数组中,所有的奇数移到数组的左边,所有的偶数移到数组的右边。保持相对次序不变的同时,要是时间复杂度为O(N),空间复杂度为O(1)。这个没法做
算法入门篇四 桶排序相关推荐
- 算法入门篇六 二叉树
牛客网 算法入门篇 左程云老师 个人复习,如果侵全,设为私密 二叉树遍历(递归) 先序遍历(中,左,右) 中序遍历(左,中,右) 后序遍历(左,右,中) 如上图所示结构,二叉树的遍历本质上都是递归序, ...
- FPGA基础入门篇(四) 边沿检测电路
FPGA基础入门篇(四)--边沿检测电路 一.边沿检测 边沿检测,就是检测输入信号,或者FPGA内部逻辑信号的跳变,即上升沿或者下降沿的检测.在检测到所需要的边沿后产生一个高电平的脉冲.这在FPGA电 ...
- 算法入门篇三 详解桶排序和整理排序知识 堆的相关操作 补充 不完整
归并排序不使用递归 使用一个变量,使其按照1.2.4.8递增,控制左右两边1个元素.2个元素.4个元素等元素的合并 完全二叉树 完全二叉树 要不全是满的,要不叶子节点出现在最后一层,只要出现了叶子节点 ...
- 【算法入门漫画】:“排序算法” 大总结
冒泡排序: 漫画:什么是冒泡排序? 选择排序: 漫画:什么是选择排序? 插入排序: 漫画:什么是插入排序? 此外还有冒泡排序的变种,鸡尾酒排序: 漫画:什么是鸡尾酒排序? 第三梯队的排序算法有什么共同 ...
- Python实现八大排序算法(转载)+ 桶排序(原创)
插入排序 核心思想 代码实现 希尔排序 核心思想 代码实现 冒泡排序 核心思想 代码实现 快速排序 核心思想 代码实现 直接选择排序 核心思想 代码实现 堆排序 核心思想 代码实现 归并排序 核心思想 ...
- 经典排序算法(9)——桶排序算法详解
桶排序(Bucket sort)或所谓的箱排序,并不是比较排序,它不受到 O(nlogn) 下限的影响. 一.算法基本思想 (1)基本思想 桶排序工作的原理是将数组分到有限数量的桶子里,每个桶子再个别 ...
- 九大经典算法之基数排序、桶排序
08 基数排序(Radix Sort) 基数排序是一种非比较型整数排序算法,其原理是将整数按位数切割成不同的数字,然后按每个位数分别比较.排序过程是将所有待比较数值统一为同样的数位长度,数位较短的数前 ...
- 算法入门篇八 贪心算法
牛客网 左程云老师的算法入门课 贪心算法 贪心算法的解题步骤 例子 题目要求 解题策略 按照结束时间早的会议先安排,比如先安排[2,4],当4结束了,所有开始时间小于4的全部淘汰,[1,7].[3 ...
- 排序算法(一)--桶排序、冒泡、快排(JAVA)
排序算法汇总 参考书籍–<啊哈!算法> 作者:啊哈磊 首先提出一个问题:班内有5名同学,成绩分别为5,8,2,4,2分(满分10分),需要将成绩从小到大排序 简化版 桶排序 时间复杂度O( ...
最新文章
- mysql临时表如何分页查询慢_数据量很大,分页查询很慢,怎么优化?
- PB控制性能TreeView
- 【SpringBoot】在SpringBoot中使用Ehcache
- Dalvik/ART(ANDROID)中的多线程机制(4)
- ftk学习记(image显示篇)
- AR增强现实开发介绍
- 计算机京东账户安全退出,京东账号如果提示存在风险该怎么解除?
- 校验EXE文件防止软件被破解
- 刻录服务器系统光盘,系统光盘制作
- enfuzion与lsf构建渲染集群_集群渲染系统构建及优化-精选文档
- C语言人五英尺七英寸,5尺7寸(5尺7寸是多高美国)
- 将android应用中产生arn的原因写到本地
- Android 打开网络设置界面
- 教你免费使用百度云GPU算力提交深度学习任务
- 10个重要的算法C语言实现源代码(留着以后看)
- Nodejs 实现短网址功能
- 详解 利用NPOI向Excel指定位置中加入图片(支持.xlsx和.xls)
- Hibernate注解详解(超全面)
- PERT:一种基于乱序语言模型的预训练模型
- 桌面图标有阴影解决方案
热门文章
- 二叉树的深度_十七:二叉树的最小深度
- 数据结构与算法(C#版)第二章 C#语言与面向对象技术(上)V1.0
- 【转】1.8异步编程:.NET 4.5 基于任务的异步编程模型(TAP)
- 华为鸿蒙与佳华,华为鸿蒙系统发布,带来三大好消息
- 【开源项目】EasyCmd命令图形化软件
- 数据结构 - 顺序存储二叉树(前序中序后序遍历)
- 死锁编码及定位分析(故障排查)
- java mediator_java—mediator中介模式
- 【Linux学习】强大的文本分析工具AWK
- 【POJ - 2942】Knights of the Round Table(点双连通分量,二分图判断奇环奇圈)
- 算法入门篇六 二叉树