「干货」编程语言十大经典算法,你知道几个?
算法与数据结构是计算机学习路上的内功心法,也是学好编程语言的重要基础。今天给大家介绍一下十大经典算法。
十大经典算法分别是:冒泡排序,插入排序,选择排序,希尔排序,快速排序,归并排序,桶排序,堆排序,计数排序,基数排序。
预备知识:算法稳定性
如果 a==b
,排序前 a
在 b
的前面,排序后 a
在 b
的后面,只要会出现这种现象,我们则说这个算法不稳定(即使两个相等的数,在排序的过程中不断交换,有可能将后面的 b
交换到 a
的前面去)。
一、冒泡排序
冒泡排序(Bubble Sort)是基于交换的排序,它重复走过需要排序的元素,依次比较相邻的两个元素的大小,保证最后一个数字一定是最大的,即它的顺序已经排好,下一轮只需要保证前面 n-1
个元素的顺序即可。
之所以称为冒泡,是因为最大/最小的数,每一次都往后面冒,就像是水里面的气泡一样。
排序的步骤如下:
- 从头开始,比较相邻的两个数,如果第一个数比第二个数大,那么就交换它们位置。
- 从开始到最后一对比较完成,一轮结束后,最后一个元素的位置已经确定。
- 除了最后一个元素以外,前面的所有未排好序的元素重复前面两个步骤。
- 重复前面 1 ~ 3 步骤,直到都已经排好序。
例如,我们需要对数组 [98,90,34,56,21]
进行从小到大排序,每一次都需要将数组最大的移动到数组尾部。那么排序的过程如下动图所示:
二、选择排序
前面说的冒泡排序是每一轮比较确定最后一个元素,中间过程不断地交换。而选择排序就是每次选择剩下的元素中最小的那个元素,直到选择完成。
排序的步骤如下:
- 从第一个元素开始,遍历其后面的元素,找出其后面比它更小的元素,若有,则两者交换,保证第一个元素最小。
- 对第二个元素一样,遍历其后面的元素,找出其后面比它更小的元素,若存在,则两者交换,保证第二个元素在未排序的数中(除了第一个元素)最小。
- 依次类推,直到最后一个元素,那么数组就已经排好序了。
比如,现在我们需要对 [98,90,34,56,21]
进行排序,动态排序过程如下:
三、插入排序
选择排序是每次选择出最小的放到已经排好的数组后面,而插入排序是依次选择一个元素,插入到前面已经排好序的数组中间,当然,这是需要已经排好的顺序数组不断移动。步骤描述如下:
- 从第一个元素开始,可以认为第一个元素已经排好顺序。
- 取出后面一个元素
n
,在前面已经排好顺序的数组里从尾部往头部遍历,假设取出来的元素为nums[i]
,如果num[i]>n
,那么将nums[i]
移动到后面一个位置,直到找到已经排序的元素小于或者等于新元素的位置,将n
放到新空出来的位置上。如果没有找到,那么 nums[i] 就是最小的元素,放在第一个位置。 - 重复上面的步骤 2,直到所有元素都插入到正确的位置。
以数组 [98,90,34,56,21]
为例,动态排序过程如下:
四、希尔排序
希尔排序(Shell’s Sort)又称“缩小增量排序”(Diminishing Increment Sort),是插入排序的一种更高效的改进版本,同时该算法是首次冲破 O(n^2*n*2)
的算法之一。
插入排序的痛点在于不管是否是大部分有序,都会对元素进行比较,如果最小数在数组末尾,想要把它移动到数组的头部是比较费劲的。希尔排序是在数组中采用跳跃式分组,按照某个增量 gap 进行分组,分为若干组,每一组分别进行插入排序。再逐步将增量 gap 缩小,再每一组进行插入排序,循环这个过程,直到增量为 1。
希尔排序基本步骤如下:
- 选择一个增量
gap
,一般开始是数组的一半,将数组元素按照间隔为gap
分为若干个小组。 - 对每一个小组进行插入排序。
- 将
gap
缩小为一半,重新分组,重复步骤 2(直到gap
为 1 的时候基本有序,稍微调整一下即可)。
以数组 [98,90,34,56,21,11,43,61]
为例子,排序的动图如下:
五、快速排序
快速排序比较有趣,选择数组的一个数作为基准数,一趟排序,将数组分割成为两部分,一部分均小于/等于基准数,另外一部分大于/等于基准数。然后分别对基准数的左右两部分继续排序,直到序列有序。这体现了分而治之的思想,其中还应用到挖坑填数的策略。
算法的步骤如下:
- 从数组中挑一个元素作为基准数,一半情况下我们选择第一个
nums[i]
,保存为standardNum
,可以理解为nums[i]
坑位的数被拎出来了,留下空的坑位。 - 取数组的左边界索引为
i
,右边界索引j
,j
从右边往左边,寻找到比standardNum
小的数,停下来,写到nums[i]
的坑位,nums[j]
的坑位空出来。i
从左边往右边找,寻找比standardNum
大的数,停下来,写到nums[j]
的坑位,这个时候,num[i]
的坑位空出来(前提是i
和j
不相撞)。 - 上面的
i
和j
循环步骤 2,直到i
和j
相撞,将基准值standardNum
写到坑位nums[i]
中,这时候,standardNum
左边的数都小于等于它本身,右边的数都大于等于它本身。 - 分别对 standardNum 左边的子数组和右边的子数组,循环执行前面的 1,2,3,直到不可再分,并且有序。
以数组 [61,90,34,56,21,11,43,68]
为例,动态排序过程如下:
六、归并排序
前面学的快速排序,体现了分治的思想,但是不够典型,而归并排序则是非常典型的分治策略。归并的总体思想是先将数组分割,再分割…分割到一个元素,然后再两两归并排序,做到局部有序,不断地归并,直到数组又被全部合起来。
排序步骤大致如下:
- 将长度为
n
的数组分割成为n/2
的两个子数组。 - 子数组也不断分割成为更小的子数组,直到不能分割。
- 最小子数组之间开始两两合并,合并之后的结果再合并。合并的时候可以申请一个临时空间,利用两个索引指针比较的方式,将两个子数组的结果合并到临时数组中去。
- 循环 3 步骤,直到合并成为长度为 n 的已经排序的数组。
以数组 [61,90,34,56,21,11,43,68]
为例,每一次都是对数组分成两半,直至不能拆分,再两两合并,合并的时候相当于对有序的两个子数组合并。
动态执行过程如下:
七、计数排序
计数排序,不是基于比较,而是基于计数。
计数排序步骤如下:
- 遍历数组,找出最大值和最小值。
- 根据最大值和最小值,初始化对应的统计元素数量的数组。
- 遍历元素,统计元素个数到新的数组。
- 遍历统计的数组,按照顺序输出排序的数组元素。
假设有几个青少年,他们年龄很接近,分别是 11、9、11、 13、12、14、15、13,现在需要给他们按照年龄排序。首先先遍历一遍,找出最小的 min
和最大的元素 max
,创建一个大小为 max - min + 1
的数组,再遍历一次,统计数字个数,写到数组中。
然后再遍历一次统计数组,将每个元素置为前面一个元素加上自身,为什么这样做呢?
为了让统计数组存储的元素值等于相应整数的最终排序位置,这样我们就可以做到稳定排序,比如下面的 15 对应的是 8,也就是 15 在数组中出现的是第 8 个元素,从后面开始遍历,我们就可以保持稳定性。
比如原数组从后往前遍历到 13 的时候, 13 对应的位置是 6,那么此时从后往前遍历到的第一个 13 就是在第 6 个元素位置。后面再遇到 13,就放到第 5 个元素位置,不会打乱它们的相对位置。
动态过程如下:
八、桶排序
桶排序,是指用多个桶存储元素,每个桶有一个存储范围,先将元素按照范围放到各个桶中,每个桶中是一个子数组,然后再对每个子数组进行排序,最后合并子数组,成为最终有序的数组。这其实和计数排序很相似,只不过计数排序每个桶只有一个元素,而且桶的值为元素的个数。
桶排序的具体步骤:
- 遍历数组,查找数组的最大最小值,设置桶的区间(非必需),初始化一定数量的桶,每个桶对应一定的数值区间。
- 遍历数组,将每一个数,放到对应的桶中。
- 对每一个非空的桶进行分别排序(桶内部的排序可以选择 JDK 自带排序)。
- 将桶中的子数组拼接成为最终的排序数组。
以数组 [98,90,34,56,21,11,43,61]
为例,桶排序的动态过程:
先遍历查找出 max
为 98, min
为 11,数组大小为 8,( 98 - 11 )/8 + 1 = 11
,桶的个数为 11。先把元素按照区间放进去,对每一个桶分别排序,然后再把桶的元素连起来放在数组中,排序就完成了。
九、堆排序
堆排序,就是利用大顶堆或者小顶堆来设计的排序算法,是一种选择排序。堆是一种完全二叉树:
- 大顶堆:每个节点的数值都大于或者等于其左右孩子节点的数值。
- 小顶堆:每个节点的数值都小于或者等于其左右孩子节点的数值。
我们一般使用数组来对堆结构进行存储,下面我们只说大顶堆(元素按照从小到大排序),假设数组为 nums[]
,则第 i
个数满足:num[i] >= nums[2i+1]
且 num[i] >= nums[2i+2]
,第 i
个数在堆上的左节点就是数组中下标索引 2i+1
的元素,其右节点就是数组中下标索引 2i+2
的元素。
排序的思路为:
- 将无序的数组构建出一个大顶堆,也就是上面的元素比下面的元素大。
- 将堆顶的元素和堆的最末尾的元素交换,将最大元素下沉到数组的最后面(末端)。
- 重新调整前面的顺序,继续交换堆顶的元素和当前末尾的元素,直到所有元素全部下沉。
倘若一个数组为 [11,21,34,43,56,61,90,98]
,动态的过程如下:
十、基数排序
基数排序比较特殊,特殊在它只能用在整数(自然数)排序,而且不是基于比较的,其原理是将整数按照位分成不同的数字,按照每个数各位值逐步排序。何为高位,比如 81,1 就是低位, 8 就是高位。 分为高位优先和低位优先,先比较高位就是高位优先,先比较低位就是低位优先。下面我们讲高位优先。
主要的步骤如下:
- 将所有元素统一称为统一数位长度,前面补 0。
- 从最高位开始,依次排序,从最高位到最低位遍历完,数组就是有序的。
以数组 [98,90,34,56,21,11,43,61,39]
为例,动态的排序过程如下:
十个算法的复杂度以及特点总结一下:
- 冒泡排序:基本最慢,时间复杂度最好为
O(n)
,最坏为O(n2)
,平均时间复杂度为O(n2)
,空间复杂度为O(1)
,稳定排序算法。 - 选择排序:时间复杂度很稳定,最好最坏或者平均都是
O(n2)
,空间复杂度为O(1)
,可以做到稳定排序。 - 插入排序:时间复杂度最好为
O(n)
,最坏为O(n2)
,平均时间复杂度为O(n2)
,空间复杂度为O(1)
,稳定排序算法。 - 希尔排序:希尔增量下最坏的情况时间复杂度是
O(n2)
,最好的时间复杂度是O(n)
(也就是数组已经有序),平均时间复杂度是O(n3/2)
,属于不稳定排序。 - 快速排序:时间复杂度最差的情况是
O(n2)
,平均时间复杂度为O(nlogn)
,空间复杂度,虽然快排本身没有申请额外的空间,但是递归需要使用栈空间,递归数的深度是log2n
,空间复杂度也就是O( log2n)
,属于不稳定排序。 - 归并排序:排序复杂度为
nlog2n
,不存在好坏的情况,但是代价就是需要申请额外的空间,申请空间的大小最大为n
,所以空间复杂度为O(n)
,属于稳定排序。 - 计数排序:时间复杂度为
O(n+k)
,申请了一个统计数组和一个新数组,空间复杂度为O(n+k)
,没有所谓最好最坏,都是一个复杂度,一般适用于小范围整数排序,属于稳定排序。 - 桶排序:最好情况时间复杂度
O(n)
,最坏情况时间复杂度为O(n2)
,平均的时间复杂度为O(n+k)
。由于在中间过程中会申请桶的数量m
,所以空间复杂度为O(n+m)
,稳定性决定于桶内部排序。 - 堆排序:时间复杂度为
O(nlogn)
,没有申请额外的空间,空间复杂度为O(1)
,属于不稳定排序。 - 基数排序:时间复杂度为
O(d(2n))
。一般只使用于整数排序,不适合小数或者文字排序。由于需要申请桶的空间,假设有k
个桶(上面是10
个桶),则空间复杂度为O(n+k)
,一般k
较小,所以近似为O(n)
,属于稳定排序。
每一种排序,都有其优缺点,我们应该根据场景选择合适的排序算法。
资料来源
如果你觉得有用的话就给这篇文章一个赞吧!
「干货」编程语言十大经典算法,你知道几个?相关推荐
- 史上最「奇葩」的十大编程语言,最后一个有毒……
关注「实验楼」,每天分享一个项目教程 当你看到这些编程语言时,你的反应应该是「这人一定很闲」.「同是九年义务教育,他为什么这么优秀」.「这人有毒吧」-- 正文共:2220 字 预计阅读时间:7 分钟 ...
- 上手机器学习,从搞懂这十大经典算法开始
上手机器学习,从搞懂这十大经典算法开始 翻译 | AI科技大本营(rgznai100) 参与 | 林椿眄 编辑 | 波波,Donna 在机器学习领域,"没有免费的午餐"是一个不变的 ...
- 数据挖掘领域十大经典算法初探
博主说明: 1.原文献非最新文章,只是本人向来对算法比较敏感.感兴趣,便把原文细看了下, 翻译过程中,有参考一些网友翻译的文章,但个人认为,阐述皆不够精准,且都是泛泛而谈, 故此,做了此份翻译,希望, ...
- 数据挖掘十大经典算法之——EM 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——Apriori 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——PageRank 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——Naive Bayes 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——KNN 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
- 数据挖掘十大经典算法之——AdaBoost 算法
数据挖掘十大经典算法系列,点击链接直接跳转: 数据挖掘简介及十大经典算法(大纲索引) 1. 数据挖掘十大经典算法之--C4.5 算法 2. 数据挖掘十大经典算法之--K-Means 算法 3. 数据挖 ...
最新文章
- Java IO基础原理你该知道这些
- 【翻译】SQL Server索引进阶:第八级,唯一索引
- 「LibreOJ β Round #4」子集
- 1.0jpa 2.0_JPA 2.1:不同步的持久性上下文
- html5按钮样式具有子项目,如何使用HTML5+css3制作出12种常用的按钮开关样式(附完整代码)...
- java监听机制_详解java的事件监听机制和观察者设计模式
- python2还能用吗_官方推荐python3,为何还有人在用python2呢?
- 两个对象的 hashCode()相同,则 equals()也一定为 true,对吗?
- java编译异常有哪些_java 中 哪些异常必须声明并捕获,否则产生编译错误
- keepalived+lvs基于http检测
- Exponent CMS 2.3.9 配置文件写入 Getshell分析
- Ubuntu Git安装与使用
- Yarn resourceManager 无法启动
- 10 things they never teach in college about programming
- 优化后亲测可用!免费下载QQ音乐大部分资源
- Spring Boot框架从入门到精通
- SAP CDS View基础语法
- 机器学习中的数据不平衡解决方案大全
- VmFusion 无法访问外网的原因以及解决方案
- Java用户账号密码创建登录