冒泡排序、插入排序、选择排序这三种算法的时间复杂度都为 $O(n^2)$,只适合小规模的数据。今天,我们来认识两种时间复杂度为 $O(nlogn)$ 的排序算法——归并排序(Merge Sort)和快速排序(Quick Sort),他们都用到了分治思想,非常巧妙。

1. 归并排序(Merge Sort)?

1.1. 归并排序算法实现

  • 归并排序的核心思想其实很简单,如果要排序一个数组,我们先把数组从中间分成前后两部分,然后分别对前后两部分进行排序,再将排好序的两部分数据合并在一起就可以了。

  • 归并排序使用的是分治思想,分治也即是分而治之,将一个大问题分解为小的子问题来解决。分治算法一般都是用递归来实现的。分治是一种解决问题的处理思想,递归是一种编程技巧
  • 如果要对数组区间 [p, r] 的数据进行排序,我们先将数据拆分为两部分 [p, q] 和 [q+1, r],其中 q 为中间位置。对两部分数据排好序后,我们再将两个子数组合并在一起。当数组的起始位置小于等于终止位置时,说明此时只有一个元素,递归也就结束了。
递推公式:
merge_sort(p…r) = merge(merge_sort(p…q), merge_sort(q+1…r))终止条件:
p >= r 不用再继续分解
  • 对两个子数组进行合并的过程如下所示,我们先建立一个临时数组,然后从两个子数组的起始位置开始比较,将较小的元素一个一个放入临时数组,直到其中一个子数组比较完毕,再将剩下的另一个子数组余下的值全部放到临时数组后面。最后我们需要将临时数组中的数据拷贝到原数组对应的位置。

  • 代码实现
// O(n(logn))
void Merge_Sort(float data[], int left, int right, float sorted_data[])
{if(left < right){int mid = (left + right) / 2;Merge_Sort(data, left, mid, sorted_data);Merge_Sort(data, mid+1, right, sorted_data);Merge_Array(data, left, mid, right, sorted_data);}
}void Merge_Array(float data[], int left, int mid, int right, float temp[])
{int i = left, j = mid + 1;int k = 0;// 从子数组的头开始比较while(i <= mid && j <= right){if (data[i] <= data[j]){temp[k++] = data[i++];}else{temp[k++] = data[j++];}}// 判断哪个子数组还有元素,并拷贝到 temp 后面while(i <= mid){temp[k++] = data[i++];}while(j <= right){temp[k++] = data[j++];}// 将 temp 中的数据拷贝到原数组对应位置for(i = 0; i < k; i++){data[left+i] = temp[i];}
}

1.2. 归并排序算法分析

  • 归并排序是一个稳定的排序算法,在进行子数组合并的时候,我们可以设置当元素大小相等时,先将前半部分的数据放入临时数组,这样就可以保证相等元素在排序后依然保持原来的顺序。
  • 不仅递归求解的问题可以写成递推公式,递归代码的时间复杂度也可以写成递归公式
  • 如果我们对 $n$ 个元素进行归并排序所需要的时间是 $T(n)$,那分解成两个子数组排序的时间都是 $T(\frac{n}{2})$,而合并两个子数组的时间复杂度为 $O(n)$。所以,归并排序的时间复杂度计算公式为:

$$ T(1) = C $$
$$T(n) = 2*T(\frac{n}{2}) + n, n>1$$

  • n = 1 时,只需要常量级的执行时间,所以表示为 C。

$$T(n) = 2*T(\frac{n}{2}) + n$$
$$ = 2*[2*T(\frac{n}{4}) + \frac{n}{2}] + n = 4*T(\frac{n}{4}) + 2*n $$
$$= 4*[2*T(\frac{n}{8}) + \frac{n}{4}] + 2*n = 8*T(\frac{n}{8}) + 3*n $$
$$......$$
$$= 2^k * T(\frac{n}{2^k}) + k * n$$
$$......$$
当 $\frac{n}{2^k} = 1$时, $k = log_2n$,代入上式得:
$$ T(n) = n * C + nlog_2n$$
用大 O 标记法来表示,归并排序的时间复杂度为 $O(nlogn)$。

  • 从我们的分析可以看出,归并排序的执行效率与原始数据的有序程度无关,其时间复杂度是非常稳定的,不管是最好情况、最坏情况,还是平均情况,时间复杂度都是 $O(nlogn)$
  • 归并排序有一个缺点,那就是它不是原地排序算法。在进行子数组合并的时候,我们需要临时申请一个数组来暂时存放排好序的数据。因为这个临时空间是可以重复利用的,因此归并排序的空间复杂度为 $O(n)$,最多需要存放 $n$ 个数据。

2. 快速排序(Quick Sort)?

1.1. 快速排序算法实现

  • 快速排序的思想是这样的,如果要对数组区间 [p, r] 的数据进行排序,我们先选择其中任意一个数据作为 pivot(分支点),一般为区间最后一个元素。然后遍历数组,将小于 pivot 的数据放到左边,将大于 pivot 的数据放到右边。接着,我们再递归对左右两边的数据进行排序,直到区间缩小为 1 ,说明所有的数据都排好了序。

递推公式:
quick_sort(p…r) = quick_sort(p…q-1) + quick_sort(q+1, r)终止条件:
p >= r
  • 归并排序是由下向上的,先处理子数组然后再合并。而快速排序正好相反,它的过程是由上向下的,先分出两个子区间,再对子区间进行排序。归并排序是稳定的时间复杂度为 $O(n)$,但它是非原地算法,而快排则是原地排序算法。

  • 快速排序的分区过程如下所示,从左到右依次遍历数组,如遇到小于 pivot 的元素,则进行数据交换 ,否则继续往前进行,最后再放置 pivot。

  • 代码实现
// O(n(logn))
void Quick_Sort(float data[], int left, int right)
{if (left < right){int i = left, j = left;int pivot = data[right];for (j = left; j < right; j++){if (data[j] < pivot){int temp = data[i];data[i] = data[j];data[j] = temp;i++;}}data[j] = data[i];data[i] = pivot;Quick_Sort(data, left, i-1);Quick_Sort(data, i+1, right);}
}
  • 快速排序的另一种实现方式如下所示,先取出一个元素作为 pivot(假设是最后一个),这时 pivot 位置可以看作为空,然后从左到右查找第一个比 pivot 大的元素放在 pivot 的位置,此时空的地方变成了这第一个比 pivot 大的元素位置。然后从右到左查找第一个比 pivot 小的元素放在刚才空的位置,依次循环直到从左到右和从右到左都查找到了同一位置,这时候再把 pivot 放置在最后一个空位。这个过程可以形象的被称为“挖坑填坑”。

  • 代码实现
// O(n(logn))
void Quick_Sort(float data[], int left, int right)
{if (left < right){int i = left, j = right;int pivot = data[i];while(i < j){while(i < j && data[i] <= pivot) // 从左往右找到第一个比 pivot 大的数{i++;}if(i < j){data[j--] = data[i];}while(i < j && data[j] >= pivot) // 从右往左找到第一个比 pivot 小的数{j--;}if(i < j){data[i++] = data[j];}}data[i] = pivot; // i=jQuick_Sort(data, left, i-1);Quick_Sort(data, i+1, right);}
}

2.2. 快速排序算法分析

  • 如果快速排序每次都将数据分成相等的两部分,则快排的时间复杂度和归并排序相同,也是 $O(nlogn)$,但这种情况是很难实现的。如果数据原来已经是有序的,则每次的分区都是不均等的,我们需要进行 n 次分区才能完成整个排序,此时快排的时间复杂度就退化成了 $O(n^2)$。
  • 平均时间复杂度的求解也可以通过递归树来分析,这个问题留待我们以后再解决。我们现在只需要知道,在大部分情况下,快速排序的时间复杂度都可以做到 $O(nlogn)$,只有在极端情况下,才会退化成 $O(n^2)$
  • 快速排序是一个原地排序算法,是一个不稳定的排序算法,因为其在数据交换过程中可能会改变相等元素的原始位置。

3. 小结

  • 归并排序和快速排序都是利用分治的思想,代码都通过递归来实现,过程非常相似。
  • 归并排序非常稳定,时间复杂度始终都是 $O(nlogn)$,但不是原地排序;快速排序虽然最坏情况下时间复杂度为 $O(n^2)$,但平均情况下时间复杂度为 $O(nlogn)$,最坏情况发生的概率也比较小,而且是原地排序算法,因此应用得更加广泛。

参考资料-极客时间专栏《数据结构与算法之美》

获取更多精彩,请关注「seniusen」!

排序算法中——归并排序和快速排序相关推荐

  1. 排序算法:归并排序、快速排序

    相关博客: 排序算法:冒泡排序.插入排序.选择排序.希尔排序 排序算法:归并排序.快速排序 排序算法:桶排序.计数排序.基数排序 排序算法:堆排序 十大排序算法小结 一.归并排序: 1.工作原理: 归 ...

  2. NOI提高级:排序算法之归并排序、快速排序

    图解排序算法(四)之归并排序 图解排序算法(四)之归并排序 - dreamcatcher-cx - 博客园 小学生图解排序算法:⑥归并排序 小学生图解排序算法:⑥归并排序_纯文笔记-CSDN博客_图解 ...

  3. 排序算法之——归并排序和快速排序

    冒泡排序.插入排序.选择排序这三种算法的时间复杂度都为 O ( n 2 ) O(n^2) O(n2),只适合小规模的数据.今天,我们来认识两种时间复杂度为 O ( n l o g n ) O(nlog ...

  4. 分治法在排序算法中的应用(JAVA)--快速排序(Lomuto划分、Hoare划分、随机化快排)

    分治法在排序算法中的应用--快速排序 时间复杂度:平均O(nlogn),最坏O(n^2) 如果说归并排序是按照元素在数组中的位置划分的话,那么快速排序就是按照元素的值进行划分.划分方法由两种,本节将主 ...

  5. 结合内存分析java归并排序_排序算法之归并排序(Mergesort)解析

    一.归并排序的优缺点(pros and cons) 耗费心思来理解它,总要有个理由吧:归并排序的效率达到了巅峰:时间复杂度为O(nlogn),这是基于比较的排序算法所能达到的最高境界 归并排序是一种稳 ...

  6. [Alg]排序算法之归并排序

    [Alg]排序算法之归并排序 作者:屎壳郎 miaosg01@163.com 日期:Aug 2021 版次:初版 简介: 归并排序是一类在任何情况下都能保证Nlg⁡(N)N\lg(N)Nlg(N)的排 ...

  7. 【排序算法】归并排序(C语言)

    [排序算法]-- 归并排序(C语言) 目录 一.归并排序的原理 二.两个有序数组排序和合并 1. 原地排序 2. 创建临时空间 二.递归实现 三.非递归实现 1. 实现思路 2. 数组边界问题 3. ...

  8. 排序算法之 归并排序 及其时间复杂度和空间复杂度

    在排序算法中快速排序的效率是非常高的,但是还有种排序算法的效率可以与之媲美,那就是归并排序:归并排序和快速排序有那么点异曲同工之妙,快速排序:是先把数组粗略的排序成两个子数组,然后递归再粗略分两个子数 ...

  9. c语言归并排序代码详细注释,C语言实现排序算法之归并排序详解

    排序算法中的归并排序(Merge Sort)是利用"归并"技术来进行排序.归并是指将若干个已排序的子文件合并成一个有序的文件. 一.实现原理: 1.算法基本思路 设两个有序的子文件 ...

最新文章

  1. rsync+inotify一键安装脚本
  2. Android UI开发第一篇——android的九宫格式实现
  3. Mysql 客户端查询结果如何保存到本地而不是服务端?
  4. 扫描PDF417崩溃的原因找到:手机摄像头分辨率低
  5. Python MySQL 数据库
  6. win10休眠_这样设置以后,WIN10比WIN7运行更流畅
  7. 定制你的Unity编辑器
  8. 09-JS的事件流的概念(重点)
  9. 2020-08-09 谈“第二份好资料”
  10. 工信部BIM工程师系列发布测评考试大纲
  11. 网页颜色搭配表及颜色搭配技巧
  12. 多重背包二进制优化(wzk吃小鸡腿)
  13. FPGA-DDR总线电源硬件设计技巧-Fly-by走线阻抗
  14. 微信小程序学习用demo:大写计算器;数字转换为大写
  15. 大小端高位低位字节的理解
  16. 风雨砥砺,岁月如歌——Angular项目组件发布概要
  17. tx2+opencv源码编译教程(tx2+opencv4.4.0+opencv_contrib-4.4.0)
  18. 微信小程序--嘟嘟会议--会议发布和我的会议查看
  19. iOS-地理坐标转换,原生地图获取的原始坐标转换为地图真实坐标
  20. 服务器和客户端连接不稳定,服务器和客户端的连接方法

热门文章

  1. 一份忧伤的大厂生存百科
  2. 敏捷开发下的B端交互设计流程
  3. 这才是GraphQL最详尽的解释
  4. springboot jpa 复合主键 联合主键
  5. Hive神兽大厅源码搭建安装及使用
  6. 数学分析高等代数考研试题荟萃[更新至2017年10月1日]
  7. thinkphp 3.2加载类
  8. 1.6-puppet测试证书
  9. nginx负载均衡和lvs负载均衡的比较分析
  10. 禁止PHP警告性错误