转载请注明出处:http://blog.csdn.net/ns_code/article/details/20227303

前言

堆排序、快速排序、归并排序(下篇会写这两种排序算法)的平均时间复杂度都为O(n*logn)。要弄清楚堆排序,就要先了解下二叉堆这种数据结构。本文不打算完全讲述二叉堆的所有操作,而是着重讲述堆排序中要用到的操作。比如我们建堆的时候可以采用堆的插入操作(将元素插入到适当的位置,使新的序列仍符合堆的定义)将元素一个一个地插入到堆中,但其实我们完全没必要这么做,我们有执行操作更少的方法,后面你会看到,我们基本上只用到了堆的删除操作,更具体地说,应该是删除堆的根节点后,将剩余元素继续调整为堆的操作。先来看二叉堆的定义。

二叉堆

二叉堆其实是一棵有着特殊性质的完全二叉树,这里的特殊性质是指:

1、二叉堆的父节点的值总是大于等于(或小于等于)其左右孩子的值;

2、每个节点的左右子树都是一棵这样的二叉堆。

如果一个二叉堆的父节点的值总是大于其左右孩子的值,那么该二叉堆为最大堆,反之为最小堆。我们在排序时,如果要排序后的顺序为从小到大,则需选择最大堆,反之,选择最小堆,这点通过后面对堆排序分析,你会有所体会。

堆排序

由二叉堆的定义可知,堆顶元素(即二叉堆的根节点)一定为堆中的最大值或最小值,因此如果我们输出堆顶元素后,将剩余的元素再调整为二叉堆,继而再次输出堆顶元素,再将剩余的元素调整为二叉堆,反复执行该过程,这样便可输出一个有序序列,这个过程我们就叫做堆排序。

由于我们的输入是一个无序序列,因此要实现堆排序,我们要先后解决如下两个问题:

1、如何将一个无序序列建成一个二叉堆;

2、在去掉堆顶元素后,如何将剩余的元素调整为一个二叉堆。

针对第一个问题,可能很明显会想到用堆的插入操作,一个一个地插入元素,每次插入后调整元素的位置,使新的序列依然为二叉堆。这种操作一般是自底向上的调整操作,即先将待插入元素放在二叉堆后面,而后逐渐向上将其与父节点比较,进而调整位置。但正如前言中所说,我们完全用不着一个节点一个节点地插入,那我们要怎么做呢?我们需要先来解决第二个问题,解决了第二个问题,第一个问题问题也就迎刃而解了。

调整二叉堆

要分析第二个问题,我们先给出以下前提:

1、我们排序的目标是从小到大,因此我们用最大堆;

2、我们将二叉堆中的元素以层序遍历后的顺序保存在一维数组中,根节点在数组中的位置序号为0。

这样,如果某个节点在数组中的位置序号为i,那么它的左右孩子的位置序号分别为2i+1和2i+2。

为了使调整过程更易于理解,我们采用如下二叉堆来分析(注意下面的分析,我们并没有采用额外的数组来存储每次去掉的堆顶数据):

这里数组A中元素的个数为8,很明显最大值为A0,为了实现排序后的元素按照从小到大的顺序排列,我们可以将二叉堆中的最后一个元素A7与A0互换,这样A7中保存的就是数组中的最大值,而此时该二叉树变为了如下情况:

为了将其调整为二叉堆,我们需要寻找4应该插入的位置。为此,我们让4与它的孩子节点中最大的那个,也就是其左孩子7,进行比较,由于4<7,我们便把二者互换,这样二叉树便变成了如下的形式:

接下来,继续让4与其左右孩子中的最大者,也就是6,进行比较,同样由于4<6,需要将二者互换,这样二叉树变成了如下的形式:

这样便又构成了二叉堆,这时候A0为7,是所有元素中的最大元素。同样我们此时继续将二叉堆中的最后一个元素A6和A0互换,这样A6中保存的就是第二大的数值7,而A0就变为了3,形式如下:

为了将其调整为二叉堆,一样将3与其孩子结点中的最大值比较,由于3<6,需要将二者互换,而后继续和其孩子节点比较,需要将3和4互换,最终再次调整好的二叉堆形式如下:

一样将A0与此时堆中的最后一个元素A5互换,这样A5中保存的便是第三大的数值,再次调整剩余的节点,如此反复,直到最后堆中仅剩一个元素,这时整个数组便已经按照从小到大的顺序排列好了。

据此,我们不难得出将剩余元素继续调整为二叉堆的操作实现代码如下(同前面两篇博文中一样,我们不需每次比较后都交换元素位置,代码中可以再次体会到这点):

[cpp] view plain copy
  1. /*
  2. arr[start+1...end]满足最大堆的定义,
  3. 将arr[start]加入到最大堆arr[start+1...end]中,
  4. 调整arr[start]的位置,使arr[start...end]也成为最大堆
  5. 注:由于数组从0开始计算序号,也就是二叉堆的根节点序号为0,
  6. 因此序号为i的左右子节点的序号分别为2i+1和2i+2
  7. */
  8. void HeapAdjustDown(int *arr,int start,int end)
  9. {
  10. int temp = arr[start];  //保存当前节点
  11. int i = 2*start+1;      //该节点的左孩子在数组中的位置序号
  12. while(i<=end)
  13. {
  14. //找出左右孩子中最大的那个
  15. if(i+1<=end && arr[i+1]>arr[i])
  16. i++;
  17. //如果符合堆的定义,则不用调整位置
  18. if(arr[i]<=temp)
  19. break;
  20. //最大的子节点向上移动,替换掉其父节点
  21. arr[start] = arr[i];
  22. start = i;
  23. i = 2*start+1;
  24. }
  25. arr[start] = temp;
  26. }

这样,将已经建好的二叉堆进行排序的代码如下:

[cpp] view plain copy
  1. //进行堆排序
  2. for(i=len-1;i>0;i--)
  3. {
  4. //堆顶元素和最后一个元素交换位置,
  5. //这样最后的一个位置保存的是最大的数,
  6. //每次循环依次将次大的数值在放进其前面一个位置,
  7. //这样得到的顺序就是从小到大
  8. int temp = arr[i];
  9. arr[i] = arr[0];
  10. arr[0] = temp;
  11. //将arr[0...i-1]重新调整为最大堆
  12. HeapAdjustDown(arr,0,i-1);
  13. }

建立二叉堆

搞懂了第二个问题,那么我们回过头来看如何将无序的数组建成一个二叉堆。

我们同样以上面的数组为例,假设其数组内元素的原始顺序为:A[]={6,1,3,9,5,4,2,7},那么在没有建成二叉堆前,个元素在该完全二叉树中的存放位置如下:

这里的后面四个元素均为叶子节点,很明显,这四个叶子可以认为是一个堆(因为堆的定义中并没有对左右孩子间的关系有任何要求,所以可以将这几个叶子节点看做是一个堆),而后我们便考虑将第一个非叶子节点9插入到这个堆中,再次构成一个堆,接着再将3插入到新的堆中,再次构成新堆,如此继续,直到该二叉树的根节点6也插入到了该堆中,此时构成的堆便是由该数组建成的二叉堆。因此,我们这里同样可以利用到上面所写的HeapAdjustDown(int *,int,int)函数,因此建堆的代码可写成如下的形式:

[cpp] view plain copy
  1. //把数组建成为最大堆
  2. //第一个非叶子节点的位置序号为(len-1)/2
  3. for(i=(len-1)/2;i>=0;i--)
  4. HeapAdjustDown(arr,i,len-1);

如果还不是很明白,注意读下HeapAdjustDown(int *,int,int)函数代码中关于该函数作用的注释。

完整源码

最后贴出完整源码:

[cpp] view plain copy
  1. /*******************************
  2. 堆排序
  3. Author:兰亭风雨 Date:2014-02-27
  4. Email:zyb_maodun@163.com
  5. ********************************/
  6. #include<stdio.h>
  7. #include<stdlib.h>
  8. /*
  9. arr[start+1...end]满足最大堆的定义,
  10. 将arr[start]加入到最大堆arr[start+1...end]中,
  11. 调整arr[start]的位置,使arr[start...end]也成为最大堆
  12. 注:由于数组从0开始计算序号,也就是二叉堆的根节点序号为0,
  13. 因此序号为i的左右子节点的序号分别为2i+1和2i+2
  14. */
  15. void HeapAdjustDown(int *arr,int start,int end)
  16. {
  17. int temp = arr[start];  //保存当前节点
  18. int i = 2*start+1;      //该节点的左孩子在数组中的位置序号
  19. while(i<=end)
  20. {
  21. //找出左右孩子中最大的那个
  22. if(i+1<=end && arr[i+1]>arr[i])
  23. i++;
  24. //如果符合堆的定义,则不用调整位置
  25. if(arr[i]<=temp)
  26. break;
  27. //最大的子节点向上移动,替换掉其父节点
  28. arr[start] = arr[i];
  29. start = i;
  30. i = 2*start+1;
  31. }
  32. arr[start] = temp;
  33. }
  34. /*
  35. 堆排序后的顺序为从小到大
  36. 因此需要建立最大堆
  37. */
  38. void Heap_Sort(int *arr,int len)
  39. {
  40. int i;
  41. //把数组建成为最大堆
  42. //第一个非叶子节点的位置序号为len/2-1
  43. for(i=len/2-1;i>=0;i--)
  44. HeapAdjustDown(arr,i,len-1);
  45. //进行堆排序
  46. for(i=len-1;i>0;i--)
  47. {
  48. //堆顶元素和最后一个元素交换位置,
  49. //这样最后的一个位置保存的是最大的数,
  50. //每次循环依次将次大的数值在放进其前面一个位置,
  51. //这样得到的顺序就是从小到大
  52. int temp = arr[i];
  53. arr[i] = arr[0];
  54. arr[0] = temp;
  55. //将arr[0...i-1]重新调整为最大堆
  56. HeapAdjustDown(arr,0,i-1);
  57. }
  58. }
  59. int main()
  60. {
  61. int num;
  62. printf("请输入排序的元素的个数:");
  63. scanf("%d",&num);
  64. int i;
  65. int *arr = (int *)malloc(num*sizeof(int));
  66. printf("请依次输入这%d个元素(必须为整数):",num);
  67. for(i=0;i<num;i++)
  68. scanf("%d",arr+i);
  69. printf("堆排序后的顺序:");
  70. Heap_Sort(arr,num);
  71. for(i=0;i<num;i++)
  72. printf("%d ",arr[i]);
  73. printf("\n");
  74. free(arr);
  75. arr = 0;
  76. return 0;
  77. }

测试结果如下:

总结

最后我们简要分析下堆排序的时间复杂度。我们在每次重新调整堆时,都要将父节点与孩子节点比较,这样,每次重新调整堆的时间复杂度变为O(logn),而堆排序时有n-1次重新调整堆的操作,建堆时有((len-1)/2+1)次重新调整堆的操作,因此堆排序的平均时间复杂度为O(n*logn)。由于我们这里没有借用辅助存储空间,因此空间复杂度为O(1)。

堆排序在排序元素较少时有点大才小用,待排序列元素较多时,堆排序还是很有效的。另外,堆排序在最坏情况下,时间复杂度也为O(n*logn)。相对于快速排序(平均时间复杂度为O(n*logn),最坏情况下为O(n*n)),这是堆排序的最大优点。

【数据结构与算法】内部排序之三:堆排序(含完整源码)相关推荐

  1. 【故障检测问题】基于matlab免疫算法求解故障检测问题【含Matlab源码 196期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[故障检测问题]基于matlab免疫算法求解故障检测问题[含Matlab源码 196期] 获取代码方式2: 通过订阅紫极神光博客付费专栏,凭 ...

  2. 【优化算法】灰狼优化算法(GWO)【含Matlab源码 1305期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[优化算法]灰狼优化算法(GWO)[含Matlab源码 1305期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: 付费专栏优化 ...

  3. 【优化算法】改进的灰狼优化算法(IGWO)【含Matlab源码 1349期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[优化算法]改进的灰狼优化算法(IGWO)[含Matlab源码 1349期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: 付费 ...

  4. 【优化算法】多目标灰狼优化算法(MOGWO)【含Matlab源码 099期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[优化算法]多目标灰狼优化算法(MOGWO)[含Matlab源码 099期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: 付费 ...

  5. 【优化算法】改进的侏儒猫鼬优化算法(IDMO)【含Matlab源码 2314期】

    ⛄一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[优化算法]改进的侏儒猫鼬优化算法(IDMO)[含Matlab源码 2314期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: ...

  6. 【优化算法】象群游牧优化算法(EHO)【含Matlab源码 1080期】

    ⛄一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[优化算法]象群游牧优化算法(EHO)[含Matlab源码 1080期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: 付费专 ...

  7. 【图像增强】基于matlab萤火虫算法图像对比度增强【含Matlab源码 2142期】

    ⛄一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[图像增强]基于matlab萤火虫算法图像对比度增强[含Matlab源码 2142期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方 ...

  8. 【RRT三维路径规划】基于matlab RRT_Star算法三维路径规划【含Matlab源码 1571期】

    一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[三维路径规划]基于matlab RRT_Star算法三维路径规划[含Matlab源码 1571期] 点击上面蓝色字体,直接付费下载,即可. ...

  9. 【Matlab图像加密】正交拉丁方置乱算法图像加解密【含GUI源码 182期】

    一.代码运行视频(哔哩哔哩) [Matlab图像加密]正交拉丁方置乱算法图像加解密[含GUI源码 182期] 二.matlab版本及参考文献 一.代码运行视频(哔哩哔哩) [Matlab图像处理]自动 ...

  10. 【优化算法】猫群优化算法(CSO)【含Matlab源码 1071期】

    ⛄一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[优化算法]猫群优化算法(CSO)[含Matlab源码 1071期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: 付费专栏M ...

最新文章

  1. c语言输入姓名比较是否同性,C语言基础--选择题
  2. Spring Tools 4 for Visual Studio Code
  3. python输出键值列表_Python 键值分组或分区数据
  4. hdu 1102 pku 2421 解题报告
  5. Mr.J--C99标准之数组问题
  6. php里面get和post请求,php中GET和POST请求发送几种方法总结
  7. cxp文件查看 欧姆龙_欧姆龙PLC CXP编程软件外文手册
  8. python 腾讯视频签到_腾讯视频V力值自动签到
  9. 平面直角坐标系中的旋转公式_【初中数学大招流】从平面几何到解析几何
  10. 远控木马分析(实习生)
  11. 5.3 FIR低通滤波器的设计
  12. 如何批量修改文件夹名称中的某个字?
  13. wireshark:时区
  14. python time strptime_Python time.strptime方法代碼示例
  15. substrate介绍
  16. 查看系统架构是32位还是64位--用Enki学Linux系列(15)
  17. Git上传代码时报错 Warning: Permanently added ‘gitee.com,212.64.62.174‘ (ECDSA) to the list of known host...
  18. 【博文汇总】Java程序设计语言
  19. TFS文件编码检查机制和修改(Team Foundation Server 2013)
  20. 【技术贴】禁止打印进程spoolsv - spoolsv.exe随机启动

热门文章

  1. Linux 服务器注意事项
  2. Gson解析Json格式数据
  3. 一位老鸟对 23 种设计模式的有趣见解(转)
  4. 基于RBAC模型的通用企业权限管理系统
  5. sql server charindex函数和patindex函数详解(转)
  6. php 复制行,phpstorm怎么快速复制当前行?
  7. Java排序算快速排序_Java排序算法 [快速排序]
  8. python pool_派松水潭(Python Pool)
  9. python概率密度函数参数估计_EM算法求高斯混合模型参数估计——Python实现
  10. VS2010报错 error:LINK1123:转换到COF期间失败,文件无限或损坏