9.7.2 堆排序算法

堆排序(Heap Sort)就是利用堆(假设利用大顶堆)进行排序的方法。它的基本思想是,将待排序的序列构造成一个大顶堆。此时,整个序列的最大值就是堆顶的根结点。将它移走(其实就是将其与堆数组的末尾元素交换,此时末尾元素就是最大值),然后将剩余的n-1个序列重新构造成一个堆,这样就会得到n个元素中的次小值。如此反复执行,便能得到一个有序序列了。

例如图9-7-4,左图是一个大顶堆,90为最大值,将90与20(末尾元素)互换,如中图所示,此时90就成了整个堆序列的最后一个元素,将20经过调整,使得除90以外的结点继续满足大顶堆定义(所有结点都大于等于其子孩子),见右图。然后再考虑将30与80互换……
        相信大家有些明白堆排序的基本思想了,不过要实现它还需要解决两个问题:(1)如何由一个无序序列构建成一个堆?(2)如果在输出堆顶元素后,调整剩余元素成为一个新的堆?要解释清楚它们,让我们来看代码。

/* 对顺序表L进行堆排序 */
void HeapSort(SqList *L)
{int i;for(i=L->length/2;i>0;i--)  /* 把L中的r构建成一个大顶堆 */HeapAdjust(L,i,L->length);for(i=L->length;i>1;i--){ swap(L,1,i);    /*将堆顶记录和当前未经排序子序列的最后一个记录交换*/HeapAdjust(L,1,i-1);   /* 将L->r[1..i-1]重新调整为大顶堆 */}
}

从代码中也可以看出,整个排序过程分为两个for循环。第一个循环要完成的就是将现在的待排序序列构建成一个大顶堆。第二个循环要完成的就是逐步将每个最大值的根结点与末尾元素交换,并且再调整其成为大顶堆。
        假设我们要排序的序列是{50,10,90,30,70,40,80,60,20} ,那么L.length=9,第一个for循环,代码第4行,i是从⌊9/2⌋=4开始,4→3→2→1的变量变化。为什么不是从1到9,或者从9到1,而是从4到1呢?其实我们看了图9-7-5就明白了,它们都有什么规律?它们都是有孩子的结点。注意灰色结点的下标编号就是1、2、3、4。

我们所谓的将待排序的序列构建成为一个大顶堆,其实就是从下往上,从右到左,将每个非终端结点(非叶结点)当作根结点,将其和其子树调整成大顶堆。i的4→3→2→1的变量变化,其实也就是30,90,10、50的结点调整过程。
        既然已经弄清楚i的变化是在调整哪些元素了,现在我们来看关键的HeapAdjust(堆调整)函数是如何实现的。

/* 已知L->r[s..m]中记录的关键字除L->r[s]之外均满足堆的定义, *//* 本函数调整L->r[s]的关键字,使L->r[s..m]成为一个大顶堆 */
void HeapAdjust(SqList *L,int s,int m)
{ int temp,j;temp=L->r[s];for(j=2*s;j<=m;j*=2)  /* 沿关键字较大的孩子结点向下筛选 */{if(j<m && L->r[j]<L->r[j+1])++j;   /* j为关键字中较大的记录的下标 */if(temp>=L->r[j])break;   /* rc应插入在位置s上 */L->r[s]=L->r[j];s=j;}L->r[s]=temp;   /* 插入 */
}

1) 函数被第一次调用时,s=4,m=9,传入的SqList参数的值为length=9,r[10]={0,50,10,90, 30,70,40,80,60,20}
2) 第4行,将L.r[s]=L.r[4]=30赋值给temp。如图9-7-6

3) 第5~13行,循环遍历其结点的孩子。这里j变量为什么是从2*s开始呢?又为什么是j*=2递增呢?原因还是二叉树的性质5,因为我们这棵是完全二叉树,当前结点序号是s,其左孩子的序号一定是2s,右孩子的序号一定是2s+1,它们的孩子当然也是以2的位数序号增加,因此j变量才是这样循环。
4) 第7~8行,此时j=2*4=8, j<m说明它不是最后一个结点,如果L.r[j]<L.r[j+1],则说明左孩子小于右孩子。我们的目的是要找到较大值,当然需要让j+1以便变成指向右孩子的下标。当前30的左右孩子是60和20,并不满足此条件,因此j还是8。
5) 第9~10行,temp=30,L.r[j]=60,并不满足条件。
6) 第11~12行,将60赋值给L.r[4],并令s=j=8。也就是说,当前算出,以30为根结点的子二叉树,当前最大值是60,在第8的位置。注意此时L.r[4]和L.r[8]的值均为60。
7) 再循环因为j=2*j=16,m=9,j>m,因此跳出循环
8) 第14行,将temp=30赋值给L.r[s]=L.r[8],完成30与60的交换工作。如图9-7-7。本次函数调用完成。

9) 再次调用HeapAdjust,此时s=3,m=9。第4行,temp=L.r[3]=90,第7~8行,由于40<80得到j+1=2*s+1=7。9~10行,由于90>80,因此退出循环,最终本次调用,整个序列未发什么改变。
10) 再次调用HeapAdjust,此时s=2,m=9。第4行,temp=L.r[2]=10,第7~8行,60<70,使得j=5。最终本次调用使得10与70进行了互换。

11) 再次调用HeapAdjust,此时s=1,m=9。第4行,temp=L.r[1]=50,第7~8行,70<90,使得j=3。第11~12行,L.r[1]被赋值了90,并且s=3,再循环,由于2j=6并未大于m,因此再次执行循环体,使得L.r[3]被赋值了80,完成循环后,L.[7]被赋值为50,最终本次调用使得50、90、80进行了轮换。

到此为止,我们构建大顶堆的过程算是完成了,也就是HeapSort函数的第4~5行循环执行完毕。或许是有点复杂,如果不明白,多试着模拟计算机执行的方式走几遍,应该就可以理解其原理。
        接下来HeapSort函数的第6~11行就是正式的排序过程,由于有了前面的充分准备,其实这个排序就比较轻松了。下面是这部分代码。

6 for(i=L->length;i>1;i--)
7 {
8   swap(L,1,i);   /* 将堆顶记录和当前未经排序子序列的最后一个记录交换 */
9   HeapAdjust(L,1,i-1); /* 将L->r[1..i-1]重新调整为大顶堆 */
10 }

1) 当i=9时,第8行,交换20与90,第9行,将当前的根结点20进行大顶堆的调整,调整过程和刚才流程一样,找到它左右子结点的较大值,互换,再找到其子结点的较大值互换。此时序列变为{80,70,50,60,10,40,20,30,90},如图9-7-10

2) 当i=8时,交换30与80,并将30与70交换,再与60交换,此时序列变为{70,60,50,30,10,40,20,80,90},如图9-7-10

3) 后面的变化完全类似,不解释,只看图。

最终就得到一个完全有序的序列了。

9.7.3 堆排序复杂度分析
        堆排序的效率到底有多好呢?我们来分析一下。
        它的运行时间主要是消耗在初始构建堆和在重建堆时的反复筛选上。
        在构建堆的过程中,因为我们是完全二叉树从最下层最右边的非终端结点开始构建,将它与其孩子进行比较和若有必要的互换,对于每个非终端结点来说,其实最多进行两次比较和互换操作,因此整个构建堆的时间复杂度为O(n)。
        在正式排序时,第i次取堆顶记录重建堆需要用O(logi)的时间(完全二叉树的某个结点到根结点的距离为⌊log2i⌋+1),并且需要取n-1次堆顶记录,因此,重建堆的时间复杂度为O(nlogn)。
        所以总体来说,堆排序的时间复杂度为O(nlogn)。由于堆排序对原始记录的排序状态并不敏感,因此它无论是最好、最坏和平均时间复杂度均为O(nlogn)。这在性能上显然要远远好过于冒泡、简单选择、直接插入的O(n2)的时间复杂度了。 
        空间复杂度上,它只有一个用来交换的暂存单元,也算是非常的不错。不过由于记录的比较与交换是跳跃式进行,因此堆排序也是一种不稳定的排序方法。
        另外,由于初始构建堆所需的比较次数较多,因此,它并不适合待排序序列个数较少的情况。

出处:http://write.blog.csdn.net/postedit

《大话数据结构》第9章 排序 9.7 堆排序(下)相关推荐

  1. 大话数据结构 第七章 图(二) 最小生成树、最短路径、拓扑排序、关键路径算法

    大话数据结构 第七章 图(二) 最小生成树.最短路径.拓扑排序.关键路径算法 最小生成树 定义 Prim算法 Kruskal算法 最短路径 Dijkstra算法 Floyd算法 拓扑排序 AOV网 拓 ...

  2. 《大话数据结构》样章试读

    <大话数据结构>样章试读 各位童鞋,<大话数据结构>从写作到出版,虽然经历了一些坎坷,但终于还是在今天正式在一些网店发售了.现在提供两章的完整版试读PDF文件,希望能给您有所 ...

  3. 《大话数据结构》第9章 排序 9.7 堆排序(上)

    9.7.1 堆结构介绍 我们前面讲到简单选择排序,它在待排序的n个记录中选择一个最小的记录需要比较n-1次.本来这也可以理解,查找第一个数据需要比较这么多次正常的,否则如何知道它是最小的记录.     ...

  4. 读书笔记-《大话数据结构》第二章算法

    2.3两种算法的比较 #include <iostream> #if 0 //需要运行 100次 int main() {int i,sum=0,n=100;for(i=1;i<=n ...

  5. 【大话数据结构算法】希尔排序

    希尔排序的实质就是分组插入排序,该方法又称为缩小增量排序. 直接插入排序适合于序列基本有序的情况,希尔排序的每趟排序都会使整个序列变得更加有序,等整个序列基本有序了,再来一趟直接插入排序,这样会使排序 ...

  6. 大话数据结构 摘录 第一章 数据结构绪论

    文章目录 启示:数据结构 学习数据机构的重要性 数据结构引发的案例 数据结构的起源 程序设计=数据结构+算法 基础概念与术语 数据 数据元素 数据项 数据对象 数据结构 数据结构:是相互之间存在一种或 ...

  7. 读书笔记-《大话数据结构》第一章数据结构绪论

    1.3数据结构的起源 数据结构:是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科. 程序设计=数据结构+算法 1.4基本概念和术语 1.4.1数据:描述客观事物 ...

  8. 大话数据结构第四章栈的应用

    一.斐波契那数列 就是下一项的值等于相邻的上两项元素之和. 这个规律就是斐波契那数列.由此,我知道这个世界是少不了规律的.就算没有规律也要用规律来逼近描述无规律的现象. 迭代和递归的区别:迭代是循环, ...

  9. 大话数据结构第四章栈的基本概念与出栈入栈操作

    一.栈的顺序存储结构 1.基本概念 栈顶就是表尾. 栈顶是栈插入和删除的地方. 栈就是只允许在表尾进行添加或删除,是顺序存储结构线性表的特例或者说简化. 为什么说是简化呢?相对于顺序存储结构来说栈只允 ...

最新文章

  1. CodeForces 448
  2. java实用教程——组件及事件处理——对话框(dialog)
  3. qt和c#怎么选_请问目前做windows桌面应用程序,MFC、QT、C#哪个更好?
  4. Maven整合Spring3.0+Mybatis3.2+Struts2.3+查找坐标+jar包依赖(五)
  5. 以容器为代表的云原生技术,正成为释放云价值最短路径
  6. 作为程序员,北漂的我有很多话想说。
  7. mysql 随机取不重复数据_随机生成不重复数字,想做Excel抽奖器你必须掌握!
  8. aGlass学习笔记 1
  9. 美国伊利诺伊大学香槟分校计算机专业,伊利诺伊大学香槟分校
  10. 【PyTorch深度学习项目实战100例】—— 基于UNet实现血管瘤超声图像分割 | 第30例
  11. iOS开发打字机效果
  12. 老板电器携手华为HarmonyOS创新升级中国厨房新理念
  13. android中oncreate方法,android开发之onCreate( )方法详解
  14. 利用python进行数据分析学习笔记
  15. 威力曲面sw2020_威力曲面powersufacing_沐风网
  16. 裁判文书网数据采集爬虫记录2023-03
  17. web课程设计网页规划与设计:个人毕设网站设计 —— 二手书籍(11个页面) HTML+CSS+JavaScript...
  18. 使用 ggsegExtra 对大脑分区统计结果进行可视化,如在Glasser360分区模板,Yeo2011模板,Schaefer分区模板上统计结果可视化
  19. jQuery之遍历数组
  20. Delphi 10 Seattle小票打印控件TQ_Printer

热门文章

  1. 每日一博 - 延时任务的多种实现方式解读
  2. CSS基础_Day02
  3. 学习笔记(二十二)—— 了解进程和线程
  4. php数字导出excel表格中_php怎么把数据表中的数据导出到excel表中
  5. 深入理解ROS技术 【2】ROS下的模块详解(66-128)
  6. php 冒泡置顶,浅谈php冒泡的排序
  7. 的远程烧写_农用气象环境远程监测管理系统
  8. java aes密钥生成_如何在Java(Android)中生成与.Net中相同的AES密钥?
  9. java 文件字节流_Java:文件字符流和字节流的输入和输出
  10. sdut-oj-4205-寻找关键点