TimSort算法是一种起源于归并排序和插入排序的混合排序算法,设计初衷是为了在真实世界中的各种数据中能够有较好的性能。

该算法最初是由Tim Peters于2002年在Python语言中提出的。

TimSort 是一个归并排序做了大量优化的版本号。

对归并排序排在已经反向排好序的输入时表现O(n2)的特点做了特别优化。对已经正向排好序的输入降低回溯。对两种情况混合(一会升序。一会降序)的输入处理比較好。

在jdk1.7之后。Arrays类中的sort方法有一个分支推断,当LegacyMergeSort.userRequested为true的情况下,採用legacyMergeSort,否则採用ComparableTimSort。而且在legacyMergeSort的凝视上标明了该方法会在以后的jdk版本号中废弃,因此以后Arrays类中的sort方法将採用ComparableTimSort类中的sort方法。

<span style="font-family:Microsoft YaHei;">public static void sort(Object[] a, int fromIndex, int toIndex) {if (LegacyMergeSort.userRequested)legacyMergeSort(a, fromIndex, toIndex);elseComparableTimSort.sort(a, fromIndex, toIndex);
} </span>

以下是ComparableTimSort的sort方法

<span style="font-family:Microsoft YaHei;">static void sort(Object[] a) {sort(a, 0, a.length);
}static void sort(Object[] a, int lo, int hi) {rangeCheck(a.length, lo, hi);int nRemaining  = hi - lo;if (nRemaining < 2)return;  // Arrays of size 0 and 1 are always sorted// If array is small, do a "mini-TimSort" with no mergesif (nRemaining < MIN_MERGE) {int initRunLen = countRunAndMakeAscending(a, lo, hi);binarySort(a, lo, hi, lo + initRunLen);return;}/*** March over the array once, left to right, finding natural runs,* extending short natural runs to minRun elements, and merging runs* to maintain stack invariant.*/ComparableTimSort ts = new ComparableTimSort(a);int minRun = minRunLength(nRemaining);do {// Identify next runint runLen = countRunAndMakeAscending(a, lo, hi);// If run is short, extend to min(minRun, nRemaining)if (runLen < minRun) {int force = nRemaining <= minRun ? nRemaining : minRun;binarySort(a, lo, lo + force, lo + runLen);runLen = force;}// Push run onto pending-run stack, and maybe mergets.pushRun(lo, runLen);ts.mergeCollapse();// Advance to find next runlo += runLen;nRemaining -= runLen;} while (nRemaining != 0);// Merge all remaining runs to complete sortassert lo == hi;ts.mergeForceCollapse();assert ts.stackSize == 1;
}</span>

(1)传入的待排序数组若小于阈值MIN_MERGE(Java实现中为32。Python实现中为64)。则调用 binarySort,这是一个不包括合并操作的 mini-TimSort

a) 从数组開始处找到一组连接升序或严格降序(找到后翻转)的数
b) Binary Sort:使用二分查找的方法将兴许的数插入之前的已排序数组。binarySort 对数组 a[lo:hi] 进行排序,而且a[lo:start] 是已经排好序的。算法的思路是对a[start:hi] 中的元素。每次使用binarySearch 为它在 a[lo:start] 中找到对应位置,并插入。

(2)開始真正的TimSort过程:

(2.1) 选取minRun大小,之后待排序数组将被分成以minRun大小为区块的一块块子数组

a) 假设数组大小为2的N次幂,则返回16(MIN_MERGE / 2)
b) 其它情况下,逐位向右位移(即除以2),直到找到介于16和32间的一个数

  • minRun
<span style="font-family:Microsoft YaHei;">private static int minRunLength(int n) {assert n >= 0;int r = 0;      // Becomes 1 if any 1 bits are shifted offwhile (n >= MIN_MERGE) {r |= (n & 1);n >>= 1;}return n + r;}</span>

这个函数依据 n 计算出相应的 natural run 的最小长度。

MIN_MERGE 默觉得32,假设n小于此值,那么返回n 本身。否则会将 n 不断地右移。直到少于 MIN_MERGE,同一时候记录一个 r 值,r 代表最后一次移位n时。n最低位是0还是1。 最后返回 n + r,这也意味着仅仅保留最高的 5 位。再加上第六位。

(2.2)do-while

(2.2.1)找到初始的一组升序数列,countRunAndMakeAscending 会找到一个run 。这个run 必须是已经排序的。而且函数会保证它为升序,也就是说,假设找到的是一个降序的。会对其进行翻转。

(2.2.2)若这组区块大小小于minRun,则将兴许的数补足,利用binarySortrun 进行扩展。而且扩展后,run 仍然是有序的。

(2.2.3)当前的 run 位于 a[lo:runLen] ,将其入栈ts.pushRun(lo, runLen);//为兴许merge各区块作准备:记录当前已排序的各区块的大小

(2.2.4)对当前的各区块进行merge,merge会满足下面原则(如果X,Y,Z为相邻的三个区块):

a) 仅仅对相邻的区块merge
b) 若当前区块数仅为2,If X<=Y。将X和Y merge
b) 若当前区块数>=3,If X<=Y+Z。将X和Y merge。直到同一时候满足X>Y+Z和Y>Z

因为要合并的两个 run 是已经排序的,所以合并的时候,有会特别的技巧。如果两个 runrun1,run2 ,先用 gallopRightrun1 里使用 binarySearch 查找run2 首元素 的位置k, 那么 run1k 前面的元素就是合并后最小的那些元素。然后,在run2 中查找run1 尾元素 的位置 len2 ,那么run2len2 后面的那些元素就是合并后最大的那些元素。最后,依据len1len2 大小。调用mergeLo 或者 mergeHi 将剩余元素合并。

(2.2.5) 反复2.2.1 ~ 2.2.4,直到将待排序数组排序完 
(2.2.6) Final Merge:假设此时还有区块未merge,则合并它们

(3)演示样例

*注意*:为了演示方便,我将TimSort中的minRun直接设置为2,否则我不能用非常小的数组演示。。

。同一时候把MIN_MERGE也改成2(默觉得32),这样避免直接进入binary sort。

初始数组为[7,5,1,2,6,8,10,12,4,3,9,11,13,15,16,14]
=> 寻找连续的降序或升序序列 (2.2.1)。同一时候countRunAndMakeAscending 函数会保证它为升序
[1,5,7] [2,6,8,10,12,4,3,9,11,13,15,16,14]

=> 入栈 (2.2.3)
当前的栈区块为[3]

=> 进入merge循环 (2.2.4)
do not merge由于栈大小仅为1

=> 寻找连续的降序或升序序列 (2.2.1)
[1,5,7] [2,6,8,10,12] [4,3,9,11,13,15,16,14]

=> 入栈 (2.2.3)
当前的栈区块为[3, 5]

=> 进入merge循环 (2.2.4)
merge由于runLen[0]<=runLen[1]
1) gallopRight:寻找run1的第一个元素应当插入run0中哪个位置(”2”应当插入”1”之后),然后就能够忽略之前run0的元素(都比run1的第一个元素小)
2) gallopLeft:寻找run0的最后一个元素应当插入run1中哪个位置(”7”应当插入”8”之前),然后就能够忽略之后run1的元素(都比run0的最后一个元素大)
这样须要排序的元素就仅剩下[5,7] [2,6],然后进行mergeLow
完毕之后的结果:
[1,2,5,6,7,8,10,12] [4,3,9,11,13,15,16,14]

=> 入栈 (2.2.3)
当前的栈区块为[8]
退出当前merge循环由于栈中的区块仅为1

=> 寻找连续的降序或升序序列 (2.2.1)
[1,2,5,6,7,8,10,12] [3,4] [9,11,13,15,16,14]
=> 入栈 (2.2.3)
当前的栈区块大小为[8,2]

=> 进入merge循环 (2.2.4)
do not merge由于runLen[0]>runLen[1]

=> 寻找连续的降序或升序序列 (2.2.1)
[1,2,5,6,7,8,10,12] [3,4] [9,11,13,15,16] [14]

=> 入栈 (2.2.3)
当前的栈区块为[8,2,5]

=>
do not merege run1与run2由于不满足runLen[0]<=runLen[1]+runLen[2]
merge run2与run3由于runLen[1]<=runLen[2]
1) gallopRight:发现run1和run2就已经排好序
完毕之后的结果:
[1,2,5,6,7,8,10,12] [3,4,9,11,13,15,16] [14]

=> 入栈 (2.2.3)
当前入栈的区块大小为[8,7]
退出merge循环由于runLen[0]>runLen[1]

=> 寻找连续的降序或升序序列 (2.2.1)
最后仅仅剩下[14]这个元素:[1,2,5,6,7,8,10,12] [3,4,9,11,13,15,16] [14]

=> 入栈 (2.2.3)
当前入栈的区块大小为[8,7,1]

=> 进入merge循环 (2.2.4)
merge由于runLen[0]<=runLen[1]+runLen[2]
由于runLen[0]>runLen[2],所以将run1和run2先合并。(否则将run0和run1先合并)
1) gallopRight & 2) gallopLeft
这样须要排序的元素剩下[13,15] [14],然后进行mergeHigh
完毕之后的结果:
[1,2,5,6,7,8,10,12] [3,4,9,11,13,14,15,16] 当前入栈的区块为[8,8]

=>
继续merge由于runLen[0]<=runLen[1]
1) gallopRight & 2) gallopLeft
须要排序的元素剩下[5,6,7,8,10,12] [3,4,9,11]。然后进行mergeHigh
完毕之后的结果:
[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16] 当前入栈的区块大小为[16]

=>
不须要final merge由于当前栈大小为1

=>
结束

參考:

http://www.lifebackup.cn/timsort-java7.html

http://blog.csdn.net/on_1y/article/details/30109975

http://en.wikipedia.org/wiki/Timsort

转载于:https://www.cnblogs.com/lxjshuju/p/7081959.html

java.util.ComparableTimSort中的sort()方法简单分析相关推荐

  1. [Google Guava] 2.3-强大的集合工具类:java.util.Collections中未包含的集合工具

    原文链接 译文链接 译者:沈义扬,校对:丁一 尚未完成: Queues, Tables工具类 任何对JDK集合框架有经验的程序员都熟悉和喜欢java.util.Collections包含的工具方法.G ...

  2. java数字编程提,java从字符串中提取数字的简单实例

    随便给你一个含有数字的字符串,比如: String s="eert343dfg56756dtry66fggg89dfgf"; 那我们怎么把其中的数字提取出来呢?大致有以下几种方法, ...

  3. python的sort方法是哪种_python中的sort方法使用详解

    Python中的sort()方法用于数组排序,本文以实例形式对此加以详细说明: 一.基本形式列表有自己的sort方法,其对列表进行原址排序,既然是原址排序,那显然元组不可能拥有这种方法,因为元组是不可 ...

  4. 在python中使用sort_Python中的sort()方法使用基础教程

    一.基本形式 sorted(iterable[, cmp[, key[, reverse]]]) iterable.sort(cmp[, key[, reverse]]) 参数解释: (1)itera ...

  5. html中的sort方法,JavaScript_javascript中sort() 方法使用详解,语法:arrayObject.sort(sortby);参 - phpStudy...

    javascript中sort() 方法使用详解 语法:arrayObject.sort(sortby):参数sortby可选.规定排序顺序.必须是函数. sort() 方法用于对数组的元素进行排序. ...

  6. java string.substring 参数,Java,String类中的subString()方法,stringsubstring

    Java,String类中的subString()方法,stringsubstring public class TestStringSubString { // main函数 public stat ...

  7. java settitle_关于java的JFrame中的setTitle()方法

    展开全部 java的JFrame中使用setTitle()方法设置窗体的标题: 下面是一个计算器的例子: import java.awt.BorderLayout; import java.awt.D ...

  8. java.nio.Buffer 中的 flip()方法

    在Java NIO编程中,对缓冲区操作常常需要使用  java.nio.Buffer中的 flip()方法. Buffer 中的 flip() 方法涉及到 Buffer 中的capacity.posi ...

  9. js数组 sort方法的分析

    avascript 中 Array.sort()方法是用来对数组项进行排序的 ,默认情况下是进行升序排列,实例代码如下:     var arrA = [6,2,4,3,5,1];     arrA. ...

最新文章

  1. Microsoft Office Backstage(第 1 部分 – 幕后故事)
  2. 一个电脑多个github、gitlab、oschina账户
  3. java resultset 赋值_ResultSet数据自动绑定到JavaBean中 | 学步园
  4. Spring和SpringMVC整合
  5. zabbix 接触这段时间的感悟
  6. MapReduce计算模型(二)
  7. 为什么烂软件大行其道而好软件无人问津?
  8. web逻辑思维题目_经典的逻辑思维训练题
  9. 佳能dpp4中文版 附使用教程
  10. 【esp32lvgl】-2.1 # esp32移植lvgl7驱动st7789屏幕(ESP-IDF框架)
  11. 想要自己开发App难吗?教你快速生成App
  12. Android 项目中依赖项目、依赖库、依赖module中的jar包(第三方库)
  13. Android中的短信收不到问题,华为的安卓(Android)系统手机收不到短信问题解决方法...
  14. vue3 + router-view + keepalive parentComponent.ctx.deactivate is not a function
  15. 音乐分类及处理——用机器学习的方法实现python
  16. TensorFlow从1到2(十一)变分自动编码器和图片自动生成
  17. python爬虫之爬取网易云音乐的歌曲图片和歌词
  18. 实时显示当前时间(英文版)
  19. 【Rust日报】 2019-06-16:用 Rust, Haskell, C++, Python, Scala 和 OCaml 实现同一个工程的比较...
  20. 平台梯子行业调研报告 - 市场现状分析与发展前景预测

热门文章

  1. 移动开发:iphone开发之触摸事件详解
  2. EdgeRouter X设置外网远程访问和HTTPS连接指定出口网关
  3. 青海省多地日降水量突破历史极值
  4. 怎样下载C/C++的免费、开源且跨平台IDE——Code::Blocks
  5. 让windows 2003启动后直接进入桌面
  6. Go的50度灰:Golang新开发者要注意的陷阱和常见错误
  7. 英语26个字母使用频度
  8. CSS3 2D Transform
  9. OSPF协议概述(一)
  10. OOAD实践之路——真实案例解析OO理论与实践(二、第一项任务:特性列表)