算法试验中不仅仅要尝试使用不同的写法,更要注意测试所用数据的规律性,它们都会直接影响测试结果。

在上一篇文章《Python 排序算法[一]:令你茅塞顿开,却又匪夷所思》中我们学习了排序算法中比较费时间的三种:冒泡排序、选择排序、插入排序。并且在测试过程中发现了匪夷所思的问题,但是这都难不倒诸位 Coder。回顾一下上次测试的结果(3 万零 1 的数据排序):

冒泡排序 - 41
选择排序(两层 for) - 47
选择排序(max mix) - 14
插入排序 - 0.007398
复制代码

相对而言,冒泡排序和选择排序连插入排序的尾灯都看不到。

当即就有读者提出了看法:

大家都认为造成插入排序速度与其他两种排序速度巨大差异的原因是数据量和规律的值(当时的值非常规律,data=[i for i in range(3000)])。

所以这一次我将使用随机值来再次测试,看一看排序速度是否跟排序值的规律程度有关:

随机值

这一次的测试数据与上一次的不同,上一次确实是太规律了,所以这一次采用随机值:


from random import randintdata = [randint(6, 20000) for i in range(30000)]
data.insert(500, 5)
data.insert(700, 7)
data.insert(900, 9)
复制代码

并且还在生成的随机值列表中不同位置插入 3 个值,有了不规律的随机值,接下来就可以开始测试了。

冒泡排序

def bubble(data):for i in range(len(data)-1):    # 排序次数for s in range(len(data)-i-1):  # s为列表下标if data[s] > data[s+1]:data[s], data[s+1] = data[s+1], data[s]return datastart_time = datetime.now()
res = bubble(data)print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])
复制代码

得到的输出结果为:

0:01:20.273247
30003 [5, 6, 7, 7, 7] [492, 492, 492, 493, 495] [6665, 6665, 6666, 6668, 6668]
复制代码

80 秒!冒泡排序的测试结果证明,随机元素的列表排序比规律元素的列表排序费时更久。

选择排序(两层 for)


def selections(nums):for i in range(len(nums)):min_index = min(nums)  # 最小值for j in range(len(nums) - i):if nums[min_index] < nums[j]:min_index = jnums[min_index], nums[len(nums) - i - 1] = nums[len(nums) - i - 1], nums[min_index]return numsstart_time = datetime.now()
res = selections(data)print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])复制代码

得到的结果为:

0:01:07.171114
30003 [6, 6, 7, 7, 8] [444, 445, 445, 446, 447] [6652, 6654, 6654, 6654, 6654]
复制代码

本次耗时 67 秒,而之前使用规律的值排序时耗时约 47 秒。选择排序(两层 for)的测试结果同样证明了随机元素的列表排序比规律元素的列表排序费时更久。

选择排序(min max)

start_time = datetime.now()
res = []
for i in range(0, len(data)):aps = min(data)data.remove(aps)res.append(aps)
print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])
复制代码

运行后得到的输出结果为:

0:00:10.102158
30003 [5, 6, 6, 7, 7] [443, 443, 443, 444, 444] [6645, 6646, 6649, 6650, 6650]
复制代码

这一次耗时 10 秒,甚至比之前规律元素排序耗费的 14 秒更省时间。

插入排序


def direct_insert(nums):# 崔庆才丨静觅、韦世东丨奎因 邀请你关注微信公众号【进击的Coder】for i in range(1, len(nums)):temp = nums[i]  # temp变量指向尚未排好序元素(从第二个开始)j = i-1  # j指向前一个元素的下标while j >= 0 and temp < nums[j]:# temp与前一个元素比较,若temp较小则前一元素后移,j自减,继续比较nums[j+1] = nums[j]j = j-1nums[j+1] = temp  # temp所指向元素的最终位置return numsstart_time = datetime.now()
res = direct_insert(data)
print(datetime.now() - start_time)
print(len(res), res[:5], res[700:705], res[10000:10005])
复制代码

运行后得到的输出结果为:

0:00:57.681174
30003 [5, 6, 6, 7, 7] [455, 456, 459, 459, 460] [6647, 6649, 6649, 6649, 6649]
复制代码

这一次插入排序的速度再不是快的离谱了,在猜想范围之内。

迷雾散去

相比上一次使用非常规律的 [ i for i in range(3000)],这一次使用 randint 生成的列表肯定是非常不规律的:

print(data[:20])
复制代码

打印列表前 20 的元素,得到结果为:

[13698, 19871, 8468, 8735, 3473, 510, 788, 5070, 14585, 13324, 11743, 4310, 16460, 7102, 1900, 16608, 12342, 9724, 1482, 19609]
复制代码

这些元素的值有百位、千位、万位,证明了它们确是是不规律的。

多次测试得到的结果都相差无几,在以上几种排序的测试中,3 万左右的数据量排序最快的是选择排序(min max),它的排序速度保持在 10 秒内。

那么,选择排序的时间复杂度还是 O(n*n) 么?

为什么同样是找到最大(小)值,使用 max/min + pop 的速度会快很多,真的是因为 pop 后,n 就变成了 k,复杂度变成了 O(n+k) 了呢???

这一次的实验,告诉我们在测试中应该采用随机值的列表,而不是像上一次那样使用非常规律的 [i for i in range(3000)]

Python排序算法[二]:测试数据的迷雾散去相关推荐

  1. Python排序算法(二) 快速排序、希尔排序、归并排序

    这篇文章有的排序算法是:快速排序.希尔排序.归并排序. 快速排序 ''' 快速排序 '''def quick_sort(aList, first, last):if first >= last: ...

  2. Python排序算法总结

    Python排序算法总结 递归 在正式讲算法之前,先介绍一下递归.递归是一种解决问题的思路. 特点 调用自身 必须有一个明确的结束条件,比如if... 递归的两个阶段: 递推(压栈):到某个阶段,该阶 ...

  3. python排序算法——归并排序(附代码)

    python排序算法 --归并排序 文章目录 python排序算法 --归并排序 一.前言 二.算法描述 三.代码实现 总结 一.前言 相关知识来自<python算法设计与分析>.初级排序 ...

  4. python排序算法 ——冒泡排序(附代码)

    python排序算法 --冒泡排序 文章目录 python排序算法 --冒泡排序 一.前言 二.算法描述 三.代码实现 总结 一.前言 相关知识来自<python算法设计与分析>.初级排序 ...

  5. python排序算法——希尔排序(附代码)

    python排序算法--希尔排序 文章目录 python排序算法--希尔排序 一.前言 二.算法描述 三.代码实现 总结 一.前言 相关知识来自<python算法设计与分析>.初级排序算法 ...

  6. python排序算法——插入排序

    python排序算法--插入排序 文章目录 python排序算法--插入排序 一.前言 二.描述 三.代码实现 总结 一.前言 相关知识来自<python算法设计与分析>.初级排序算法是指 ...

  7. 算法设计与分析——十大经典排序算法二(6--10)

    一个不知名大学生,江湖人称菜狗 original author: jacky Li Email : 3435673055@qq.com  Time of completion:2023.3.1 Las ...

  8. 带你掌握4种Python 排序算法

    摘要:在编程里,排序是一个重要算法,它可以帮助我们更快.更容易地定位数据.在这篇文章中,我们将使用排序算法分类器对我们的数组进行排序,了解它们是如何工作的. 本文分享自华为云社区<Python ...

  9. 数据结构和算法之五:排序算法二

    数据结构基础之排序算法二 学习算法,排序算法当然是不能少的,这次我们来学习一下基础的选择排序,冒泡排序,以及大名鼎鼎的快速排序. 选择排序 选择排序,非常好理解,就是找最小的数放到第一位,然后从第二个 ...

最新文章

  1. 在ASP.NET MVC使用JavaScriptResult
  2. 【译】Google's AutoML: Cutting Through the Hype
  3. Spring 中获取servletContext及WebApplicationContext以及applicationContext三者之间的关系
  4. toString()和强制类型转换(String)的用法
  5. linux操作系统怎么修改时区,Linux操作系统修改时区的方法
  6. 著名加密艺术家XCOPY的NFT作品以1000ETH售出,约合173.5万美元
  7. WEB前端性能优化基本套路
  8. 程序员面试金典——11.5找出字符串
  9. Tensorflow:模型调参
  10. 计算机二级c语言考点变化,计算机二级C语言考点归纳汇总.doc
  11. sem_timedwait的用法
  12. 2021年数学建模B组代码
  13. 一文详解双目立体匹配算法:ELAS
  14. 信息安全工程师第二版知识点总结
  15. 漏洞分析检测的主要技术
  16. 2020淘宝双十一快速刷金币工具
  17. iOS 获取指南针的数据
  18. 常微分方程数值解法1
  19. vmstat 命令的用法说明
  20. 6D姿态估计算法汇总(下)

热门文章

  1. QTP sp等级历年的一些考试辅导题目!(分享)
  2. RedHat发布JBoss 7.2,完全支持Java EE 8规范
  3. ManjarorLinux操作笔记
  4. SQL优化-第二章-从解释计划层面让SQL飞
  5. Linux下文件的打包、解压缩指令——tar,gzip,bzip2,unzip,rar
  6. 《OpenGL编程指南(原书第9版)》——1.4 OpenGL渲染管线
  7. 浅谈TCP优化(转)
  8. 斐波那契序列 Fibonacci
  9. java用swing日历标记节日_如何用JavaSwing作一个日历控制程序?
  10. 安卓软件改名器_自动点击屏幕的软件有哪些?-手机自动点击软件下载