题目:输入n个整数,输出其中最小的k个。

例如输入1,2,3,4,5,6,7和8这8个数字,则最小的4个数字为1,2,3和4。

分析:这道题最简单的思路莫过于把输入的n个整数排序,这样排在最前面的k个数就是最小的k个数。只是这种思路的时间复杂度为O(nlogn)。我们试着寻找更快的解决思路。

我们可以先创建一个大小为k的数据容器来存储最小的k个数字。接下来我们每次从输入的n个整数中读入一个数。如果容器中已有的数字少于k个,则直接把这次读入的整数放入容器之中;如果容器中已有k个数字了,也就是容器已满,此时我们不能再插入新的数字而只能替换已有的数字。我们找出这已有的k个数中最大值,然和拿这次待插入的整数和这个最大值进行比较。如果待插入的值比当前已有的最大值小,则用这个数替换替换当前已有的最大值;如果带插入的值比当前已有的最大值还要大,那么这个数不可能是最小的k个整数之一,因为我们容器内已经有k个数字比它小了,于是我们可以抛弃这个整数。

因此当容器满了之后,我们要做三件事情:一是在k个整数中找到最大数,二是有可能在这个容器中删除最大数,三是可能要插入一个新的数字,并保证k个整数依然是排序的。如果我们用一个二叉树来实现这个数据容器,那么我们能在O(logk)时间内实现这三步操作。因此对于n个输入数字而言,总的时间效率就是O(nlogk)。

我们可以选择用不同的二叉树来实现这个数据容器。由于我们每次都需要找到k个整数中的最大数字,我们很容易想到用最大堆。在最大堆中,根结点的值总是大于它的子树中任意结点的值。于是我们每次可以在O(1)得到已有的k个数字中的最大值,但需要O(logk)时间完成删除以及插入操作。

我们自己从头实现一个最大堆需要一定的代码。我们还可以采用红黑树来实现我们的容器。红黑树通过把结点分为红、黑两种颜色并根据一些规则确保树是平衡的,从而保证在红黑树中查找、删除和插入操作都只需要O(logk)。在STL中set和multiset都是基于红黑树实现的。如果面试官不反对我们用STL中的数据容器,我们就直接拿过来用吧。下面是基于STL中的multiset的参考代码:

typedef multiset<int, greater<int> >  IntHeap;///
// find k least numbers in a vector
///
void FindKLeastNumbers
(const vector<int>& data,               // a vector of dataIntHeap& leastNumbers,                 // k least numbers, outputunsigned int k
)
{leastNumbers.clear();if(k == 0 || data.size() < k)return;vector<int>::const_iterator iter = data.begin();for(; iter != data.end(); ++ iter){// if less than k numbers was inserted into leastNumbersif((leastNumbers.size()) < k)leastNumbers.insert(*iter);// leastNumbers contains k numbers and it's full nowelse{// first number in leastNumbers is the greatest oneIntHeap::iterator iterFirst = leastNumbers.begin();// if is less than the previous greatest number if(*iter < *(leastNumbers.begin())){// replace the previous greatest numberleastNumbers.erase(iterFirst);leastNumbers.insert(*iter);}}}
} 

本文已经收录到《剑指Offer——名企面试官精讲典型编程题》一书中,有改动,书中的分析讲解更加详细,并且还介绍了一种O(n)的算法。欢迎关注。在我的英文版博客(

http://codercareer.blogspot.com/2011/09/no-05-least-k-numbers.html )中也讨论了这个问题,感兴趣的读者可以去看看英文的博客。
      本题已被 九度Online Judge系统收录,欢迎读者移步到 http://ac.jobdu.com/hhtproblems.php在线测试自己的代码。

博主何海涛对本博客文章享有版权。网络转载请注明出处http://zhedahht.blog.163.com/。整理出版物请和作者联系。对解题思路有任何建议,欢迎在评论中告知,或者加我微博http://weibo.com/zhedahht或者http://t.163.com/zhedahht与我讨论。谢谢。

程序员面试题精选100题(05)-查找最小的k个元素[算法]相关推荐

  1. 程序员面试题精选100题(03)-子数组的最大和[算法]

    题目:输入一个整形数组,数组里有正数也有负数.数组中连续的一个或多个整数组成一个子数组,每个子数组都有一个和.求所有子数组的和的最大值.要求时间复杂度为O(n). 例如输入的数组为1, -2, 3, ...

  2. 程序员面试题精选100题(17)-把字符串转换成整数[算法]

    题目:输入一个表示整数的字符串,把该字符串转换成整数并输出.例如输入字符串"345",则输出整数345. 分析:这道题尽管不是很难,学过C/C++语言一般都能实现基本功能,但不同程 ...

  3. 程序员面试题精选100题(16)-O(logn)求Fibonacci数列[算法]

    题目:定义Fibonacci数列如下: /  0                      n=0 f(n)=      1                      n=1         \  f ...

  4. 程序员面试题精选100题(26)-和为n连续正数序列[算法]

    题目:输入一个正数n,输出所有和为n连续正数序列. 例如输入15,由于1+2+3+4+5=4+5+6=7+8=15,所以输出3个连续序列1-5.4-6和7-8. 分析:这是网易的一道面试题. 这道题和 ...

  5. 程序员面试题精选100题(61)-数对之差的最大值[算法]

    题目:在数组中,数字减去它右边的数字得到一个数对之差.求所有数对之差的最大值.例如在数组{2, 4, 1, 16, 7, 5, 11, 9}中,数对之差的最大值是11,是16减去5的结果. 分析:看到 ...

  6. 程序员面试题精选100题

    程序员面试题精选100题(01)-把二元查找树转变成排序的双向链表 题目:输入一棵二元查找树,将该二元查找树转换成一个排序的双向链表.要求不能创建任何新的结点,只调整指针的指向. 比如将二元查找树   ...

  7. [程序员面试题精选100题]13.第一个只出现一次的字符

    [题目] 在一个字符串中找到第一个只出现一次的字符.如输入abaccdeff,则输出b. [分析] [代码] /********************************* * 日期:2013- ...

  8. 程序员面试题精选100题(51)-顺时针打印矩阵

    // 程序员面试题精选100题(51)-顺时针打印矩阵.cpp : 定义控制台应用程序的入口点. //#include "stdafx.h" #include <iostre ...

  9. 程序员面试题精选100题:求从1到n的正数中1出现的次数

    // 程序员面试题精选100题(25):求从1到n的正数中1出现的次数 // 如 f(253) = (2!=0) * 100 + 2 * f(99) + (5!=0) * 10 + 5 * f(9) ...

最新文章

  1. 面部特征点检测的关键技术
  2. 清华大学第四届大数据开放日(Big Data Day)
  3. 初学Java--计算器
  4. 洛谷P3779 [SDOI2017]龙与地下城(概率论+Simpson+FFT)
  5. 你应该知道的模型评估的五个方法
  6. (转)简单代码生成器原理剖析(二)
  7. Android中的消息机制:Handler消息传递机制
  8. pycharm在ubuntu xfce下面Alt+insert快捷键冲突解决
  9. java安装和环境配置
  10. 钉钉开放平台:内网穿透工具 - 服务器免费打造教程
  11. 图像分类任务中的tricks总结
  12. 在三层交换上配置ciscoVTP实验
  13. vs工程 vcproj和开发环境定义宏
  14. 从零开始前端学习[26]:html5的一些常用标签,header,footer,section,aside,figure,figcaption,nav,artical,
  15. 空军资深战略研究员:房地产支撑不起大国崛起
  16. lambda分组集合中list和set区别
  17. C++内存管理:内存池实现
  18. 艾伟_转载:VS 2010 和 .NET 4.0 系列之《自动启动ASP.NET应用》篇
  19. 在Linux下编译VLC-Qt
  20. 22岁到72岁的男人对女人的要求

热门文章

  1. 从0到1走进 Kaggle
  2. 40个良好用户界面Tips
  3. html左边动右边不动,网页布局//上左不动,其他滑动
  4. Java Review - HashMap HashSet 源码解读
  5. jvm性能调优实战 -53接口超时导致的OOM
  6. JVM-10虚拟机性能监控与故障处理工具之【JDK的命令行】
  7. Android日期分组,按查询分组在列表视图android中显示一些意...
  8. 用python画奥迪标志_不知道不 OK!53 个 Python 经典面试题详解
  9. 2021-01-10 Halcon初学者知识 【9】形状匹配【一】准备图像
  10. 3des java ecb_PHP 3DES加密 与JAVA通用 加密模式:ECB