题目:有一个包含20亿个全是32位整数的大文件,在其中找到出现次数最多的数

要求:内存限制2GB

解决办法:把包含20亿个数的大文件用哈希函数分成16个小文件,根据哈希函数的性质,同一种数不可能被散列到不同的小文件上,同时每个小文件中不同的数一定不会大于2亿种,假设哈希函数足够优秀,然后对每一个小文件用哈希表来统计其中每种出现的次数,这样我们就可以得到16个小文件中各自出现次数最多的数,还有各自的次数统计,接下来选出16个小文件各自的第一名中谁出现的次数最多即可

只有2GB内存在20亿个整数中找到出现次数最多的数相关推荐

  1. 只用2GB的内存找出20亿个整数中找到出现次数最多的数

    要求有一个包含20亿个32位整数的文件,从中找到出现次数最多的数. 首先先分析一下,32位int类型的数占4B,20亿个4B 约为 8GB,只用2GB肯定不够.所以我们肯定需要将这20亿个数哈希到不同 ...

  2. 【面试被虐】如何只用2GB内存从20亿,40亿,80亿个整数中找到出现次数最多的数?...

    这几天小秋去面试了,不过最近小秋学习了不少和位算法相关文章,例如 [面试现场]如何判断一个数是否在40亿个整数中? [算法技巧]位运算装逼指南 对于算法题还是有点信心的,,,,于是,发现了如下对话. ...

  3. 如何只用2GB内存从20/40/80亿个整数中找到出现次数最多的数

    来源:公众号[苦逼的码农] 这几天小秋去面试了,不过最近小秋学习了不少和位算法相关文章,例如: [算法技巧]位运算装逼指南 对于算法题还是有点信心的,,,,于是,发现了如下对话. 20亿级别 面试官: ...

  4. 【面试被虐】如何只用2GB内存从20亿,40亿,80亿个整数中找到出现次数最多的数?

    这几天小秋去面试了,不过最近小秋学习了不少和位算法相关文章,例如 [面试现场]如何判断一个数是否在40亿个整数中? [算法技巧]位运算装逼指南 对于算法题还是有点信心的,,,,于是,发现了如下对话. ...

  5. 挑战程序员同学,如何只用2GB内存从20/40/80亿个整数中找到出现次数最多的数?

    按位比较,比如先遍历一遍数字,判断第一位是0还是1多,然后便利多的那一位的数字,判断第二位是0还是1多,依次判断到第32位,就是出现次数最多的数字了 好吧,这个算法不对 我感觉这个题目是不是考的排序算 ...

  6. Spark的实战题目——寻找5亿次访问中,访问次数最多的人

    场景描述:这是一个Spark的实战题目,也是在面试中经常出现的一类题目. 问题描述 对于一个大型网站,用户访问量尝尝高达数十亿.对于数十亿是一个什么样的概念,我们这里可以简单的计算一下.对于一个用户, ...

  7. 【漫画+图解】面试官让我用 2GB 内存给 20亿个整数(需要8GB内存)排序,我该咋整??

    排序的时候我们可以选择快速排序或归并排序等算法.为了方便,我们把排序好的2G有序数据称之为有序子串吧.接着我们可以把两个小的有序子串合并成一个大的有序子串. 注意:读取的时候是每次读取一个int数,通 ...

  8. 漫画:如何判断一个数是否在40亿个整数中?

    文章来源于:https://wwww.iamshuaidi.com,一个专注于校招,面试,面经的编程网站 题目:我有40亿个整数,再给一个新的整数,我需要判断新的整数是否在40亿个整数中,你会怎么做? ...

  9. 利剑无意之如何判断一个数在40亿个整数中

    如何判断一个数在40亿个整数中 首先思路:用一个set存储就好了,整数32位,一个整数4个字节,40亿个整数,应该是160亿个字节,大概16GB. 此刻问题又来了,我的机器只有2GB内存,但是需要尽可 ...

最新文章

  1. PyTorch中模型的可复现性
  2. 图像也能做情感迁移?罗切斯特大学团队提出计算机视觉新任务
  3. C# 利用Newtonsoft.Json将DataTable进行JSON序列化
  4. oracle事物的传播属性,spring事务的隔离级别和传播属性
  5. 内核kernel以及根文件系统rootfs是如何映射到对应的nand flash的
  6. VMware虚拟机VMware Authorization Service不能启动问题
  7. 荐 Intellij IDEA创建Maven Web项目(带有webapp文件夹目录的项目)
  8. vba 提取 json某个值_利用VBA字典,提取两列数据的重复值
  9. 管理学习(2)——职场中最重要的四件事
  10. 第五章 基元类型,引用类型和值类型
  11. php怎么处理一对多,php - 如何处理内部连接以及与OOP的一对多关系? - SO中文参考 - www.soinside.com...
  12. 远驱240控制器调整参数_PID控制中三个参数的作用
  13. 西游记与面向对象编程
  14. oracle根据身份证号码计算年龄
  15. Canvas彩色樱花图案背景js特效
  16. 超详细如何配置NAT
  17. Excel中如何用计算公式或表达式直接计算出结果?
  18. NR CSI(三) CQI
  19. 游戏网站搭建实例:黑色沙漠中文wiki站搭建(1)
  20. MyBatis快速入门(10)全局配置--settings

热门文章

  1. React16.2的fiber架构
  2. Visual Studio 11 Beta 带来新的Metro 应用开发体验
  3. phaiapi数据库重写类
  4. 另一鲜为人知的单例写法-ThreadLocal
  5. c++中构造函数 、析构函数的作用域详解
  6. 如何利用office绘制施工进度计划横道图?
  7. Leetcode1685. 有序数组中差绝对值之和[C++题解]:前缀和和差的绝对值之和
  8. 《大话数据结构》读书笔记-栈与队列
  9. telnet工具_Telnet进入Linux时出现乱码
  10. php用户登录后跳转到主页,phpmyadmin登录后跳到首页的问题