Leetcode(347)——前 K 个高频元素

题目

题解

方法一:桶排序

思路

​​  顾名思义,桶排序的意思是为每个值设立一个桶,桶内记录这个值出现的次数(或其它属性),然后对桶进行排序。针对样例来说,我们先通过桶排序得到三个桶 [1,2,3,4],它们的值分别为 [4,2,1,1],表示每个数字出现的次数。
​​  紧接着,我们对桶的频次进行排序,前 k 大个桶即是前 k 个频繁的数。这里我们可以使用各种排序算法,甚至可以再进行一次桶排序,把每个旧桶根据频次放在不同的新桶内。针对样例来说,因为目前最大的频次是 4,我们建立 [1,2,3,4] 四个新桶,它们分别放入的旧桶为 [[3,4],[2],[],[1]],表示不同数字出现的频率。最后,我们从后往前遍历,直到找到 k 个旧桶。

代码实现

我的:

class Solution {public:vector<int> topKFrequent(vector<int>& nums, int k) {if(nums.size() == 1) return nums;unordered_map<int, int> times;int maxcount = 0;for(auto& it: nums) maxcount = max(maxcount, ++times[it]);vector<vector<int>> bucket(maxcount+1);for(auto& it: times) bucket[it.second].push_back(it.first);vector<int> ans;// 因为保证答案唯一,所以不考虑 maxcount 的大小while(k > 0){if(!bucket[maxcount].empty()){k -= bucket[maxcount].size();ans.insert(ans.end(), bucket[maxcount].begin(), bucket[maxcount].end());}maxcount--;}return ans;}
};

复杂度分析

时间复杂度:O(n)O(n)O(n),其中 nnn 是数组长度
空间复杂度:O(max(n,k))O(max(n, k))O(max(n,k)),其中 nnn 是数组长度

方法二:堆排序

思路

​​  首先遍历整个数组,并使用哈希表记录每个数字出现的次数,并形成一个「出现次数数组」。找出原数组的前 kkk 个高频元素,就相当于找出「出现次数数组」的前 kkk 大的值。

​​  最简单的做法是给「出现次数数组」排序。但由于可能有 O(N)O(N)O(N) 个不同的出现次数(其中 NNN 为原数组长度),故总的算法复杂度会达到 O(Nlog⁡N)O(N\log N)O(NlogN),不满足题目的要求。

在这里,我们可以利用堆的思想:建立一个小顶堆,然后遍历「出现次数数组」:

  • 如果堆的元素个数小于 kkk,就可以直接插入堆中。
  • 如果堆的元素个数等于 kkk,则检查堆顶与当前出现次数的大小。如果堆顶更大,说明至少有 kkk 个数字的出现次数比当前值大,故舍弃当前值;否则,就弹出堆顶,并将当前值插入堆中。

​​  遍历完成后,堆中的元素就代表了「出现次数数组」中前 kkk 大的值。

代码实现

Leetcode 官方题解:

class Solution {public:static bool cmp(pair<int, int>& m, pair<int, int>& n) {return m.second > n.second;}vector<int> topKFrequent(vector<int>& nums, int k) {unordered_map<int, int> occurrences;for (auto& v : nums) {occurrences[v]++;}// pair 的第一个元素代表数组的值,第二个元素代表了该值出现的次数priority_queue<pair<int, int>, vector<pair<int, int>>, decltype(&cmp)> q(cmp);for (auto& [num, count] : occurrences) {if (q.size() == k) {if (q.top().second < count) {q.pop();q.emplace(num, count);}} else {q.emplace(num, count);}}vector<int> ret;while (!q.empty()) {ret.emplace_back(q.top().first);q.pop();}return ret;}
};

复杂度分析

时间复杂度:O(Nlog⁡k)O(N\log k)O(Nlogk),其中 NNN 为数组的长度。我们首先遍历原数组,并使用哈希表记录出现次数,每个元素需要 O(1)O(1)O(1) 的时间,共需 O(N)O(N)O(N) 的时间。随后,我们遍历「出现次数数组」,由于堆的大小至多为 kkk,因此每次堆操作需要 O(log⁡k)O(\log k)O(logk) 的时间,共需 O(Nlog⁡k)O(N\log k)O(Nlogk) 的时间。二者之和为 O(Nlog⁡k)O(N\log k)O(Nlogk)。
空间复杂度:O(N)O(N)O(N)。哈希表的大小为 O(N)O(N)O(N),而堆的大小为 O(k)O(k)O(k),共计为 O(N)O(N)O(N)。

方法三:(改进的)快速排序——即快速选择排序

思路

​​  我们可以使用快速选择算法,求出「出现次数数组」的前 kkk 大的值。

​​  首先我们使用 arr\textit{arr}arr 数组存储每个数字对应的出现次数,然后遍历数组获取出现次数。然后对 arr\textit{arr}arr 数组进行快速排序。

​​  在对数组 arr[l…r]\textit{arr}[l \ldots r]arr[l…r] 做快速排序的过程中,我们首先将数组划分为两个部分 arr[i…q−1]\textit{arr}[i \ldots q-1]arr[i…q−1] 与 arr[q+1…j]\textit{arr}[q+1 \ldots j]arr[q+1…j],并使得 arr[i…q−1]\textit{arr}[i \ldots q-1]arr[i…q−1] 中的每一个值都不超过 arr[q]\textit{arr}[q]arr[q],且 arr[q+1…j]\textit{arr}[q+1 \ldots j]arr[q+1…j] 中的每一个值都大于 arr[q]\textit{arr}[q]arr[q]。

于是,我们根据 kkk 与左侧子数组 arr[i…q−1]\textit{arr}[i \ldots q-1]arr[i…q−1] 的长度(为 q−iqq-iqq−iq)的大小关系:

  • 如果 k≤q−ik \le q-ik≤q−i,则数组 arr[l…r]\textit{arr}[l \ldots r]arr[l…r] 前 kkk 大的值,就等于子数组 arr[i…q−1]\textit{arr}[i \ldots q-1]arr[i…q−1] 前 kkk 大的值。
  • 否则,数组 arr[l…r]\textit{arr}[l \ldots r]arr[l…r] 前 kkk 大的值,就等于左侧子数组全部元素,加上右侧子数组 arr[q+1…j]\textit{arr}[q+1 \ldots j]arr[q+1…j] 中前 k−(q−i)k - (q - i)k−(q−i) 大的值。

​​  原版的快速排序算法的平均时间复杂度为 O(Nlog⁡N)O(N\log N)O(NlogN)。我们的算法中,每次只需在其中的一个分支递归即可,因此算法的平均时间复杂度降为 O(N)O(N)O(N)。

代码实现

Leetcode 官方题解:

class Solution {public:void qsort(vector<pair<int, int>>& v, int start, int end, vector<int>& ret, int k) {int picked = rand() % (end - start + 1) + start;swap(v[picked], v[start]);int pivot = v[start].second;int index = start;for (int i = start + 1; i <= end; i++) {if (v[i].second >= pivot) {swap(v[index + 1], v[i]);index++;}}swap(v[start], v[index]);if (k <= index - start) {qsort(v, start, index - 1, ret, k);} else {for (int i = start; i <= index; i++) {ret.push_back(v[i].first);}if (k > index - start + 1) {qsort(v, index + 1, end, ret, k - (index - start + 1));}}}vector<int> topKFrequent(vector<int>& nums, int k) {unordered_map<int, int> occurrences;for (auto& v: nums) {occurrences[v]++;}vector<pair<int, int>> values;for (auto& kv: occurrences) {values.push_back(kv);}vector<int> ret;qsort(values, 0, values.size() - 1, ret, k);return ret;}
};

复杂度分析

时间复杂度
​​  其中 NNN 为数组的长度。设处理长度为 NNN 的数组的时间复杂度为 f(N)f(N)f(N)。由于处理的过程包括一次遍历和一次子分支的递归,最好情况下,有 f(N)=O(N)+f(N/2)f(N) = O(N) + f(N/2)f(N)=O(N)+f(N/2),根据主定理,能够得到 f(N)=O(N)f(N) = O(N)f(N)=O(N)。
​​  最坏情况下,每次取的枢轴都位于数组的两端,时间复杂度退化为 O(N2)O(N^2)O(N2)。但由于我们在每次递归的开始会先随机选取中枢元素,故出现最坏情况的概率很低。
​​  平均情况下,时间复杂度为 O(N)O(N)O(N)。

空间复杂度:O(N)O(N)O(N)。其中哈希表的大小为 O(N)O(N)O(N),用于排序的辅助数组的大小也为 O(N)O(N)O(N),快速排序的空间复杂度最好情况为 O(log⁡N)O(\log N)O(logN),最坏情况为 O(N)O(N)O(N)

Leetcode(347)——前 K 个高频元素相关推荐

  1. LeetCode——347. 前 K 个高频元素【最小堆实现】

    LeetCode--347. 前 K 个高频元素[最小堆实现] 给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素.你可以按 任意顺序 返回答案. 示例1: 输入: n ...

  2. Leetcode 347. 前 K 个高频元素

    Leetcode 347. 前 K 个高频元素 1.问题分析 2.问题解决 3.总结 1.问题分析 题目链接:https://leetcode-cn.com/problems/top-k-freque ...

  3. Java实现 LeetCode 347 前 K 个高频元素

    347. 前 K 个高频元素 给定一个非空的整数数组,返回其中出现频率前 k 高的元素. 示例 1: 输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2] 示例 2: 输 ...

  4. LeetCode 347. 前 K 个高频元素(C++)*

    该题在不考虑时间复杂度的要求下,可以使用哈希表来存储元素的次数,或者使用排序算法:为了提高算法的效率,考虑使用优先队列来实现大根堆. 1.题目如下: 给你一个整数数组 nums 和一个整数 k ,请你 ...

  5. LeetCode 347. 前 K 个高频元素(哈希/优先队列)

    文章目录 1. 题目 2. 解题 2.1 哈希 2.2 优先队列 1. 题目 给定一个非空的整数数组,返回其中出现频率前 k 高的元素. 示例 1: 输入: nums = [1,1,1,2,2,3], ...

  6. Leetcode 347.前K个高频元素

    Time: 20190910 Type: Medium 题目描述 给定一个非空的整数数组,返回其中出现频率前 k 高的元素. 示例 1: 输入: nums = [1,1,1,2,2,3], k = 2 ...

  7. Leetcode 347. 前K个高频元素 解题思路及C++实现

    方法一:最小堆 解题思路: 先使用一个unordered_map来遍历nums容器,得到每个元素对应的频数. 再使用最小堆,对unordered_map中的频数进行遍历,得到k个最大的频数对应的< ...

  8. 【LeetCode】【HOT】347. 前 K 个高频元素(哈希表+优先队列)

    [LeetCode][HOT]347. 前 K 个高频元素 文章目录 [LeetCode][HOT]347. 前 K 个高频元素 package hot;import java.util.Arrays ...

  9. 模拟卷Leetcode【普通】347. 前 K 个高频元素

    347. 前 K 个高频元素 给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素.你可以按 任意顺序 返回答案. 示例 1: 输入: nums = [1,1,1,2,2 ...

  10. 力扣347 前 K 个高频元素 -- JS

    347. 前 K 个高频元素 - 力扣(LeetCode) (leetcode-cn.com) 一:使用对象进行解题,对象的属性为给定数组的元素,属性值为给定数组元素出现的次数: 二:把对象转成数组, ...

最新文章

  1. TinkerNode NB-IoT物联网开发板(NB-IoT专栏—拓展篇3)
  2. 没抢到欧冠杯的票?没关系!在VR中看!
  3. 怎么屏蔽跳出来的登陆窗口_我是怎么从机构跳出来做兼职的(二)
  4. 从postgress 读取数据
  5. 用c语言编写黎曼积分计算pi,C语言实现黎曼和求定积分
  6. Python内置函数zip map filter的使用
  7. android 无法显示SD卡目录,Android studio无法在SD卡上创建新目录?
  8. hadoop(6)——mrjob的使用(2)——交给hadoop集群
  9. android 双人黑白棋开发博客,黑白棋 - 软件资讯 - 课堂党年级博客
  10. [html] 请使用canvas画一个渐变的长方形
  11. java base64转bitmap,如何将Bitmap位图与base64字符串相互转换
  12. Web前端JavaScript笔记(5)事件-拖拽
  13. 约瑟夫环(Data structure and algorithm -C language)—— #YU
  14. 如何在WhatsApp中设置两步验证
  15. 怎么在电脑中更新statsmodels.stats. diagnostic
  16. py233基于 python的诚交大学生二手交易平台Django#毕业设计
  17. JavaScript去除字符串中所有的标点符号,只保留中文、英文和数字
  18. VMware安装tools
  19. Cmpp发送wappush
  20. can和could的用法_情态动词can与could的用法

热门文章

  1. 基本粒子群算法小结及算法实例(附Matlab代码)
  2. 微型计算机主要性能指标是什么,微型计算机的主要性能指标
  3. 操作系统:作业调度算法--先来先服务
  4. html中显示框框中对勾,word对号怎么打 word怎么设置在方框里打对号
  5. 成功解决We recommend that if you want Anaconda registered as your system Python, you unregister this Pyt
  6. [计算机英语]句子翻译(只含unit1.3.4.5.7.8.9.12)
  7. 【Visual Studio 2013中文语言包安装】
  8. C++程序设计课程设计报告
  9. 网站点击流数据分析项目
  10. 《跑步人生》 作者:村上春树