海量数据中求最大的K个数

题目

在n个数中求最大的K个数

思路

建立一个K个节点的小根堆,再遍历n个数
与小根堆的第一个元素比较

code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
#include<iostream>
#include<cstdlib>
using namespace std;

void heap_adjust(int *arr, int start, int end)
{
int tmp = arr[start];
for (int i = 2 * start + 1; i <= end; i = i * 2 + 1)
{
if (i + 1 <= end && arr[i]>arr[i + 1])
{
i++;
}
if (tmp > arr[i])
{
arr[start] = arr[i];
start = i;
}
}
arr[start] = tmp;
}
void heap_sort(int *arr, int length)
{
//调整成小根堆
for (int i = (length - 1 - 1) / 2; i >= 0; i--)
{
heap_adjust(arr, i, length - 1);
}
}

int * find_max_N(int *arr, int len,int n)
{
if (arr == NULL || len < n||n<1)return NULL;
int *brr = new int[n];//先让brr为arr的前n个
memcpy(brr, arr, sizeof(int)* n);
heap_sort(brr, n);//把前n个调整为小根堆
for (int i = n; i < len; ++i)
{
if (arr[i]>brr[0])//如果有值比brr[0]大,则进行赋值后再次调整
{
brr[0] = arr[i];
heap_adjust(brr, 0, n-1);
}
}
return brr;
}

总结

利用堆排序的思想,时间复杂度为O(n*logk),空间复杂度为O(K)

其他解法

使用快速排序划分的做法