给定一个已排序的正数数组,我们的任务是找到连续子数组的第 k 个最小和。
例子:
Input : a[] = {1, 2, 3, 4, 5, 6}
k = 4
Output : 3
Explanation : List of sorted subarray sum: {1, 2, 3, 3, 4, 5, 5, 6, 6, 7, 9, 9, 10, 11, 12, 14, 15, 15, 18, 20, 21}. 4th smallest element is 3.
Input : a[] = {1, 2, 3, 4, 5, 6}
k = 13
Output: 10
一种简单的方法是首先生成所有连续的子数组和,这可以通过预先计算前缀和来在 O(N^2) 中完成。对 sum 数组进行排序并给出第 k 个最小的元素。
更好的方法(对于总和较小的数组)是使用二进制搜索。首先,我们将预先计算一个前缀和数组。现在我们对可能是第 k 个最小和的候选数字应用二分搜索,该数字将在 [0,数组的总和] 范围内。现在让我们假设我们有一个名为 calculateRank 的函数,它将为我们提供连续子数组和的排序数组中任何数字的排名。在二分查找中,我们将使用这个calculateRank函数来检查mid元素的秩是否小于K,如果是则将起点减少到mid+1,否则如果大于或等于K,则减少终点指向 mid-1 并更新答案变量。
现在让我们回到 calculateRank函数。在这里,我们也将使用二分搜索,但在我们的前缀 sum 数组上。我们将迭代我们的数组并假设我们在第 i 个索引上,我们将计算可以使用起始元素组成的子数组数量作为第 i 个元素的总和较小比我们必须计算其等级的中间元素。我们对所有元素进行操作并添加每个元素的计数,我们将其作为中间元素的排名。为了计算从第 i 个索引开始的子数组的数量,我们在前缀和上使用应用二进制。
C++ 实现使事情更清晰。
// CPP program to find k-th smallest sum
#include "algorithm"
#include "iostream"
#include "vector"
using namespace std;
int CalculateRank(vector prefix, int n, int x)
{
int cnt;
// Initially rank is 0.
int rank = 0;
int sumBeforeIthindex = 0;
for (int i = 0; i < n; ++i) {
// Calculating the count the subarray with
// starting at ith index
cnt = upper_bound(prefix.begin(), prefix.end(),
sumBeforeIthindex + x) - prefix.begin();
// Subtracting the subarrays before ith index.
cnt -= i;
// Adding the count to rank.
rank += cnt;
sumBeforeIthindex = prefix[i];
}
return rank;
}
int findKthSmallestSum(int a[], int n, int k)
{
// PrefixSum array.
vector prefix;
// Total Sum initially 0.
int sum = 0;
for (int i = 0; i < n; ++i) {
sum += a[i];
prefix.push_back(sum);
}
// Binary search on possible
// range i.e [0, total sum]
int ans = 0;
int start = 0, end = sum;
while (start <= end) {
int mid = (start + end) >> 1;
// Calculating rank of the mid and
// comparing with K
if (CalculateRank(prefix, n, mid) >= k) {
// If greater or equal store the answer
ans = mid;
end = mid - 1;
}
else {
start = mid + 1;
}
}
return ans;
}
int main()
{
int a[] = { 1, 2, 3, 4, 5, 6 };
int k = 13;
int n = sizeof(a)/sizeof(a[0]);
cout << findKthSmallestSum(a, n, k);
return 0;
}
10
时间复杂度: O(N Log N Log SUM)。这里 N 是元素数,SUM 是数组总和。
CalculateRank函数需要 O(N log N) 时间,称为 Log SUM 次。