📜  合并排序树以获取范围顺序统计信息

📅  最后修改于: 2021-04-17 11:39:32             🧑  作者: Mango

给定一个由n个数字组成的数组,任务是回答以下查询:

kthSmallest(start, end, k) : Find the Kth smallest 
                             number in the range from array
                             index 'start' to 'end'.

例子:

Input : arr[] = {3, 2, 5, 1, 8, 9|
     Query 1: start = 2, end = 5, k = 2
     Query 2: start = 1, end = 6, k = 4
Output : 2
         5
Explanation:
[2, 5, 1, 8] represents the range from 2 to 
5 and 2 is the 2nd smallest number 
in the range[3, 2, 5, 1, 8, 9] represents 
the range from 1 to 6 and 5 is the 4th
smallest number in the range

关键思想是构建一个在每个节点上都有一个向量的分段树,并且该向量按排序顺序包含子范围的所有元素。而且,如果我们观察到这种分段树结构,则该结构与合并排序算法期间形成的树有些相似(这就是为什么将其称为合并排序树的原因)

我们使用与合并排序树中讨论的相同的实现(在给定的行范围内,较小或相等的元素)

首先,我们维护一个向量对,其中每个对{value,index}使得对的第一个元素代表输入数组的元素,而对的第二个元素代表其出现的索引。

现在,我们基于每个对的第一个元素对对向量进行排序。

之后,我们将建立一个合并排序树,其中每个节点都有一个在排序范围内的索引向量。

当我们必须回答一个查询时,我们发现第K最小的数字是在左子树中还是在右子树中。想法是使用两个二进制搜索并找到左侧子树中的元素数量,以使索引位于给定的查询范围内。
令此类索引的数量为M。

如果M> = K,这意味着我们将能够在左子树中找到第K个最小的Number,因此我们调用左子树。

否则,第K最小数字位于右子树中,但是这次我们不必寻找第K最小数字,因为我们已经在左子树中拥有范围的前M个最小数字,因此我们应该寻找对于其余部分,即右子树中的第(KM)个数字。

这是第K最小数字的索引,该索引处的值是所需数字。

// CPP program to implement k-th order statistics
#include 
using namespace std;
  
const int MAX = 1000;
  
// Constructs a segment tree and stores tree[]
void buildTree(int treeIndex, int l, int r, 
       vector > &a, vector tree[])
{
  
    /* l => start of range,
        r => ending of a range
        treeIndex => index in the Segment Tree/Merge 
                     Sort Tree  */
  
    /* leaf node */
    if (l == r) {
        tree[treeIndex].push_back(a[l].second);
        return;
    }
  
    int mid = (l + r) / 2;
  
    /* building left subtree */
    buildTree(2 * treeIndex, l, mid, a, tree);
  
    /* building left subtree */
    buildTree(2 * treeIndex + 1, mid + 1, r, a, tree);
  
    /* merging left and right child in sorted order */
    merge(tree[2 * treeIndex].begin(), 
          tree[2 * treeIndex].end(),
          tree[2 * treeIndex + 1].begin(), 
          tree[2 * treeIndex + 1].end(),
          back_inserter(tree[treeIndex]));
}
  
// Returns the Kth smallest number in query range
int queryRec(int segmentStart, int segmentEnd, 
             int queryStart, int queryEnd, int treeIndex,
                 int K, vector tree[])
{
    /*
        segmentStart => start of a Segment,
        segmentEnd   => ending of a Segment,
        queryStart   => start of a query range,
        queryEnd     => ending of a query range,
        treeIndex    => index in the Segment 
                        Tree/Merge Sort Tree,
        K  => kth smallest number to find  */
  
    if (segmentStart == segmentEnd) 
        return tree[treeIndex][0];
      
    int mid = (segmentStart + segmentEnd) / 2;
  
    // finds the last index in the segment 
    // which is <= queryEnd
    int last_in_query_range = 
            (upper_bound(tree[2 * treeIndex].begin(),
                          tree[2 * treeIndex].end(),
                                          queryEnd)
                    - tree[2 * treeIndex].begin());
  
    // finds the first index in the segment
    // which is >= queryStart
    int first_in_query_range = 
                (lower_bound(tree[2 * treeIndex].begin(),
                            tree[2 * treeIndex].end(),
                                        queryStart)
                          - tree[2 * treeIndex].begin());
  
    int M = last_in_query_range - first_in_query_range;
  
    if (M >= K) {
  
        // Kth smallest is in left subtree,
        // so recursively call left subtree for Kth 
        // smallest number
        return queryRec(segmentStart, mid, queryStart, 
                     queryEnd, 2 * treeIndex, K, tree);
    }
  
    else {
  
        // Kth smallest is in right subtree,
        // so recursively call right subtree for the 
        // (K-M)th smallest number
        return queryRec(mid + 1, segmentEnd, queryStart,
               queryEnd, 2 * treeIndex + 1, K - M, tree);
    }
}
  
// A wrapper over query()
int query(int queryStart, int queryEnd, int K, int n,
          vector > &a, vector tree[])
{
  
    return queryRec(0, n - 1, queryStart - 1, queryEnd - 1, 
                                               1, K, tree);
}
  
// Driver code
int main()
{
    int arr[] = { 3, 2, 5, 1, 8, 9 };
    int n = sizeof(arr)/sizeof(arr[0]);
  
    // vector of pairs of form {element, index}
    vector > v;
    for (int i = 0; i < n; i++) {
        v.push_back(make_pair(arr[i], i));
    }
  
    // sort the vector
    sort(v.begin(), v.end());
  
    // Construct segment tree in tree[]
    vector tree[MAX];
    buildTree(1, 0, n - 1, v, tree);
  
    // Answer queries
    // kSmallestIndex hold the index of the kth smallest number
    int kSmallestIndex = query(2, 5, 2, n, v, tree);
    cout << arr[kSmallestIndex] << endl;
  
    kSmallestIndex = query(1, 6, 4, n, v, tree);
    cout << arr[kSmallestIndex] << endl;
  
    return 0;
}
输出:
2
5

因此,通过在索引上构建合并排序树,我们可以获得O(n(logn) 2 )中从L到R的第K个最小数目的查询。