给定整数数组,请根据元素的频率对数组进行排序。例如,如果输入数组为{2,3,2,4,5,12,12,2,3,3,3,12},则将数组修改为{3,3,3,3,2,2, 2、12、12、4、5}。
在上一篇文章中,我们讨论了根据频率进行排序的所有方法。在这篇文章中,详细讨论了方法2,并提供了该方法的C++实现。
以下是详细的算法。
- 创建一个BST,并在创建BST时保持同一BST中每个即将到来的元素的计数即频率。如果使用自平衡BST,则此步骤可能需要O(nLogn)时间。
- 进行BST的遍历,并将每个元素和每个元素的计数存储在辅助数组中。让我们将辅助数组称为“ count []”。请注意,此数组的每个元素都是元素和频率对。此步骤需要O(n)时间。
- 根据元素的频率对’count []’进行排序。如果使用O(nLogn)排序算法,则此步骤将花费O(nLohn)时间。
- 遍历排序数组’count []’。对于每个元素x,将其打印“频率”倍,其中“频率”是x的频率。此步骤需要O(n)时间。
如果我们使用O(nLogn)排序算法,并使用具有O(Logn)插入操作的自平衡BST,则该算法的总体时间复杂度可以为最小O(nLogn)。
以下是上述算法的实现。
// Implementation of above algorithm in C++.
#include
#include
using namespace std;
/* A BST node has data, freq, left and right pointers */
struct BSTNode
{
struct BSTNode *left;
int data;
int freq;
struct BSTNode *right;
};
// A structure to store data and its frequency
struct dataFreq
{
int data;
int freq;
};
/* Function for qsort() implementation. Compare frequencies to
sort the array according to decreasing order of frequency */
int compare(const void *a, const void *b)
{
return ( (*(const dataFreq*)b).freq - (*(const dataFreq*)a).freq );
}
/* Helper function that allocates a new node with the given data,
frequency as 1 and NULL left and right pointers.*/
BSTNode* newNode(int data)
{
struct BSTNode* node = new BSTNode;
node->data = data;
node->left = NULL;
node->right = NULL;
node->freq = 1;
return (node);
}
// A utility function to insert a given key to BST. If element
// is already present, then increases frequency
BSTNode *insert(BSTNode *root, int data)
{
if (root == NULL)
return newNode(data);
if (data == root->data) // If already present
root->freq += 1;
else if (data < root->data)
root->left = insert(root->left, data);
else
root->right = insert(root->right, data);
return root;
}
// Function to copy elements and their frequencies to count[].
void store(BSTNode *root, dataFreq count[], int *index)
{
// Base Case
if (root == NULL) return;
// Recur for left substree
store(root->left, count, index);
// Store item from root and increment index
count[(*index)].freq = root->freq;
count[(*index)].data = root->data;
(*index)++;
// Recur for right subtree
store(root->right, count, index);
}
// The main function that takes an input array as an argument
// and sorts the array items according to frequency
void sortByFrequency(int arr[], int n)
{
// Create an empty BST and insert all array items in BST
struct BSTNode *root = NULL;
for (int i = 0; i < n; ++i)
root = insert(root, arr[i]);
// Create an auxiliary array 'count[]' to store data and
// frequency pairs. The maximum size of this array would
// be n when all elements are different
dataFreq count[n];
int index = 0;
store(root, count, &index);
// Sort the count[] array according to frequency (or count)
qsort(count, index, sizeof(count[0]), compare);
// Finally, traverse the sorted count[] array and copy the
// i'th item 'freq' times to original array 'arr[]'
int j = 0;
for (int i = 0; i < index; i++)
{
for (int freq = count[i].freq; freq > 0; freq--)
arr[j++] = count[i].data;
}
}
// A utility function to print an array of size n
void printArray(int arr[], int n)
{
for (int i = 0; i < n; i++)
cout << arr[i] << " ";
cout << endl;
}
/* Driver program to test above functions */
int main()
{
int arr[] = {2, 3, 2, 4, 5, 12, 2, 3, 3, 3, 12};
int n = sizeof(arr)/sizeof(arr[0]);
sortByFrequency(arr, n);
printArray(arr, n);
return 0;
}
输出:
3 3 3 3 2 2 2 12 12 5 4
锻炼:
上面的实现并不能保证具有相同频率的元素的原始顺序(例如,输入4排在5之前,但是输出4排在5之后)。扩展实现以保持原始顺序。例如,如果两个元素具有相同的频率,则在输入数组中打印第一个出现的频率。