多个网站如何做301,手机网站被自动跳转,青岛网站建设找,做食品研发都有哪些网站多数问题#xff08;Majority Problem#xff09;是一个有多种求解方法的经典问题#xff0c;其问题定义如下#xff1a; 给定一个大小为 n n n的数组#xff0c;找出其中出现次数超过 n / 2 n/2 n/2的元素 例如#xff1a;当输入数组为 [ 5 , 3 , 5 , 2 , 3 , 5 , 5 ] […多数问题Majority Problem是一个有多种求解方法的经典问题其问题定义如下 给定一个大小为 n n n的数组找出其中出现次数超过 n / 2 n/2 n/2的元素 例如当输入数组为 [ 5 , 3 , 5 , 2 , 3 , 5 , 5 ] [5, 3, 5, 2, 3, 5, 5] [5,3,5,2,3,5,5]则 5 5 5是多数majority。
本文将介绍该问题的多种求解方法重点介绍蒙特卡洛与分治法2种。
1. 解决思路
面对一个未知的算法问题我们最开始很自然地会使用简单粗暴的方法。
1.1 暴力解法
暴力解法就是遍历整个数组依次判断每个元素是否是多数。其伪代码如下
Majority(A[1, n])
for(i 1 to n)cnt 1for(j 1 to n)if (i ! j and A[i]A[j])cntendif (cnt n/2) return A[i] is the majortiyendreturn No majority暴力算法的缺点就是费时间时间复杂度为 O ( n 2 ) O(n^2) O(n2)。那有什么办法能少一些遍历的时间代价呢哈希表就是一种用空间换时间的方法。
1.2 哈希表
上面的暴力解法中我们在循环遍历中更新元素出现的次数然后再判断是否是多数。可以改为只遍历数组一次用哈希表记录每个元素出现的次数然后再遍历哈希表找到出现次数最大的元素判断其出现次数是否超过 n / 2 n/2 n/2。
这样时间复杂度降为了 O ( n ) O(n) O(n)空间复杂度为 O ( n ) O(n) O(n)。时间复杂度还能更优化一点吗下面让我们来看下分治法的求解思路。
1.3 分治法
我们把原始数组分为两半在前一半子数组中找到多数 A A A在后一半子数组中找到多数 B B B。那么原始数组的多数一定在 A A A与 B B B之间当二者相等时原始数组的多数就已经找到了当二者不等时比较 A A A与 B B B出现的次数哪个大于 n / 2 n/2 n/2即可。
算法的时间复杂度 T ( n ) T ( n / 2 ) 2 n O ( n log n ) T(n)T(n/2)2nO(n\log{n}) T(n)T(n/2)2nO(nlogn)。具体的C语言代码实现可参见第2节。
1.4 蒙特卡洛法
蒙特卡罗Monte Carlo算法是一种随机算法在一般情况下可以保证对问题的所有实例都以高概率给出正确解但是通常无法判定一个具体解是否正确。
在多数问题中蒙特卡洛法的思想是随机从数组中选择一个元素判断是否是多数。如果不是多数的话再随机选择一个。在存在多数的情况下因为随机选择到多数的概率超过 1 2 \frac{1}{2} 21算法找不到多数的概率小于 1 2 \frac{1}{2} 21。
该算法的平均时间复杂度为 O ( n ) O(n) O(n)。
2. 代码
以下C语言代码依次实现了Monte Carlo以及分治法求解多数问题并比较了两种算法的运行时间。
首先用户需输入测试数据的文件路径按下回车键。然后进入Monte Carlo模式需输入重复的次数。待用户输入完成按下回车键后对Monte Carlo算法求解多数问题计时开始直至输出多数问题的结果计时结束打印输出运行时间ms。Monte Carlo结束后直接进入分治法求解开始计时直至分治法输出多数问题的结果计时结束打印输出运行时间ms。
#include iostream
#include cstdlib
#include ctime
#include windows.h using namespace std;const int N 2000000; //定义数组的最大长度 int a[N];bool majorityMC_once(int a[], int len, int *result) { //对长度为len的数组a[]进行一次蒙特卡洛寻找多数 int rnd rand() % len; //生成[0, len-1)的一个随机下标 int x a[rnd];int count 0; //记录 x 在数组a[]中出现的次数 for (int i 0; i len; i) { if (a[i] x) {count;}}if (count (len / 2)) { //若 x 出现次数超过数组长度的一半则一次蒙特卡洛找到多数返回true *result x; //将找到的多数的值传给result return true;} else { //否则一次蒙特卡洛未找到多数返回false return false;}
}bool majorityMC_k_times(int a[], int len, int *result, int k) { //k次蒙特卡洛 for (int i 1; i k; i) {if(majorityMC_once(a, len, result)) { //只要有一次蒙特卡洛找到多数则返回true return true;}} return false; //k次蒙特卡洛均未找到多数则返回false
}bool majorityDC(int a[], int start, int end, int *result) { //分治法求解多数问题数组下标区间为[start, end] if (start end) {*result a[end];return true;}else {int m1, m2;majorityDC(a, start, (start end) / 2, m1); //m1为前半区间[start, (start end) / 2]的多数 majorityDC(a, (start end) / 2 1, end, m2); //m2为后半区间[(start end) / 2 1, end]的多数 int count1 0, count2 0;for (int i start; i end; i) {if (a[i] m1) { //count1记录m1在数组a[]中出现的次数 count1;}if (a[i] m2) { //count2记录m2在数组a[]中出现的次数 count2;}}if (count1 ((end - start 1) / 2)) { //m1在数组a[]中出现的次数大于数组长度的一半则m1为多数 *result m1;return true;} else if (count2 ((end - start 1) / 2)) { //m2在数组a[]中出现的次数大于数组长度的一半则m2为多数 *result m2;return true;}else { return false; //m1, m2均不是多数则数组a[]的多数不存在}}
}int main() {srand(time(NULL)); //设置时间函数time(NULL)为随机数种子 char s[100];cout 请输入测试数据文件路径 endl;cin s; FILE *fp;fp fopen(s, r);if (fp NULL) {cout Can not open the file! endl;exit(0);}int i 0;while (fscanf(fp, %d\n, a[i]) ! EOF) { //读取文件中的数据到数组a[]中 i;}fclose(fp); cout ********************** Monte Carlo ********************* endl;int k;cout 请输入 Monte Carlo 重复的次数 ;cin k;LARGE_INTEGER nFreq;LARGE_INTEGER nBeginTime;LARGE_INTEGER nEndTime;QueryPerformanceFrequency(nFreq);QueryPerformanceCounter(nBeginTime); //Monte Carlo计时开始 int resultMC;if (majorityMC_k_times(a, i, resultMC, k)) {cout resultMC is the majority endl;} else {cout Can not find the majority! endl;}QueryPerformanceCounter(nEndTime); //Monte Carlo计时结束 double time (double)(nEndTime.QuadPart - nBeginTime.QuadPart) / nFreq.QuadPart * 1000;cout Running time: time ms endl;cout endl;cout ****************** Divide and Conquer ****************** endl;QueryPerformanceFrequency(nFreq);QueryPerformanceCounter(nBeginTime); //分治法计时开始 int resultDC;if (majorityDC(a, 0, i - 1, resultDC)) {cout resultDC is the majority endl;} else {cout Can not find the majority! endl;}QueryPerformanceCounter(nEndTime); //分治法计时结束 time (double)(nEndTime.QuadPart - nBeginTime.QuadPart) / nFreq.QuadPart * 1000;cout Running time: time ms endl;return 0;
}3. 运行结果
基于测试数据求解得到如下结果
dataset1.txtnonedataset2.txt991data_1015.txtnonedata_1015l.txtnone
多次运行程序发现在多数问题有解时采用Monte Carlo算法求解效率普遍比分治法高但是在Monte Carlo算法重复次数较少时它在实际中并不总是返回正确结果。如测试数据为dataset2.txtMonte Carlo重复1次时可能会找不到多数问题的解如下图。 其他运行示例
1dataset1.txtMonte Carlo重复次数1000 2dataset2.txtMonte Carlo重复次数20 3data_1015.txtMonte Carlo重复次数1000 4data_1015l.txt重复次数1000