最小集封面[PHP]
Minimum Set Cover是一个问题,您必须找到覆盖每个元素所需的最小数量.
例如,假设我们有一组X =数组(1,2,3,4,5,6)和另一组S,其中 S[1]=array(1,4) S[2] =array(2,5) S[3] =array(3,6) S[4] =array(1,3) S[5] =array(4,6) 问题是找到覆盖X的每一个元素的最小S集合.因此,我们这个例子中最小集合覆盖将是S [4]和S [5],因为它覆盖了所有元素. 更新1 >最优逻辑电路的构建 更新2 更新3 $MainSet=array(1,6,7); $SubSet=array(array(1,4),array(2,5),array(3,6),array(1,3),array(4,6)); $UncoveredElements=$MainSet; $CoveringSets=array(); while (count($UncoveredElements)>0){ $S=SubSetS($UncoveredElements,$SubSet); if (is_array($S)){ $UncoveredElements=array_diff($UncoveredElements,$S); $CoveringSets[]=$S; }else break; //finish work } echo "Sets that cover MainSet are:"; var_dump($CoveringSets); //Subset S is chosen that covers as many uncovered elements as possible function SubSetS($UncoveredElements,$SubSetArr){ $max=0; $s=array(); foreach($SubSetArr as $SubSet){ $intersectArr=array_intersect($UncoveredElements,$SubSet); $weight=count($intersectArr); if ($weight>$max){ $max=$weight; $s=$SubSet; } } if ($max>0) return $s; else return 0; } 关于我的解决方案的任何意见和想法?对我来说,它解决了我的问题,就是我想要的.但是,如果您建议任何优化,更正代码,请填写免费. 最终更新
Bakhtiyor,你所说的这个问题需要一点点矛盾.你首先说你想要一个最小的封面,并指出自己这个问题是NP-hard.您发布的算法是贪心集合覆盖算法.该算法找到一个非常小的集合封面,但不一定是最小的封面.两个人发布了一个算法,搜索更彻底,确实找到一个最小的封面,你在一个评论中说,你不需要一个最佳的解决方案.
你需要一个最佳的解决方案吗?因为找到最小集合封面是一个非常不同的算法问题,因为找到一个相当小的集合封面.前者的算法必须非常仔细地写入,以免大量输入. (通过我的大输入,我的意思是说,40个子集.)后者的算法很容易,你用自己的代码做了很好的工作.我会改变的一件事是,在你的循环语句“foreach($SubSetArr as $SubSet)”之前,我将随机化子集列表.这为算法提供了许多输入的最佳选择机会. (但是,有一些例子,其中最小集合覆盖不包括最大的子集,所以对于某些输入,这个特定的贪婪算法将无法找到最小值,无论顺序如何). 如果你真的想要最小的封面,而不只是一个很好的封面,那么你应该说出你希望代码完全解决的最大的输入.这是一个关键的细节,影响算法需要为您的任务花哨. 要回应其他人的看法:首先,如果您想要最佳解决方案,则无需搜索所有子集.其次,您不应该为该问题寻找“该”算法.这个问题有很多算法,比其他算法要快一些,比其他算法复杂一些. 这里有一种方法可以从搜索所有集合的算法开始,并加速它,使之更好.我不会提供代码,因为我不认为提问者想要这样一个奇特的解决方案,但我可以描述这些想法.您可以将搜索排列为分支搜索:最佳集合覆盖包含最大子集A或不包含. (从最大的集合开始就可以正常工作.)如果是这样,您可以从元素列表中删除A的元素,从其他子集的元素中删除A的元素,并解决剩余子集覆盖问题.如果没有,您仍然可以从子集列表中删除A并解决剩余子集覆盖问题. 到目前为止,这只是一种安排搜索所有内容的方法.但是,在这种递归算法中有几种重要的方法来获取快捷方式.当您找到解决方案时,您可以保留迄今为止发现的最佳记录.这设定了你必须打败的门槛.在每个阶段,您可以总计剩余的最大阈值-1个子集的大小,并查看它们是否有足够的元素来覆盖其余的元素.如果没有,你可以放弃;你不会超过当前的门槛. 另外,如果在这个递归算法中,任何元素只被一个子集覆盖,那么你可以抛出该子集来确定它是否是最大的. (事实上??,添加这一步甚至是Bakhtiyor编码的贪婪算法是个好主意.) 这两个加速度可以从搜索树中分离出大量的分支,并且它们组合起来更好. 由于Don Knuth所谓的“跳舞链接”,这种类型的问题还有一个聪明的数据结构.他提出了一个确切的覆盖问题,这是一个有点不同于这一个,但你可以适应最小的子集覆盖和上面的所有想法.跳舞链接是一个相互链接的列表的网格,允许您检查递归搜索中的子集,而无需复制整个输入. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |