加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Windows > 正文

windows – 并行化具有许多出口点的算法?

发布时间:2020-12-14 01:55:45 所属栏目:Windows 来源:网络整理
导读:我面临并行化算法,该算法在其串行实现中检查更大的三维数组中的一组数组位置的六个面. (也就是说,选择一个数组元素,然后在x,y和z之间的元素’n’元素周围定义一个立方体或长方体,由数组的边界限定. 每个工作单元看起来像这样(Fortran伪代码;串行算法在Fortra
我面临并行化算法,该算法在其串行实现中检查更大的三维数组中的一组数组位置的六个面. (也就是说,选择一个数组元素,然后在x,y和z之间的元素’n’元素周围定义一个立方体或长方体,由数组的边界限定.

每个工作单元看起来像这样(Fortran伪代码;串行算法在Fortran中):

do n1=nlo,nhi
  do o1=olo,ohi          
    if (somecondition(n1,o1) .eq. .TRUE.) then
       retval =.TRUE.
       RETURN
    endif    
  end do 
end do

或C伪代码:

for (n1=nlo,n1<=nhi,n++) {
  for (o1=olo,o1<=ohi,o++) {
    if(somecondition(n1,o1)!=0) {
      return (bool)true;
    }
  }
}

在总算法中有六个这样的工作单元,其中’lo’和’hi’值通常在10到300之间.

我认为最好的方法是安排六个或更多执行线程,如果没有那么多CPU内核,则循环,理想情况是并行执行循环,目标与串行算法相同:somecondition( )变为True,所有线程之间的执行必须立即停止,并在共享位置设置True值.

Windows编译器中有哪些技术可以方便地并行化这样的任务?显然,我需要一个等待信号量或工作线程完成的主线程,因此需要嵌套和信令,但我对OpenMP的经验是在这一点上的介绍.

在OpenMP中是否有消息传递机制?

编辑:如果“nlo”和“nhi”或“olo”和“ohi”之间的最大差异为8到10,则表示此嵌套循环不超过64到100次迭代,并且不超过384到600次迭代六个工作单位在一起.基于此,是否值得并行化?

解决方法

一种可能性是使用OpenMP在6个循环上并行化 – 声明logical :: array(6),允许每个循环运行完成,然后retval = any(数组).然后,您可以检查此值并返回并行化循环外部.如果执行此操作,请向并行do语句添加计划(动态).或者,有一个单独的!$omp并行然后放!$omp do schedule(动态)……!$omp end现在围绕6个循环中的每个循环.

或者,您可以遵循@ M.S.B的好建议.并在整个数组上并行化最外层循环.这里的问题是你不能在并行循环中有一个RETURN – 所以标记第二个最外面的循环(并行部分中最大的循环),然后EXIT循环 – 像

retval = .FALSE.
!$omp parallel do default(private) shared(BIGARRAY,retval) schedule(dynamic,1)
do k=1,NN
   if(.not. retval) then
      outer2: do j=1,NN
         do i=1,NN
            ! --- your loop #1
            do n1=nlo,nhi
               do o1=olo,ohi
                  if (somecondition(BIGARRAY(i,j,k),n1,o1)) then
                     retval =.TRUE.
                     exit outer2
                  endif
               end do
            end do
            ! --- your loops #2 ... #6 go here
         end do
      end do outer2
   end if
end do 
!$omp end parallel do

[编辑:if语句假定您需要找出大数组中是否至少有一个这样的元素.如果你需要为每个元素计算条件,你可以类似地添加一个虚拟循环退出或goto,跳过该元素的其余处理.再次,使用时间表(动态)或时间表(指导).]

作为一个单独的点,您可能还想检查通过一个较大的步骤(取决于浮点大小)来完成最内层循环是一个好主意,在每次迭代时计算逻辑的向量然后聚合结果,例如. smth喜欢if(count(somecondition(x(o1:o1 step,k)))> 0);在这种情况下,编译器可能能够向量化某些条件.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读