加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

Linux futex系统调用虚假唤醒,返回值为0?

发布时间:2020-12-13 19:36:19 所属栏目:Linux 来源:网络整理
导读:我遇到了Linux futex系统调用(FUTEX_WAIT操作)的问题,有时候看似无故返回.文档指定了可能导致它提前返回的某些条件(没有FUTEX_WAKE)但这些都涉及非零返回值:如果futex地址处的值不匹配则为EAGAIN,ETIMEDOUT用于定时等待超时,EINTR在被中断时a(非重启)信号等

我遇到了Linux futex系统调用(FUTEX_WAIT操作)的问题,有时候看似无故返回.文档指定了可能导致它提前返回的某些条件(没有FUTEX_WAKE)但这些都涉及非零返回值:如果futex地址处的值不匹配则为EAGAIN,ETIMEDOUT用于定时等待超时,EINTR在被中断时a(非重启)信号等.但是我看到返回值为0.除了FUTEX_WAKE或者set_tid_address指针指向futex的线程终止之外,还可能导致FUTEX_WAIT以返回值返回0?

如果它有用,我正在等待的特定futex是线程tid地址(由克隆系统调用CLONE_CHILD_CLEARTID设置),并且线程没有终止.我的(显然不正确)假设FUTEX_WAIT操作返回0只能在线程终止导致程序逻辑出现严重错误时发生,我已经通过循环和重试来修复,即使它返回0,但现在我很好奇它发生的原因.

这是一个最小的测试用例:

#define _GNU_SOURCE
#include 

让它运行一段时间,它应该最终以Killed(SIGKILL)终止,这只有在FUTEX_WAIT返回时线程仍然存在时才有可能.

在任何人开始假设这只是内核在完成销毁线程之前唤醒futex(实际上这可能发生在我的最小测试用例中),请注意在我的原始代码中,我实际观察到在线程中运行的用户空间代码好在FUTEX_WAIT返回后.

最佳答案
您是否可以处理父母或子女作业是否先完成之间的竞争状况?您可以通过在foo()的开头或克隆()之后立即进行小睡眠来调查此理论,以确定事件的强制排序是否掩盖了问题.我不建议以这种方式修改任何东西,但它可能有助于调查.也许futex还没准备好等待孩子进一步完成初始化,但是父母的克隆有足够的时间返回给调用者?

具体来说,CLONE_VFORK选项的出现似乎意味着这是一个危险的场景.您可能需要一种双向信号机制,以便孩子向父母发出信号,告知其已经足够远以至于等待孩子是安全的.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读