缓存 – Linux是否使用x86 CPU的PCID功能进行TLB？如果没有,为什

发布时间：2020-12-13 19:49:00 所属栏目：Linux 来源：网络整理

导读：我写了一个内核模块来检查CR4.PCIDE,它没有设置.为什么 Linux不使用这样的功能来降低由于TLB无效和缓存污染导致的性能下降？解决方法注意：我不是Linux开发人员对于英特尔的“进程上下文标识符”,限制为4096个ID.这意味着当有超过4096个进程需要管理它们(

我写了一个内核模块来检查CR4.PCIDE,它没有设置.为什么 Linux不使用这样的功能来降低由于TLB无效和缓存污染导致的性能下降？

解决方法

注意：我不是Linux开发人员

对于英特尔的“进程上下文标识符”,限制为4096个ID.这意味着当有超过4096个进程需要管理它们(例如,可能会做一个“最近最少使用”的事情,以便如果当前没有ID的进程需要执行,那么该ID将从一些其他过程和重用).

另一件事就是多CPU系统上的“TLB击落”.这些可能有点贵,所以人们做点技巧来避免它们.例如,如果一个进程只有一个线程,那么它只能在一个CPU上运行,并且您知道不需要向其他CPU发送IPI(中断它们并要求他们执行“TLB shotdown”).一旦你开始使用PCID,你就不能确定其他CPU还没有TLB条目,也不能做这些技巧来避免“TLB击倒”.这也意味着(理论上说,对于PCID支持不佳),您从PCID获得的性能可能会低于由于不必要的TLB拍摄和ID管理开销而损失的性能,导致净损失.

大多数我所说的是,添加对PCID的支持有点复杂(这不是你可以在CR4中设置一个标志,而是忘记它).你必须做一些研究(实验,原型,基准测试)来确定最有效的实现方法.对于一个大/复杂/旧的内核(如Linux),它会变得更加复杂,因为你必须小心,不要意外地打扰别的东西.另一件事就是这个功能是比较新的(如果我记得正确的话,它只存在几年),并且很多CPU都不支持(比如任何一个老一点,还有AMD的任何东西).

基本上,我认为它归结为“时间与效益”(或者,在有限数量的CPU上没有足够的时间进行小的性能改进).

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!