加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

c – 使用SIMD的常量浮点数

发布时间:2020-12-16 04:53:00 所属栏目:百科 来源:网络整理
导读:我一直在尝试使用microsoft的sse内在函数优化一些代码.优化我的代码时最大的问题之一是每当我想使用常量时就会发生LHS.似乎有一些关于生成某些常量( here和 here – section 13.4)的信息,但它的所有程序集(我宁愿避免). 问题是当我尝试用内在函数实现相同的
我一直在尝试使用microsoft的sse内在函数优化一些代码.优化我的代码时最大的问题之一是每当我想使用常量时就会发生LHS.似乎有一些关于生成某些常量( here和 here – section 13.4)的信息,但它的所有程序集(我宁愿避免).

问题是当我尝试用内在函数实现相同的东西时,msvc抱怨不兼容的类型等.有没有人知道使用内在函数的任何等效技巧?

示例 – 生成{1.0,1.0,1.0}

//pcmpeqw xmm0,xmm0 
__m128 t = _mm_cmpeq_epi16( t,t );

//pslld xmm0,25 
_mm_slli_epi32(t,25);

//psrld xmm0,2
return _mm_srli_epi32(t,2);

这会产生一堆关于不兼容类型的错误(__m128 vs _m128i).我对此很陌生,所以我很确定我错过了一些明显的东西.有人可以帮忙吗?

tldr – 如何使用ms intrinsics生成一个填充了单精度常量浮点数的__m128 vec?

谢谢阅读 :)

解决方法

简单地使用 _mm_castsi128_ps将__m128i转换为__m128.此外,第二行应该是
t = _mm_slli_epi32(t,25)

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读