加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

如何使用C中的SSE内在函数计算向量点积

发布时间:2020-12-16 03:21:40 所属栏目:百科 来源:网络整理
导读:我试图将两个向量相乘,一个向量的每个元素乘以另一个向量的同一索引中的元素.然后我想要求结果矢量的所有元素得到一个数字.例如,向量{1,2,3,4}和{5,6,7,8}的计算将如下所示: 1 * 5 2 * 6 3 * 7 4 * 8 本质上,我正在采取两个向量的点积.我知道有一个SSE命令
我试图将两个向量相乘,一个向量的每个元素乘以另一个向量的同一索引中的元素.然后我想要求结果矢量的所有元素得到一个数字.例如,向量{1,2,3,4}和{5,6,7,8}的计算将如下所示:

1 * 5 2 * 6 3 * 7 4 * 8

本质上,我正在采取两个向量的点积.我知道有一个SSE命令来执行此操作,但该命令没有与之相关联的内在函数.在这一点上,我不想在我的C代码中编写内联汇编,所以我只想使用内在函数.这似乎是一个常见的计算方法,所以我对自己感到惊讶,我在Google上找不到答案.

注意:我正在针对支持SSE 4.2的特定微架构进行优化.

谢谢你的帮助.

解决方法

GCC(至少版本4.3)包括< smmintrin.h>具有SSE4.1级内在功能,包括单精度和双精度点产品:
_mm_dp_ps (__m128 __X,__m128 __Y,const int __M);
_mm_dp_pd (__m128d __X,__m128d __Y,const int __M);

作为旧处理器的回退,您可以使用此算法创建向量a和b的点积:

r1 = _mm_mul_ps(a,b);
r2 = _mm_hadd_ps(r1,r1);
r3 = _mm_hadd_ps(r2,r2);
_mm_store_ss(&result,r3);

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读