将32位阵列复制到16位阵列的最快方法是什么?
发布时间:2020-12-16 09:46:26 所属栏目:百科 来源:网络整理
导读:将32位阵列复制到16位阵列的最佳方法是什么? 我知道“memcpy”使用硬件指令.但是有没有一个标准函数来复制每个元素中“更改大
将32位阵列复制到16位阵列的最佳方法是什么?
我知道“memcpy”使用硬件指令.但是有没有一个标准函数来复制每个元素中“更改大小”的数组? 我使用gcc作为armv7(皮质A8). uint32_t tab32[500]; uint16_t tab16[500]; for(int i=0;i<500;i++) tab16[i]=tab32[i]; 解决方法
在带有Neon指令集的ARM cortex A8上,最快的方法使用交错读/写指令:
vld2.16 {d0,d1},[r0]! vst1.16 {d0},[r1]! 或饱和指令将32位整数的向量转换为16位整数的向量. 这两种方法都可以在c中使用gcc intrinsic. gcc也可以自动向量化一个精心编写的c代码,只使用这些特定的指令.这基本上要求与这些指令和c代码的所有副作用一一对应. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |