arm – 加载8bit uint8_t作为uint32_t?
我的图像处理项目适用于灰度图像.我有ARM Cortex-A8处理器平台.我想利用NEON.
我有一个灰度图像(考虑下面的例子),在我的alogorithm中,我只需要添加列. 如何将4个uint32_t并行加载到128位NEON寄存器中,将8个8位像素值并行加载uint8_t?我必须使用什么内在的东西? 我的意思是: 我必须将它们加载为32位,因为如果你仔细观察,我做255 255的那一刻是512,它不能保存在8位寄存器中. 例如 255 255 255 255 ......... (640 pixels) 255 255 255 255 255 255 255 255 255 255 255 255 . . . . . (480 pixels)
我建议您花一点时间了解SIMD在ARM上的工作原理.看着:
看一眼: > http://blogs.arm.com/software-enablement/161-coding-for-neon-part-1-load-and-stores/ 让你入门然后,您可以使用内联汇编程序或domen推荐的相应ARM内在函数来实现您的SIMD代码. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- active-directory – 在Windows网络中部署打印机的最佳实践
- OpenProcess:仅在Windows 8.1上访问被拒绝错误
- 如何连接到Azure Windows VM并使用PowerShell运行远程脚本?
- windows – Win bat文件:如何在for循环中向变量添加前导零
- api – Windows 7中的Cards.dll
- windows – 无法在注册表中设置DefaultIcon
- windows – 如何使用当前文件夹的管理员权限运行PowerShell
- 将本地化资源.DLL嵌入到C#中的可执行文件中?
- Windows Phone 8 – 防止Windows Phone 8上的自动屏幕锁定
- ARM cortex-M3 uint_fast32_t vs uint32_t