ios – 我怎样才能将这个for循环向量化?

ios – 我怎样才能将这个for循环向量化?,第1张

概述我有这个循环 void f1(unsigned char *data, unsigned int size) { unsigned int A[256] = {0u}; for (register unsigned int i = 0u; i < size; i++) { ++A[data[i]]; } ... 有没有办法手动矢量化? 由于 我有这个循环

voID f1(unsigned char *data,unsigned int size) {    unsigned int A[256] = {0u};          for (register unsigned int i = 0u; i < size; i++) {        ++A[data[i]];    }   ...

有没有办法手动矢量化?

解决方法 由于data [i]中的多个条目可能包含相同的值,因此我不知道如何将其简化为矢量化,因为可能存在竞争条件.矢量化的要点是每个元素独立于其他元素,因此可以并行计算.但是你的算法不允许这样做. “Vectorize”与“让自己走得更快”不是一回事.

你在这里构建的是一个直方图,iOS内置了优化的支持.您可以创建单通道单行图像,并使用vImageHistogramCalculation_Planar8,如下所示:

voID f1(unsigned char *data,unsigned int size) {    unsigned long A[256] = {0u};    vImage_Buffer src = { data,1,size,size };    vImage_Error err = vImageHistogramCalculation_Planar8(&src,A,kvImageDoNottile);    if (err != kvImageNoError) {        // error    }    ...}

但是要小心,假设这总是一场胜利.这取决于您的数据大小.进行函数调用非常昂贵,因此可能需要数百万字节的数据才能使其值得.如果你在较小的集合上计算它,那么一个简单的,编译器优化的循环通常是最好的方法.您需要在真实设备上对此进行分析,以确定哪个更快.

只需确保允许编译器通过启用-Ofast(Fastest,Aggressive)来应用所有矢量化优化.在这种情况下,这无关紧要,因为你的循环不能简单地进行矢量化.但通常,-Ofast允许编译器在可能略微增加代码大小的情况下应用矢量化优化(在默认的-Os下不允许). -Ofast还允许在执行浮点数学时有点邋so,所以不应该在需要严格的IEEE浮点一致性的情况下使用(但对于iOS应用来说几乎不是这种情况,所以-Ofast几乎总是正确的设置).

总结

以上是内存溢出为你收集整理的ios – 我怎样才能将这个for循环向量化?全部内容,希望文章能够帮你解决ios – 我怎样才能将这个for循环向量化?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://www.outofmemory.cn/web/1012461.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-22
下一篇 2022-05-22

发表评论

登录后才能评论

评论列表(0条)

保存