优化 iOS 应用的迭代 for 循环 [关闭]答案

【问题标题】：Optimizing an iterative for loop for iOS app [closed]优化 iOS 应用的迭代 for 循环 [关闭]
【发布时间】：2016-04-26 19:18:25
【问题描述】：

这听起来有点愚蠢；但由于我是编程新手，我想你们中的一些人可能会在这方面帮助我。我有以下 sn-p 代码：

    for k in 0..<64{
        for i in 0..<14{
            for j in 0..<14{
                for di in 0..<5{
                    for dj in 0..<5{
                        for q in 0..<32{
                            A2[0][j][i][k] = A2[0][j][i][k] + T2[0][j+dj+1][i+di+1][q]*W2[k][q][dj][di]

                        }
                    }
                }
            }
        }
    }

在这里可以看到 for 循环运行了 64*14*14*5*5*32 = 10035200 次。当我查看 Instruments 的性能时，我发现这部分代码占用了 57.4% 的运行性能时间。我在下面发布了一张快照。

有没有办法优化它？我想把它转换成一维数组并进行计算；但这只会使代码在可读性方面更加令人困惑。

编辑：

 var A2: [[[[Float]]]] = [[[[Float]]]](count: 1, repeatedValue: [[[Float]]](count: 14, repeatedValue: [[Float]](count: 14, repeatedValue: [Float](count: 64, repeatedValue: Float()))))

 var T2: [[[[Float]]]] = [[[[Float]]]](count: 1, repeatedValue: [[[Float]]](count: 20, repeatedValue: [[Float]](count: 20, repeatedValue: [Float](count: 32, repeatedValue: Float()))))


    for k in 0..<32{
        for i in 0..<14{
            for j in 0..<14{
                T2[0][i+3][j+3][k] = HP1[0][i][j][k]
            }
        }
    }

HP1 是先前计算的数组； W2是之前计算出来的，上面的计算也是做相应的。

【问题讨论】：

好像代码还没有混淆？首先，这些计算可以在后台线程上完成吗？如果是这样，请将其转储到后台线程并继续移动。如果你绝对必须做这个疯狂的事情并且性能是重中之重，那么牺牲可读性使其尽可能优化。更少的循环（通常）更快。
你会如何优化它？
你能描述一下这个问题吗，这里到底计算了什么？
我在 EDIT 中发布了更详细的代码版本。我希望这会有所帮助。
我发现在使用 libdispatch 的 dispatch_apple() 时性能得到了巨大的提升。然而，它是在 Mac 上。

标签： ios arrays swift optimization instruments

【解决方案1】：

只是一个简单的开始：您有 i、j 和 k 的三个循环，然后您有三个内部循环，您可以在其中将内容添加到同一个元素 A2 [0][i][j][k]。所以你拿这个：

for di in 0..<5{
    for dj in 0..<5{
        for q in 0..<32{
            A2[0][j][i][k] = A2[0][j][i][k] + T2[0][j+dj+1][i+di+1][q]*W2[k][q][dj][di]
         }
    }
}

并将其更改为：

let sum = A2[0][j][i][k]
for di in 0..<5{
    for dj in 0..<5{
        for q in 0..<32{
            sum += T2[0][j+dj+1][i+di+1][q]*W2[k][q][dj][di]
         }
    }
}
A2[0][j][i][k] = sum

现在我假设您不止一次这样做（因为 1000 万并不多），所以也许告诉我们您如何多次调用它 - 也许这就是您可以节省一些东西的地方。

顺便说一句。对于这种问题，您可能会发现调试版本和发布版本之间存在巨大差异。

如果您可以重新排列数组 W2，以便您可以将其作为 W2[k][dj][di][q] 访问，那可能会有很大帮助。

【讨论】：

感谢您的回复。我现在就试试这个。是的，调试版本和发布版本之间存在差异。发布构建比调试慢。是这样吗？
发布版本应该更快。你是用-OFast编译吗？
发布版本比较慢？这很奇怪。
我的错。发布构建更快！但是，当我在 iPhone 模拟器和 iPhone 手机中运行代码时，会有很大的不同。