【问题标题】:Comparison operator performance <= against !=比较运算符性能 <= 对 !=
【发布时间】:2013-04-30 22:20:19
【问题描述】:

让我们从说明代码可读性胜过微优化开始,我们宁愿把它留给编译器。这只是一个奇怪的案例,其中的细节似乎对一般性建议很有趣

所以我在搞乱一个素数生成器函数,并想出了一个奇怪的行为,其中“!=”人们认为是最有效的,实际上效率最低,而“

C#

private static void Main(string[] args) {
  long totalTicks = 0;
  for (int i = 0; i < 100; ++i) {
    var stopWatch = Stopwatch.StartNew();
    PrintPrimes(15000);
    totalTicks += stopWatch.ElapsedTicks;
  }
  Console.WriteLine("\n\n\n\nTick Average: {0}", totalTicks / 100);
  Console.Read();
}

private static void PrintPrimes(int numberRequired) {
  if (numberRequired < 1)
    return;
  Console.Write("{0}\t", 2);
  int primeTest = 3;
  /****** UPDATE NEXT TWO LINES TO TEST FOR != *****/
  int numPrimes = 2;  // set numPrimes = 1 for !=
  while (numPrimes <= numberRequired) {  // switch <= to !=
    if (IsPrime(primeTest)) {
      Console.Write("{0}\t", primeTest);
      ++numPrimes;
    }
    primeTest += 2;
  }
}

private static bool IsPrime(int test) {
  for (int i = 3; i * i <= test; i = 2 + i)
    if (test % i == 0)
      return false;
  return true;
}

输出:

<= 1319991
!= 1321251

在 C++ 中类似(在不同的机器上)

include <cstddef>
#include <limits>

int main() {
  for(size_t i(0) ; i <= 10000000000 ; ++i);
}

输出:

<=

real        0m16.538s
user        0m16.460s
sys        0m0.000s
~ [master] $ vim d.cc

!=

real        0m16.860s
user        0m16.780s
sys        0m0.000s

循环运行相同的次数。 &lt;= 是否有任何不适用于 != 的优化,或者是一些奇怪的 cpu 行为?

【问题讨论】:

  • C# 和 C++ 程序做的事情不一样,你不能比较它们!您还必须考虑在程序运行时计算机在后台运行的其他内容,如果运行 heave 进程,那么您的进程也会变慢。
  • 实际上我确实运行了一个类似的克隆,在 c++ 上生成素数,它也给出了相同的输出行为。我只是想证明这个,因为它似乎与质数生成中的一些怪异无关。我也会添加其他 c++ 代码
  • 您应该首先确保 C# 和 C++ 程序执行相同的操作。那么在程序的所有运行过程中运行环境都是相同的。然后多次运行所有程序,并在得出任何类型的结论之前平均时间。
  • 我看不出性能上有什么不同。你知道random variationsignificance testing吗?
  • @JoachimPileborg:尽管 C# 和 C++ 程序确实不同,但似乎没有人(除了你)在比较它们。他将!= 与C# 中的&lt; 进行比较,并将!= 与C++ 中的&lt; 进行比较。我没有看到 C# 和 C++ 之间的任何比较。

标签: c# c++ wpf performance operators


【解决方案1】:

假设结果是相同的迭代次数,那么存在差异是没有意义的。

如果我们假设它是 x86 处理器,!= 会变成 jne(或 je,取决于“它是”或“它不是”跳到哪一侧 [1])。 &lt;= 将执行 jlejgt 取决于循环的方式。虽然指令不同,但其他处理器具有相同类型的指令。

我怀疑您有测量错误。 16 秒中小于 0.2 秒的差异并不是很大的差异,您可能只是在那个时候有更多的网络数据包、硬盘中断或一些后台进程在运行。

[1] 例如,具有一组固定迭代的for 循环通常只有一个“如果不是真的,则跳转到循环的开头”,这同样适用于while 循环。

我刚刚在我的机器上运行了这个:

bool IsPrime(int test) {
  for (int i = 3; i * i <= test; i = 2 + i)
    if (test % i == 0)
      return false;
  return true;
}

void PrintPrimes(int numberRequired) {
  if (numberRequired < 1)
    return;
  int primeTest = 3;
  /****** UPDATE NEXT TWO LINES TO TEST FOR != *****/
  int numPrimes = 2;  // set numPrimes = 1 for !=
  while (numPrimes != numberRequired) {  // switch <= to !=
    if (IsPrime(primeTest)) {
      ++numPrimes;
    }
    primeTest += 2;
  }
}

int  main() 
{
  long totalTicks = 0;
  for (int i = 0; i < 100; ++i) {
    PrintPrimes(15000);
  }
}

使用g++ -O3 primes.cpp 编译。在主循环中使用!=&lt;= 之间的区别并不明显。 != 最快的时间是 3.326s,&lt;= 是 3.329,!= 最慢的时间是 3.332,&lt;= 是 3.335s。之前在我的机器上运行过许多基准测试,我知道毫秒数字没有意义,所以我会说两者都需要 3.33 秒。

只是为了确认:

--- primesne.s  2013-04-30 23:52:10.840513380 +0100
+++ primesle.s  2013-04-30 23:52:35.457639603 +0100
@@ -46,7 +46,7 @@
 .L3:
    addl    $2, %esi
    cmpl    $15000, %edi
-   jne .L10
+   jle .L10
    subl    $1, %r9d
    jne .L2
    xorl    %eax, %eax

“不等于”和“小于或等于”之间的全部区别在于 jnejle 指令 - 这是代码的两个变体的 g++ 的汇编器输出 - 那就是来自diff 的全部输出。

【讨论】:

  • 认为这很清楚。这是有道理的
  • 确认一下,我也添加了编译器的汇编输出。
猜你喜欢
  • 2011-08-17
  • 1970-01-01
  • 1970-01-01
  • 2015-05-29
  • 1970-01-01
  • 1970-01-01
  • 2013-12-07
相关资源
最近更新 更多