【发布时间】:2011-06-24 04:30:44
【问题描述】:
在分析应用程序时(使用 dotTrace),我注意到一件非常奇怪的事情。我使用了“墙上时间”测量,理论上这应该意味着所有线程都会运行相同的时间。
但事实并非如此:某些线程(实际上是我最感兴趣的线程)显示的总时间大约是其他线程的 2 倍。例如,分析运行了 230 秒,大多数 线程报告在线程中花费了 230 秒,但 5 个线程仅显示 100-110 秒。这些不是线程池线程,它们肯定是在分析开始之前创建和启动的。
这是怎么回事?
更新我将添加更多可能相关或不相关的信息。有问题的应用程序(它是一个游戏服务器)有大约 20-30 个持续运行的线程。大多数线程都遵循简单的模式:它们检查传入队列的工作,如果有的话就开始工作。线程函数的代码如下所示:
while(true){
if(TryDequeueWork()){ // if queue is not empty
DoWork(); // do whatever is was on top
}else{
m_WaitHandle.WaitOne(MaxTimeout); // m_WaitHandle gets signaled when work is added to queue
}
}
显示奇怪时间的线程是这样的,除了它们服务于多个队列,像这样:
while(true){
bool hasAnyWork=false;
foreach(var queue in m_Queues){
if(queue.TryDequeueWork()){
hasAnyWork=true;
DoWork();
}
}
if(!hasAnyWork){
m_WaitHandle.WaitOne(MaxTimeout);
}
}
奇怪的线程除了日志之外不做任何 IO。其他不奇怪的线程也进行日志记录。在分析器中报告等待 WaitHandle 所花费的时间;实际上,一些不奇怪的线程几乎将所有时间都花在等待上(因为它们从来没有任何工作)。
应用程序在 8 核虚拟机(VPS 主机)上运行。我不知道那里用的是什么物理处理器。
【问题讨论】:
-
我今天的疯狂猜测:报告仅显示用户模式时间,而数量较少的线程正在花费时间等待内核对象。 (即 I/O)
-
我和一位同事在分析在超线程 CPU (Sandy Bridge) 上收集的 ETW 跟踪时发现了一些奇怪的结果。你的 CPU 是超线程的吗?