【问题标题】:Is synchronization faster on the same physical CPU core?在同一个物理 CPU 内核上同步是否更快?
【发布时间】:2021-04-25 22:36:58
【问题描述】:
我有一个问题。如果一个线程修改了一个变量,同一个物理内核(不同的超线程内核)上的线程会比其他内核更早地看到修改吗?或者它必须等到所有其他核心都看到它?
我一直试图将两个线程固定在同一个物理内核上,但性能下降。我知道这是因为两个核心共享大量资源。但在同步方面。将线程放在同一个物理内核上会有帮助吗?
谢谢!
【问题讨论】:
标签:
multithreading
synchronization
hyperthreading
mesi
【解决方案1】:
答案取决于平台(尤其是底层架构)。话虽如此,在(主流)x86-64 架构上,共享相同内核的线程比不同内核甚至不同套接字上的线程通信更快。一个主要原因是两个线程通常会共享相同的 L1 缓存(如果不是,则共享 L2 缓存)。这样,一个线程就可以直接读取对方刚刚写的内容。此外,由于同时多线程(在 Intel CPU 上称为超线程)减少了通信延迟(没有调度量子等待),线程通常可以并行运行。
同时,不同内核上的线程必须通过(慢)总线进行通信或使用 L3 缓存共享数据(比 L1/L2 慢得多)。
那么您的工作负载会受到通信(延迟或吞吐量)的限制,通常最好将线程彼此靠近(即在同一个核心上)。当每个内核的线程数超过硬件线程数时,由于抢占式多任务处理,性能会下降。当工作负载受计算限制时,最好将它们放在单独的内核上。请注意,在现代 x86 处理器上,工作在同一内核上的线程甚至可以在指令级共享计算资源 (ALU)。