【发布时间】:2011-11-11 01:16:32
【问题描述】:
试图评估嵌入式架构的性能提升我试图搜索可以在 Core 2 和 Core i7 架构的单个内核上在一个周期内执行的浮点乘法的数量,但找不到快速的答案。不幸的是,我不熟悉 ISA,所以我无法通过查看相应的说明来判断这一点。我认为这将是某种 SIMD 指令。有什么想法吗?
【问题讨论】:
标签: floating-point parallel-processing core simd cpu-architecture
试图评估嵌入式架构的性能提升我试图搜索可以在 Core 2 和 Core i7 架构的单个内核上在一个周期内执行的浮点乘法的数量,但找不到快速的答案。不幸的是,我不熟悉 ISA,所以我无法通过查看相应的说明来判断这一点。我认为这将是某种 SIMD 指令。有什么想法吗?
【问题讨论】:
标签: floating-point parallel-processing core simd cpu-architecture
有一件事:Core 2 不是英特尔的最新架构。那就是桑迪桥。
Core 2 和 Core i7 Nehalem,可以维持 1 SSE 乘法/周期。每条 SSE 指令最多可以处理 4 个单精度或 2 个双精度。这就是 每个周期 2 DP 或 4 SP 浮点乘法。
Core i7 Sandy Bridge 可以维持 1 AVX 乘法/循环。 AVX 是 SSE 的两倍。这就是 每个周期 4 DP 或 8 SP 浮点乘法。
【讨论】: