为什么 C# struct 实例方法在 struct 字段上调用实例方法首先检查 ecx？答案

【问题标题】：Why do C# struct instance methods calling instance methods on a struct field first check ecx?为什么 C# struct 实例方法在 struct 字段上调用实例方法首先检查 ecx？
【发布时间】：2016-06-18 01:14:41
【问题描述】：

为什么以下 C# 方法 CallViaStruct 的 X86 包含 cmp 指令？

struct Struct {
    public void NoOp() { }
}
struct StructDisptach {

    Struct m_struct;

    [MethodImpl(MethodImplOptions.NoInlining)]
    public void CallViaStruct() {
        m_struct.NoOp();
        //push        ebp  
        //mov         ebp,esp  
        //cmp         byte ptr [ecx],al  
        //pop         ebp  
        //ret
    }
}

这是一个更完整的程序，可以用各种（发布）反编译作为 cmets 进行编译。我预计ClassDispatch 和StructDispatch 类型中CallViaStruct 的X86 是相同的，但是StructDispatch（上面提取）中的版本包括cmp 指令，而另一个没有。

看来cmp 指令是一个习惯用法，用于确保变量不为空；取消引用值为 0 的寄存器会触发一个 av，它会变成一个 NullReferenceException。但是在StructDisptach.CallViaStruct 中，鉴于ecx 指向一个结构，我无法想象它为空的方法。

更新：我希望接受的答案将包括导致 NRE 被 StructDisptach.CallViaStruct 抛出的代码，方法是让 cmp 指令取消引用归零的 ecx 寄存器。请注意，通过设置m_class = null 可以轻松使用CallViaClass 方法中的任何一个，而使用ClassDisptach.CallViaStruct 则无法做到这一点，因为没有cmp 指令。

using System.Runtime.CompilerServices;

namespace NativeImageTest {

    struct Struct {
        public void NoOp() { }
    }

    class Class {
        public void NoOp() { }
    }

    class ClassDisptach {

        Class m_class;
        Struct m_struct;

        internal ClassDisptach(Class cls) {
            m_class = cls;
            m_struct = new Struct();
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaClass() {
            m_class.NoOp();
            //push        ebp  
            //mov         ebp,esp  
            //mov         eax,dword ptr [ecx+4]  
            //cmp         byte ptr [eax],al  
            //pop         ebp  
            //ret  
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaStruct() {
            m_struct.NoOp();
            //push        ebp
            //mov         ebp,esp
            //pop         ebp
            //ret
        }
    }

    struct StructDisptach {

        Class m_class;
        Struct m_struct;

        internal StructDisptach(Class cls) {
            m_class = cls;
            m_struct = new Struct();
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaClass() {
            m_class.NoOp();
            //push        ebp  
            //mov         ebp,esp  
            //mov         eax,dword ptr [ecx]  
            //cmp         byte ptr [eax],al  
            //pop         ebp  
            //ret  
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaStruct() {
            m_struct.NoOp();
            //push        ebp  
            //mov         ebp,esp  
            //cmp         byte ptr [ecx],al  
            //pop         ebp  
            //ret  
        }
    }

    class Program {
        static void Main(string[] args) {
            var classDispatch = new ClassDisptach(new Class());
            classDispatch.CallViaClass();
            classDispatch.CallViaStruct();

            var structDispatch = new StructDisptach(new Class());
            structDispatch.CallViaClass();
            structDispatch.CallViaStruct();
        }
    }
}

更新：事实证明可以在非虚拟函数上使用callvirt，该函数具有对 this 指针进行空检查的副作用。虽然CallViaClass 调用站点就是这种情况（这就是我们在那里看到空检查的原因）StructDispatch.CallViaStruct 使用call 指令。

.method public hidebysig instance void  CallViaClass() cil managed noinlining
{
  // Code size       12 (0xc)
  .maxstack  8
  IL_0000:  ldarg.0
  IL_0001:  ldfld      class NativeImageTest.Class NativeImageTest.StructDisptach::m_class
  IL_0006:  callvirt   instance void NativeImageTest.Class::NoOp()
  IL_000b:  ret
} // end of method StructDisptach::CallViaClass

.method public hidebysig instance void  CallViaStruct() cil managed noinlining
{
  // Code size       12 (0xc)
  .maxstack  8
  IL_0000:  ldarg.0
  IL_0001:  ldflda     valuetype NativeImageTest.Struct NativeImageTest.StructDisptach::m_struct
  IL_0006:  call       instance void NativeImageTest.Struct::NoOp()
  IL_000b:  ret
} // end of method StructDisptach::CallViaStruct

更新：有人建议 cmp 可能会在调用站点未捕获 null 此指针的情况下进行捕获。如果是这种情况，那么我希望 cmp 在方法的顶部出现一次。但是，每次调用 NoOp 时它会出现一次：

struct StructDisptach {

    Struct m_struct;

    [MethodImpl(MethodImplOptions.NoInlining)]
    public void CallViaStruct() {
        m_struct.NoOp();
        m_struct.NoOp();
        //push        ebp  
        //mov         ebp,esp  
        //cmp         byte ptr [ecx],al  
        //cmp         byte ptr [ecx],al  
        //pop         ebp  
        //ret  
    }
}

【问题讨论】：

如果您从StructDisptach 中删除Class 字段然后调用unsafe { ((StructDisptach*)0)->CallViaStruct(); }，那么在cmp 上触发NRE 很容易，但我想使用不安全的上下文是作弊；）跨度>
哈哈！很好的主意！然而，JIT 是否会遇到麻烦来捕获这种情况似乎有点令人怀疑——尤其是考虑到类字段。即使这就是原因（并且看到了一个未优化的案例），如果我两次致电NoOp 我会收到两次支票。那么问题来了，第二个是干什么用的？
是的，这就是为什么我说它会作弊 - 如果我知道你打赌我会告诉你的答案 :) 它可能只是 JIT 中的一个疏忽据我所知，因为我想不出任何更好的解释来解释cmp 在这里：-\
您的反汇编样本是来自调试版本吗？这可能是编译器/JITer 的方式，至少留下一条可以说是“属于”您的无操作函数的指令，以便您可以逐行遍历源代码。
原来指令是因为ldflda 而不是call。使用 ildasm/ilasm 重写方法表明情况确实如此。所以在我看来，它可以被优化掉。但是，在不平凡的情况下，下一个问题是当字段位于结构中时，ldfda 是否需要 cmp 指令？

标签： c# x86 jit

【解决方案1】：

简短回答：JITter 无法证明该结构没有被指针引用，并且必须在每次调用 NoOp() 时至少取消引用一次以确保行为正确。

长答案：结构很奇怪。

JITter 是保守的。在可能的情况下，它只能以能够绝对确定产生正确行为的方式优化代码。 “大部分正确”还不够好。

所以现在这里有一个示例场景，如果 JITter 优化了取消引用，就会中断。考虑以下事实：

首先：请记住，结构可以（并且确实！）存在于 C# 之外——例如，指向 StructDispatch 的指针可能来自非托管代码。正如卢卡斯所指出的，您可以使用指针作弊；但 JITter 无法确定您没有在代码中的其他位置使用指向 StructDispatch 的指针。

第二：请记住，在非托管代码中，这是结构首先存在的最大原因，所有的赌注都没有。仅仅因为您只是从内存中读取一个值并不意味着它会是相同的值，甚至在您下次读取相同的确切地址时成为一个值。线程和多处理实际上可以在下一个时钟滴答声中改变该值，更不用说像 DMA 这样的非 CPU 参与者了。并行线程可以 VirtualFree() 包含该结构的页面，并且 JITter 必须防止这种情况发生。你要求从内存中读取，所以你从内存中读取。我的猜测是，如果你启动优化器，它会删除其中一个 cmp 指令，但我非常怀疑它会删除这两个指令。

第三：异常也是真实的代码。 NullReferenceException 不一定会停止程序；它可以被抓住和处理。这意味着从 JITter 的角度来看，NRE 更像是一个 if 语句而不是 goto：它是一种条件分支，必须在每次内存取消引用时处理和考虑。

所以现在把这些部分放在一起。

JITter 不知道（也无法知道）您没有使用不安全的 C# 或其他地方的外部源来与 StructDispatch 的内存进行交互。它不会产生 CallViaStruct() 的单独实现，一种用于“可能安全的 C# 代码”，另一种用于“可能有风险的外部代码”；它总是为可能存在风险的场景生成保守版本。这意味着它不能完全切断对 NoOp() 的调用，因为不能保证 StructDispatch 没有被映射到甚至没有被分页到内存中的地址。

它知道 NoOp() 是空的并且可以省略（调用可以消失），但它至少必须通过戳结构的内存地址来模拟 ldfla，因为有可能是代码，具体取决于提出的 NRE。内存取消引用就像 if 语句：它们会导致分支，而未能导致分支可能会导致程序损坏。微软不能做出假设，只是说，“你的代码不应该依赖它。”想象一下，如果 NRE 没有被写入企业的错误日志，只是因为 JITter 认为它不是一个“足够重要”的 NRE，因此无法首先触发，那么就会给 Microsoft 打一个愤怒的电话。 JITter 别无选择，只能取消引用该地址至少一次以确保语义正确。

类没有这些问题；类没有强制的记忆怪异。但是，结构体更古怪。

【讨论】：

在最后一段中，关于编译器可能会或可能不会假设的内容，这取决于是否定义了通过空指针访问结构。如果它是未定义的行为，编译器编写者可以（并且经常）不只是忽略人们通常认为的“健全性检查”，甚至还可以删除你明确放在那里的那些因为允许编译器假设 UB 不会发生。例如，请参阅 this lovely fellow 抱怨 GCC 删除了对签名溢出（C 中的 UB）的检查。
对于像 C 这样在规范中有未定义行为的语言来说，这是一个有效的观点。但是 C# 不应该具有未定义的行为（在能够为典型编程语言定义语义的范围内）。这就导致了这种问题：一旦您必须为所有操作定义行为，当它们不方便或可能导致代码变慢时，您就不能忽略任何这些行为。 C# 必须取消引用该内存，因为 NRE 是预期的，通过空指针访问内存的定义明确的行为，并且删除 NRE 将违反规范。
如果不检查我不知道的规范，但是结构在未装箱时应该始终为非空，因此结构的非虚拟函数不应该需要检查它的“这个”。事实上，即使您使用不安全代码创建MyStruct* p = null;，然后尝试将*p 作为MyStruct 类型的变量返回，NRE 也应该出现在*p，而不是稍后。这同样适用于拆箱；尝试将 null 对象转换为变量 MyStruct s 应该引发 NRE，而不是稍后在调用 s 的成员时。
您仍然假设托管代码装箱规则始终适用。如果我声明一个接受指向结构的指针的不安全方法，并将对该方法的调用与来自对非托管 C 函数的调用的指针结合起来，则对该指针没有任何形式的保证。它可能在托管堆上。它可能位于非托管堆上。它可能是 C NULL。它可以指向内存映射 I/O。它可以是任何东西，而 JITter 必须保守地防范这些可能性。
正确。 struct 方法不能确定this 是一个安全值，因此它会探测内存以让CPU 中断触发（如有必要）以生成NRE。我刚刚测试了你描述的静态版本，整个调用链都按预期省略了，因为 JITter 可以证明调用什么都不做。