【问题标题】:Why do C# struct instance methods calling instance methods on a struct field first check ecx?为什么 C# struct 实例方法在 struct 字段上调用实例方法首先检查 ecx?
【发布时间】:2016-06-18 01:14:41
【问题描述】:

为什么以下 C# 方法 CallViaStruct 的 X86 包含 cmp 指令?

struct Struct {
    public void NoOp() { }
}
struct StructDisptach {

    Struct m_struct;

    [MethodImpl(MethodImplOptions.NoInlining)]
    public void CallViaStruct() {
        m_struct.NoOp();
        //push        ebp  
        //mov         ebp,esp  
        //cmp         byte ptr [ecx],al  
        //pop         ebp  
        //ret
    }
}

这是一个更完整的程序,可以用各种(发布)反编译作为 cmets 进行编译。我预计ClassDispatchStructDispatch 类型中CallViaStruct 的X86 是相同的,但是StructDispatch(上面提取)中的版本包括cmp 指令,而另一个没有。

看来cmp 指令是一个习惯用法,用于确保变量不为空;取消引用值为 0 的寄存器会触发一个 av,它会变成一个 NullReferenceException。但是在StructDisptach.CallViaStruct 中,鉴于ecx 指向一个结构,我无法想象它为空的方法。

更新:我希望接受的答案将包括导致 NRE 被 StructDisptach.CallViaStruct 抛出的代码,方法是让 cmp 指令取消引用归零的 ecx 寄存器。请注意,通过设置m_class = null 可以轻松使用CallViaClass 方法中的任何一个,而使用ClassDisptach.CallViaStruct 则无法做到这一点,因为没有cmp 指令。

using System.Runtime.CompilerServices;

namespace NativeImageTest {

    struct Struct {
        public void NoOp() { }
    }

    class Class {
        public void NoOp() { }
    }

    class ClassDisptach {

        Class m_class;
        Struct m_struct;

        internal ClassDisptach(Class cls) {
            m_class = cls;
            m_struct = new Struct();
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaClass() {
            m_class.NoOp();
            //push        ebp  
            //mov         ebp,esp  
            //mov         eax,dword ptr [ecx+4]  
            //cmp         byte ptr [eax],al  
            //pop         ebp  
            //ret  
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaStruct() {
            m_struct.NoOp();
            //push        ebp
            //mov         ebp,esp
            //pop         ebp
            //ret
        }
    }

    struct StructDisptach {

        Class m_class;
        Struct m_struct;

        internal StructDisptach(Class cls) {
            m_class = cls;
            m_struct = new Struct();
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaClass() {
            m_class.NoOp();
            //push        ebp  
            //mov         ebp,esp  
            //mov         eax,dword ptr [ecx]  
            //cmp         byte ptr [eax],al  
            //pop         ebp  
            //ret  
        }

        [MethodImpl(MethodImplOptions.NoInlining)]
        public void CallViaStruct() {
            m_struct.NoOp();
            //push        ebp  
            //mov         ebp,esp  
            //cmp         byte ptr [ecx],al  
            //pop         ebp  
            //ret  
        }
    }

    class Program {
        static void Main(string[] args) {
            var classDispatch = new ClassDisptach(new Class());
            classDispatch.CallViaClass();
            classDispatch.CallViaStruct();

            var structDispatch = new StructDisptach(new Class());
            structDispatch.CallViaClass();
            structDispatch.CallViaStruct();
        }
    }
}

更新:事实证明可以在非虚拟函数上使用callvirt,该函数具有对 this 指针进行空检查的副作用。虽然CallViaClass 调用站点就是这种情况(这就是我们在那里看到空检查的原因)StructDispatch.CallViaStruct 使用call 指令。

.method public hidebysig instance void  CallViaClass() cil managed noinlining
{
  // Code size       12 (0xc)
  .maxstack  8
  IL_0000:  ldarg.0
  IL_0001:  ldfld      class NativeImageTest.Class NativeImageTest.StructDisptach::m_class
  IL_0006:  callvirt   instance void NativeImageTest.Class::NoOp()
  IL_000b:  ret
} // end of method StructDisptach::CallViaClass

.method public hidebysig instance void  CallViaStruct() cil managed noinlining
{
  // Code size       12 (0xc)
  .maxstack  8
  IL_0000:  ldarg.0
  IL_0001:  ldflda     valuetype NativeImageTest.Struct NativeImageTest.StructDisptach::m_struct
  IL_0006:  call       instance void NativeImageTest.Struct::NoOp()
  IL_000b:  ret
} // end of method StructDisptach::CallViaStruct

更新:有人建议 cmp 可能会在调用站点未捕获 null 此指针的情况下进行捕获。如果是这种情况,那么我希望 cmp 在方法的顶部出现一次。但是,每次调用 NoOp 时它会出现一次:

struct StructDisptach {

    Struct m_struct;

    [MethodImpl(MethodImplOptions.NoInlining)]
    public void CallViaStruct() {
        m_struct.NoOp();
        m_struct.NoOp();
        //push        ebp  
        //mov         ebp,esp  
        //cmp         byte ptr [ecx],al  
        //cmp         byte ptr [ecx],al  
        //pop         ebp  
        //ret  
    }
}

【问题讨论】:

  • 如果您从StructDisptach 中删除Class 字段然后调用unsafe { ((StructDisptach*)0)->CallViaStruct(); },那么在cmp 上触发NRE 很容易,但我想使用不安全的上下文是作弊;)跨度>
  • 哈哈!很好的主意!然而,JIT 是否会遇到麻烦来捕获这种情况似乎有点令人怀疑——尤其是考虑到类字段。即使这就是原因(并且看到了一个未优化的案例),如果我两次致电NoOp 我会收到两次支票。那么问题来了,第二个是干什么用的?
  • 是的,这就是为什么我说它会作弊 - 如果我知道你打赌我会告诉你的答案 :) 它可能只是 JIT 中的一个疏忽据我所知,因为我想不出任何更好的解释来解释cmp 在这里:-\
  • 您的反汇编样本是来自调试版本吗?这可能是编译器/JITer 的方式,至少留下一条可以说是“属于”您的无操作函数的指令,以便您可以逐行遍历源代码。
  • 原来指令是因为ldflda 而不是call。使用 ildasm/ilasm 重写方法表明情况确实如此。所以在我看来,它可以被优化掉。但是,在不平凡的情况下,下一个问题是当字段位于结构中时,ldfda 是否需要 cmp 指令?

标签: c# x86 jit


【解决方案1】:

简短回答:JITter 无法证明该结构没有被指针引用,并且必须在每次调用 NoOp() 时至少取消引用一次以确保行为正确。


长答案:结构很奇怪。

JITter 是保守的。在可能的情况下,它只能以能够绝对确定产生正确行为的方式优化代码。 “大部分正确”还不够好。

所以现在这里有一个示例场景,如果 JITter 优化了取消引用,就会中断。考虑以下事实:

首先:请记住,结构可以(并且确实!)存在于 C# 之外——例如,指向 StructDispatch 的指针可能来自非托管代码。正如卢卡斯所指出的,您可以使用指针作弊;但 JITter 无法确定您没有在代码中的其他位置使用指向 StructDispatch 的指针。

第二:请记住,在非托管代码中,这是结构首先存在的最大原因,所有的赌注都没有。仅仅因为您只是从内存中读取一个值并不意味着它会是相同的值,甚至在您下次读取相同的确切地址时成为一个值。线程和多处理实际上可以在下一个时钟滴答声中改变该值,更不用说像 DMA 这样的非 CPU 参与者了。并行线程可以 VirtualFree() 包含该结构的页面,并且 JITter 必须防止这种情况发生。你要求从内存中读取,所以你从内存中读取。我的猜测是,如果你启动优化器,它会删除其中一个 cmp 指令,但我非常怀疑它会删除这两个指令。

第三:异常也是真实的代码。 NullReferenceException 不一定会停止程序;它可以被抓住和处理。这意味着从 JITter 的角度来看,NRE 更像是一个 if 语句而不是 goto:它是一种条件分支,必须在每次内存取消引用时处理和考虑。

所以现在把这些部分放在一起。

JITter 不知道(也无法知道)您没有使用不安全的 C# 或其他地方的外部源来与 StructDispatch 的内存进行交互。它不会产生 CallViaStruct() 的单独实现,一种用于“可能安全的 C# 代码”,另一种用于“可能有风险的外部代码”;它总是为可能存在风险的场景生成保守版本。这意味着它不能完全切断对 NoOp() 的调用,因为不能保证 StructDispatch 没有被映射到甚至没有被分页到内存中的地址。

它知道 NoOp() 是空的并且可以省略(调用可以消失),但它至少必须通过戳结构的内存地址来模拟 ldfla,因为有可能是代码,具体取决于提出的 NRE。内存取消引用就像 if 语句:它们会导致分支,而未能导致分支可能会导致程序损坏。微软不能做出假设,只是说,“你的代码不应该依赖它。”想象一下,如果 NRE 没有被写入企业的错误日志,只是因为 JITter 认为它不是一个“足够重要”的 NRE,因此无法首先触发,那么就会给 Microsoft 打一个愤怒的电话。 JITter 别无选择,只能取消引用该地址至少一次以确保语义正确。


类没有这些问题;类没有强制的记忆怪异。但是,结构体更古怪。

【讨论】:

  • 在最后一段中,关于编译器可能会或可能不会假设的内容,这取决于是否定义了通过空指针访问结构。如果它是未定义的行为,编译器编写者可以(并且经常)不只是忽略人们通常认为的“健全性检查”,甚至还可以删除你明确放在那里的那些因为允许编译器假设 UB 不会发生。例如,请参阅 this lovely fellow 抱怨 GCC 删除了对签名溢出(C 中的 UB)的检查。
  • 对于像 C 这样在规范中有未定义行为的语言来说,这是一个有效的观点。但是 C# 不应该具有未定义的行为(在能够为典型编程语言定义语义的范围内)。这就导致了这种问题:一旦您必须为所有操作定义行为,当它们不方便或可能导致代码变慢时,您就不能忽略任何这些行为。 C# 必须取消引用该内存,因为 NRE 是预期的,通过空指针访问内存的定义明确的行为,并且删除 NRE 将违反规范。
  • 如果不检查我不知道的规范,但是结构在未装箱时应该始终为非空,因此结构的非虚拟函数不应该需要 检查它的“这个”。事实上,即使您使用不安全代码创建MyStruct* p = null;,然后尝试将*p 作为MyStruct 类型的变量返回,NRE 也应该出现在*p,而不是稍后。这同样适用于拆箱;尝试将 null 对象转换为变量 MyStruct s 应该引发 NRE,而不是稍后在调用 s 的成员时。
  • 您仍然假设托管代码装箱规则始终适用。如果我声明一个接受指向结构的指针的不安全方法,并将对该方法的调用与来自对非托管 C 函数的调用的指针结合起来,则对该指针没有任何形式的保证。它可能在托管堆上。它可能位于非托管堆上。它可能是 C NULL。它可以指向内存映射 I/O。它可以是任何东西,而 JITter 必须保守地防范这些可能性。
  • 正确。 struct 方法不能确定this 是一个安全值,因此它会探测内存以让CPU 中断触发(如有必要)以生成NRE。我刚刚测试了你描述的静态版本,整个调用链都按预期省略了,因为 JITter 可以证明调用什么都不做。
猜你喜欢
  • 2016-08-30
  • 1970-01-01
  • 2013-06-15
  • 1970-01-01
  • 1970-01-01
  • 2012-11-02
  • 1970-01-01
  • 2016-09-16
  • 1970-01-01
相关资源
最近更新 更多