.Net,你为什么会慢

自打使用.Net以来,他给我的印象就一直是:慢。不过这几天看了一下.Net程序运行时的原理,才明白了我们平时的.Net程序是为什么慢的,也明白了在某些情况下其实.Net程序运行起来也不比非托管程序慢。

要看托管程序慢的原因,就得说说应用程序加载的过程。

应用程序文件的格式是有规律的。不管是托管程序还是非托管程序,可执行文件的内部都包含一个PE文件(包含在exe文件或者dll文件的内部),系统也正是根据PE文件里面的信息来启动这些可执行程序的。系统根据PE文件中的信息,找到入口函数,接着将控制调转到这个函数中,从而启动这个程序。不过托管程序的文件中还有一个CLR表头文件以及其他CLR需要的信息。
首先看看非托管程序。非托管程序的可执行文件都是二进制文件,是直接被编译成CPU指令的。在非托管程序的可执行文件中,编译器在编译的时候已经把对方法的调用直接编译成了CPU指令:因为在编译的时候就知道方法在代码段里的相对地址,也就是偏移量。当系统加载了可执行文件后,我们通过将可执行文件的基地址加上这个偏移量就可以计算出方法在内存中的实际地址。这样只要通过这种方法修改JMP指令,就可以直接运行整个程序。

但托管程序不同。因为托管程序编译的结果是IL中间代码,而这个IL代码是由CLR实时编译的,所以在启动这个程序之前,必须先加载CLR,并由CLR负责处理IL代码中的方法调用。

那么,操作系统是如何知道一个应用程序需要加载CLR的呢?也许有人会说因为托管程序的文件中还有一个CLR头部,看到这个就知道是托管程序。这个说法当然不对。最新的操作系统也许能够认出CLR头部,但2000之前的系统,他们如何会认得出CLR头部?要知道当这些系统出来的时候,还根本没有CLR这个玩意儿呢。

实际上,系统启动一个托管程序,最开始的步骤都是一样的:检查PE文件,然后执行PE文件中.text段(也就是代码段)中的代码。但托管程序在编译时,.text段里面增加了一条JMP _CorExeMain或者JMP _CorDllMain的指令(根据是exe文件还是dll文件不同)。也正是从这里开始,托管程序的加载与非托管程序的加载产生了区别。这时候如果是非托管程序,就已经进入到入口函数中去了;但托管程序此时却跳转到了另一个函数中。那么这个函数是哪里的呢?这个函数在一个叫做MSCorEE.dll的动态链接库文件中,当安装了.net框架时就会被复制在系统目录下。系统会根据托管程序PE文件中的信息找到这个DLL,然后通过MSCorEE.dll的PE文件信息找到这个_CorExeMain函数的入口地址,然后修改刚才的JMP指令要跳转的地址,从而将控制跳转到了_CorExeMain这个函数里面去。然后,在这个函数里面,CLR被启动了,并做了若干的初始化工作,然后再通过托管程序的CLR表头找到托管程序的入口地址,并将控制跳转到这里,于是托管程序开始运行。

不过,上述过程在最新的操作系统上不同,因为这些新的操作系统认得托管程序的标志(也就是说知道根据PE文件中的标志去判断是否是托管程序),因此在加载时就会直接调用_CorExeMain,JMP指令直接被跳过的。

刚才说了托管程序在启动时的一些特殊处理:系统在进入入口函数前会首先调用MSCorEE.dll中的代码来启动CLR并做一些初始工作,然后再进入入口函数。但还有个问题没提到:那就是刚才我们有说到托管程序的编译结果是IL代码,这个IL代码是在运行时被CLR实时编译的。那么,这个实时编译的过程又是怎样的呢?

实际上,IL中的方法并不是每次被调用时都会被重新编译一次,而是就像我们平时采用的“LazyLoad”一样,他只有在第一次被调用的时候才会被编译。即时编译器保存有一个映射表。当调用一个方法时,即时编译器如果发现在这个映射表中没有标记这个方法,就会将这个方法的IL代码编译成CPU指令,然后分配在一个内存空间上,然后在这个映射表中记录下这个方法名和方法入口对应的内存地址,然后通过JMP指令跳转到函数中去。当下次再产生对这个方法的调用时,即时编译器因为已经知道了这个方法对应的内存地址,因此就会直接通过JMP指令跳转,而不会再次编译这段代码。

因此可以看出,只要程序所有的代码都被执行过一次了,那么整个程序就都会被编译成CPU指令保存在内存中。在此之后托管程序跟非托管程序的执行效率就基本上没什么区别了——当然,托管程序需要从那个映射表中取函数地址,而非托管程序中方法的地址是已知的。

因此,理论上在某些情况下(比如win service、iis等长期循环执行的程序),托管程序的性能并不会比非托管程序的性能差多少。而且,非托管程序因为要考虑兼容性必须兼容标准指令,而非托管程序因为是运行时编译的,非常清楚操作系统环境,因此可以做针对性的优化。

不过,因为即时编译的结果是保存在内存中的,因此对于那些会频繁启动的程序来讲,其启动过程是会比较慢的——因为每次启动都需要加载CLR并做一次即时编译。

至此,在了解到了托管程序与非托管程序在加载、执行时的区别,我们就可以更加清楚怎样才能充分利用非托管程序的优点、避免其缺点,从而发挥他的最大价值、避免使用时走入误区。