当前位置: 首页 > news >正文

C#会重蹈覆辙吗?系列之2:反射及元数据的性能问题

理清几个基本点

在开始谈论性能问题之前,有必要首先理清几个基本点。我们谈C#,就是在谈.NET Framework(或者更准确一点是CLR,因为.NET Framework除了CLR还包括BCL);谈.NET Framework(CLR),也就是在谈C#。因为支撑C#语法之后的就是整个CLR的机制。因此,我说C#性能不好,和说CLR性能不好,说的是一个事情(就像说Java性能不好,就是说JVM性能不好一样)。我不希望在我下面说C#某个地方性能不好的时候,再有论者立即指出来“那不是C#的问题,那是CLR的问题,或者.NET Framework的问题”——如果对C#和.NET还停留在这个认识上,请先去读读Jeffrey Richter的《CLR via C#》一书,再来看我下面的文章。

另外,我说C#性能有问题,仅针对C#而言,与我对其他语言的态度无关。我既不是Java的支持者(因为Java的性能比C#还慢),也不是C++的支持者(C++太过臃肿复杂),也不是C的支持者(没有基本的面向对象抽象和垃圾回收)。我既不喜欢任何语言,也不讨厌任何语言。编程语言在我只是一个工具——我只是希望这个工具是把锋利的牛刀,而不是把功能齐全的瑞士小刀。

最后我不是毫无选择地反对“新功能”,我反对的是“添加的功能、没有重大抽象意义,却带来性能损失”,如果有“提高性能的新功能”——比如并发编程,或者“对管理软件复杂度”有重大意义,同时性能损失很小很小——比如面向对象,那我举双手赞成。”

在理清了前面几个基本点之后,下面开始来针对我前文说过的一些问题一一“讲原理”。这篇文章中,我首先来剖析反射的性能问题。

反射的两大类性能问题

【一】反射绑定与调用——使用反射带来的性能问题

反射的绑定与调用性能差,我想大概做过.NET开发的人都不会怀疑这一点。但是我还是希望那些严肃的程序员认真看看微软CLR程序经理Joel Pobar在MSDN上的这篇文章:Dodge Common Performance Pitfalls to Craft Speedy Applications http://msdn.microsoft.com/en-us/magazine/cc163759.aspx,清楚理解反射绑定与调用的效率到底为什么那么差?有多差?差在哪里?

限于篇幅关系,我简单在这里总结一下,反射绑定与调用的性能问题(具体原理,大家参照MSDN这篇文章):

  1. 首先要经过一个绑定过程,非常耗时(用字符串名称和metadata里面的字符串进行比对,字符串查找的算法大家都知道是很慢的操作)
  2. 然后要进行参数个数、类型等的校验;如果不匹配还要搜索可能的类型转换
  3. 进行CAS代码访问安全的验证,看允不允许调用。
  4. 以上几个工作,如果不用反射应该是由C#编译器负责在编译时检查的。但是现在如果用反射,全都放到了运行时检查。
  5. 这其中会产生一大堆的临时对象(比如MemberInfo Cache),给垃圾收集器造成巨大负担
  6. 纵然有一些对反射绑定和调用的cache优化策略,Joel Pobar在这篇文章中给的最大的建议还是:能不用反射,则不用反射,因为性能成本太高。
  7. 结论:反射调用的性能成本很高(参见msdn文章中中图2 Relative Performance of Invocation Mechanism)。

我想这些性能问题,大家都会认可。但有些朋友会说“我.NET程序中用反射的很少啊?”,首先且不论你用的少不少,但是微软开发的很多Application Framework对反射的使用现在越来越多,比如大量使用反射“绑定与调用”的例子(注意是大量,不是一点点!):

  1. WPF和Silverlight中的XAML序列化-反序列化,依赖属性,数据绑定
  2. ASP.NET MVC中路由、控制器,视图等的匹配查找(反射绑定)和调用(反射调用)
  3. WCF分布式通信中大量的实例激活,方法调用,序列化与反序列化
  4. WF中大量的工作流流程激活、控制、调用
  5. ………..上面几乎把.NET平台的主要应用框架都包括了,不用再举更多例子了吧?谁能脱离这些应用框架去写程序?

所以说,你用反射用的少,并不代表你最后做出的软件用反射的少(你的软件的代码不可能全都是自己写的,很多都是依附于微软的Application Framework,只要这些Application Framework很重地使用了反射,那么你的软件也就很重的使用了反射)

但有朋友会立即指出“我不用WPF/SL,不用WCF、不用WF、不用ASP.NET MVC,类库都是自己写,代码全都是自己写,保证反射用的很少,甚至确保压根没有使用反射,这些性能负担不久没有了吗?”这个问题很好! 也是前面谈到.NET各种功能带来的性能问题的时候,很多朋友最喜欢的辩词——不用它不就是了嘛!

首先如果有这样的C#程序员,我定佩服你如滔滔江水…….但是,我这里要告诉大家的事实是,“即便你程序中确实所有的代码都不使用反射,由于C#/.NET内置地支持反射,那么你也要为此付出性能代价,而且是很高的性能代价”。这是本文的重点,甚至是我后续很多论战文章的重点——很多C#/.NET机制,不管你用不用它,只要内置支持这种机制,就不可避免要付出性能代价(当然如果你要用它,还有更多性能代价)。

好,下面让我们来谈谈为什么,即便不用反射也要付出很高的性能代价?(这也是MSDN那篇文章所刻意回避的话题)。

【二】反射背后需要的支撑机制:元数据的性能问题——不使用反射的性能问题

要谈这个问题,首先大家应该清楚C#/.NET中反射的功能是由metadata来支持的,即便你所有的代码中、你用的所有Application Framework的代码中都没有使用一点反射的API,C#编译器还是会在最后生成的EXE或者DLL中生成所有的metadata。(如果这个不清楚,请先读Jeffrey Richter的《CLR via C#》一书)。而 Metadata就是C#/.NET性能的罪魁祸首!要理解这一点,大家先来做两个简单的针对metadata的分析。

1. 用ILDASM工具将C:\Windows\Microsoft.NET\Framework\v4.0.30128 下面的MSCorlib.dll(.NET核心类库程序集,其他版本也可以,不必非要4.0)打开。点击:View->Statistics,看一下其中的元数据大小:

CLR header size : 72 ( 0.00%)

CLR meta-data size : 2083724 (40.09%)

CLR additional info : 931312 (17.92%)

CLR method headers : 136967 ( 2.64%)

Managed code : 1212346 (23.32%)

Data : 753152 (14.49%)

注意:这四个部分,其要么是metadata,要么是metadata的辅助信息,所以我在后面文章中都算作元数据部分:

整个MSCorlib.dll大小为4.95M。

Metadata总共占用大约3.01M,占总大小大约60.6%。

真正传统的Code+Data总共占用大约1.87M,占总大小约37.8%。

MSCorlib.dll总共大小4.95M,为了支持反射,需要添加的元数据竟然有3.01M,占到60%的大小!!!我想大家已经看出问题来了。有些朋友可能会说,这是特例吧?别的DLL呢?

2. 我们再来随便找一个DLL,比如WPF的DLL:C:\Program Files\Reference Assemblies\Microsoft\Framework\v3.0\PresentationFramework.dll,同样适用ILDASM打开,点击:View->Statistics看一下其中的元数据大小:

整个PresentationFramework.dll大小为5.03M。Metadata总共占用大约55.15%!

大家可以随便拿一个自己项目中.NET的DLL或者EXE来分析,看看Metadata的大小占用多少? 基本都在50%以上,甚至有的高达70%!

这意味着什么?即使你不用任何反射的代码,C#/.NET为了让它支持反射,还要给你最后生成的DLL/EXE强加50%以上的metadata(这是强制的,即便你不用反射,C#/.NET也没有提供任何编译选项将这些metadata去掉)。这就是.NET Framework Redistributable本身要40M左右的原因!

我想这个铁的事实是“老赵们”无论如何都不能否认的。但是“老赵们”的典型言论马上又来了:

(1)不就是程序有点大吗?现在大硬盘很便宜,运行起来还是很快的

(2)就是.NET Framwork有点大,客户安装起来不方便

(3)大只是空间效率,不影响程序的时间效率

这些调调显然都是没有真正搞过“性能优化”的“老赵们”的浅见。空间效率并非对时间效率没有影响,而是有致命影响。一个100M的应用程序,运行起来肯定要比一个40M的程序慢许多。理由如下:

(1)程序(EXE/DLL)最后都是要加载到内存中运行的,不是光放在硬盘上的——这也是为什么.NET程序占用内存都超多

(2)占用内存多的程序,运行起来必然慢。因为内存大的程序必然会出现较多的page fault(即换页错误),cache missing(即缓存失效)(简单来说,要尽可能在CPU缓存中操作working set,CPU缓存装不下,就要跑到主存里面找;主存装不下就要跑到虚拟内存-也就是硬盘里面找,那样软件运行的性能代价非常高). Page fault和cache missing已经成为现代软件性能的一大公害。很多程序慢下来,如果不是蹩脚的算法,Page fault和cache missing往往都是罪魁祸首!关于这方面的理论,很多牛人都专门讲过,国外也有比较牛叉的咨询公司专门做这方面的优化,大家如果想深度理解这方面,可以参照:

a. CACHE MEMORY:IMPLEMENTATION ANDDESIGN TECHNIQUES

http://www.faculty.iu-bremen.de/birk/lectures/PC101-2003/07cache/cache%20memory.htm

b. Improving Managed Code Performance-Working SetConsiderations

http://msdn.microsoft.com/en-us/library/ff647790.aspx#scalenetchapt05_topic33

c.以及微软的.NET性能经理Rico Mariani在这里的文章:

My mom doesn't care about space,http://blogs.msdn.com/b/ricom/archive/2004/03/15/89934.aspx

所以,总结下来就是:

(1)Metadata非常占用空间,一般占到整个EXE/DLL总大小的50%~70%

(2)高昂的空间成本会由于Page fault和cache missing等因素转嫁为高昂的时间成本

(3)即便在代码中不写一行反射调用代码,所有的metadata仍然会生成,我们仍然要为此付出高昂的空间代价和时间代价。

比如,我们公司开发的一个大型医疗软件,之前的版本使用C++开发,整个生成代码体积为40M左右,但是转移到.NET平台上(被微软的.NET平台战略忽悠过来)后发现代码体积为130M左右(功能差不多的前提下,第一版主要是移植,新增功能的代码量占不到5%),我们反反复复怎么优化都优化不到原来的40M左右,最后发现都是反射惹的祸!——我相信我在前文举出的很多世界著名、或者中国著名的软件最终没有选择.NET,都有过这样一个评测过程。

其他的例子大家可以自己找,比如就拿mspaint.exe 与paint.net(到这里下载:http://www.softpedia.com/progDownload/Paint-NET-Download-19322.html)比较比较,功能差不多相同。运行一下看看,它们各占多少内存:前者5.7M,后者占用17.7M!3倍多!

软件size大,没关系,你要大在地方,比如因为功能原因,code多一些导致size大我接受。但是你50%-70%的size都去装metadata了,而我又不怎么用metadata(反射),你还要这么大放在那里,极大地损害软件性能。

这还是一个小小paint玩具软件!你让QQ、photoshop,office等软件用C#/.NET开发试试?除非是“老赵们”自己开公

http://www.gsyq.cn/news/1644583.html

相关文章:

  • 3步快速掌握FanControl:Windows风扇智能控制终极指南
  • 工控CTF流量分析实战:Wireshark定位异常与Base64解码技巧
  • 2026 内容创作者怎么选靠谱的视频内容提取工具?我只留这一款
  • 从全连接层到Transformer FFN:3种网络结构图的演进与绘制要点
  • 网络基础理论
  • 3步掌握FanControl:告别风扇噪音,打造完美静音电脑系统
  • 知识图谱赋能RAG:构建可解释、可追溯的结构化推理系统
  • 2026 职场人群该如何选择实用的AI会议记录工具:只留这一个
  • 容器化邮件中继服务:如何在微服务架构中构建可靠的SMTP网关?
  • 如何用Buzz实现完全离线的专业音频转录:3步搞定语音转文字
  • 网站优化(SEO)依然是AI时代的流量密码
  • Xenomai与RTAI技术渊源:20年实时系统开源项目演进史
  • 从零构建具备持久记忆与技能自进化的AI智能体:Hermes Agent实战指南
  • Sunshine游戏流媒体服务器:从安装到完全卸载的终极技术指南
  • warpdrive错误处理与调试:常见问题排查与解决方案大全
  • 专业指南:如何在Linux系统上高效安装与优化Realtek RTL8125 2.5GbE网卡驱动
  • [MAF的Agent管道详解-01]塑智能体边界,从AIAgent抽象类开始
  • ExplorerTabUtility:Windows 11文件管理器标签页革命,5个高效技巧让你的工作效率翻倍
  • 采购装配式木屋除主体外还有哪些增值配套服务?一文讲清
  • 深度学习核心:计算图与反向传播原理详解及梯度流动实战
  • OpCore-Simplify:智能高效的OpenCore EFI自动化配置终极指南
  • 2026年AI写作辅助平台深度评测:6款工具合规过检得分排名
  • 最后,我再聊聊我新近观察的一个项目的运作,来分享一下我的第三层认识。
  • 从陇剑杯CTF实战解析Web渗透与应急响应的核心技能
  • 邮箱验证实战:基于ApiZero检测API从原理到代码一网打尽
  • QMCDecode终极指南:3步解锁QQ音乐加密音频,实现音乐格式自由转换
  • 从 AI 套图开始,下一步可以做什么?
  • 拉普拉斯展开实战指南:零基础掌握行列式策略性手算
  • 终极指南:如何在Mac上轻松制作Windows启动盘并绕过系统限制
  • 移动端图片浏览体验差?这个Vue组件让你告别卡顿和等待