带给我们的惊喜!

Linux内核源代码分析方法

 

一、内核源代码之我见

Linux内核代码的庞大令不少人“望而生畏”,也正由于如此,使得人们对Linux的了解仅处于泛泛的层次。假设想透析Linux,深入操作系统的本质,阅读内核源代码是最有效的途径。我们都知道,想成为优秀的程序猿,须要大量的实践和代码的编写。编程固然重要,可是往往仅仅编程的人非常easy把自己局限在自己的知识领域内。假设要扩展自己知识的广度,我们须要多接触其它人编写的代码,尤其是水平比我们更高的人编写的代码。通过这样的途径,我们能够跳出自己知识圈的束缚,进入他人的知识圈,了解很多其它甚至我们一般短期内无法了解到的信息。Linux内核由无数开源社区的“大神们”精心维护,这些人都能够称得上一顶一的代码高手。透过阅读Linux内核代码的方式,我们学习到的不光是内核相关的知识,在我看来更具价值的是学习和体会它们的编程技巧以及对计算机的理解。

我也是通过一个项目接触了Linux内核源代码的分析,从源代码的分析工作中,我受益颇多。除了获取相关的内核知识外,也改变了我对内核代码的过往认知:

1内核源代码的分析并不是“高不可攀”。内核源代码分析的难度不在于源代码本身,而在于怎样使用更合适的分析代码的方式和手段。内核的庞大致使我们不能依照分析一般的demo程序那样从主函数開始按部就班的分析,我们须要一种从中间介入的手段对内核源代码“各个击破”。这样的“按需索取”的方式使得我们能够把握源代码的主线,而非过度纠结于详细的细节。

2内核的设计是优美的。内核的地位的特殊性决定着内核的运行效率必须足够高才干够响应眼下计算机应用的实时性要求,为此Linux内核使用C语言和汇编的混合编程。可是我们都知道软件运行效率和软件的可维护性非常多情况下是背道而驰的。怎样在保证内核高效的前提下提高内核的可维护性,这须要依赖于内核中那些“优美”的设计。

3奇妙的编程技巧。在一般的应用软件设计领域,编码的地位可能不被过度的重视,由于开发人员更注重软件的良好设计,而编码仅仅是实现手段问题——就像拿斧子劈柴一样,不用太多的思考。可是这在内核中并不成立,好的编码设计带来的不光是可维护性的提高,甚至是代码性能的提升。

每一个人对内核的了理解都会有所不同,随着我们对内核理解的不断加深,对其设计和实现的思想会有很多其它的思考和体会。因此本文更期望于引导很多其它徘徊在Linux内核大门之外的人进入Linux的世界,去亲自体会内核的奇妙与伟大。而我也并不是内核源代码方面的专家,这么做也仅仅是希望分享我自己的分析源代码的经验和心得,为那些须要的人提供參考和帮助,说的“冠冕堂皇”一点,也算是为计算机这个行业,尤其是在操作系统内核方面贡献自己的一份绵薄之力。闲话少叙(已经罗嗦了非常多了,囧~),下面我就来分享一下自己的Linix内核源代码分析方法。

二、内核源代码难不难?

从本质上讲,分析Linux内核代码和看别人的代码没有什么两样,由于摆在你面前的一般都不是你自己写出来的代码。我们先举一个简单的样例,一个陌生人随便给你一个程序,并要你看完源代码后解说一下程序的功能的设计,我想非常多自我感觉编程能力还能够的人肯定认为这没什么,仅仅要我耐心的把他的代码从头到尾看完,肯定能找到答案,并且事实确实是如此。那么如今换一个假设,假设这个人是Linus,给你的就是Linux内核的一个模块的代码,你还会认为依旧那么轻松吗?不少人可能会有所犹豫。相同是陌生人(Linus要是认识你的话当然不算,呵呵~)给你的代码,为什么给我们的感觉大相径庭呢?我认为有下面原因:

1Linux内核代码在“外界”看来多少有些神奇感,并且它非常庞大,猛地摆在面前可能感觉无法下手。比方可能来源于一个非常细小的原因——找不到main函数。对于简单的demo程序,我们能够从头至尾的分析代码的含义,可是分析内核代码这招就彻底失效了,由于没有人能把Linux代码从头到尾看上一遍(由于确实没有必要,用到时看就能够了)。

2.不少人也接触过大型软件的代码,但多数属于应用型项目,代码的形式和含义都和自己常接触的业务逻辑相关。而内核代码不同,它处理的信息多数和计算机底层密切相关。比方操作系统、编译器、汇编、体系结构等相关的知识的欠缺,也会让阅读内核代码障碍重重。

3.分析内核代码的方法不够合理。面对大量的并且复杂的内核代码,假设不从全局的角度入手,非常easy陷入代码细节的泥淖中。内核代码尽管庞大,可是它也有它的设计原则和架构,否则维护它对不论什么人来说都是一个噩梦!假设我们理清代码模块的总体设计思路,再去分析代码的实现,可能分析源代码就是一件轻松快乐的事情了。

针对这些问题,我个人是这样理解的。假设没有接触过大型软件项目,可能分析Linux内核代码是一个非常好的积累大型项目经验的机会(确实,Linux代码是我眼下接触到的最大的项目了!)。假设你对计算机底层了解的不够透彻,那么我们能够选择边分析边学习的方式去积累底层的知识。可能刚開始分析代码的进度会稍显迟缓,可是随着知识的不断积累,我们对Linux内核的“业务逻辑”会逐渐明朗起来。最后一点,怎样从全局的角度把握分析的源代码,这也是我想与大家分享的经验。

三、内核源代码分析方法

第一步:资料搜集

从人认识新事物的角度来讲,在探索事物本质之前,必须有一个了解新奇事物的过程,这个过程是的我们对新奇事物产生一个初步的概念。比方我们想学习钢琴,那么我们须要先了解弹奏钢琴须要我们学习主要的乐理、简谱、五线谱等基础知识,然后学习钢琴弹奏的技巧和指法,最后才干真正的開始练习钢琴。

分析内核代码也是如此,首先我们须要定位要分析的代码涉及的内容。是进程同步和调度的代码,是内存管理的代码,还是设备管理的代码,还是系统启动的代码等等。内核的庞大决定着我们不能一次性将内核代码全部分析完毕,因此我们须要给自己一个合理的分工。正如算法设计告诉我们的,要解决一个大问题,首先要解决它所涉及的子问题。

定位好要分析的代码范围,我们就能够动用手头的一切资源尽可能的全面了解该部分代码的总体结构和大致功能。

带给我们的惊喜!

相关文章: