教程推荐 编译原理(中国科学技术大学)
编译原理是计算机科学中历史悠久且高度发展的学科之一。编译器的设计与实现集中体现了计算机科学中的最核心的思想和技术,并且和计算机科学的其他研究领域,如形式语言与自动机、算法、数据结构、程序设计语言、计算机体系结构、软件工程等都有非常重要的联系。
本课程主要讲授编译器设计与实现中的理论和技术。主要内容为:词法分析、语法分析、语法树构造、语义分析、中间代码生成、代码优化、目标代码生成等主要内容。具体包括正则表达式、有限状态自动机、形式文法、类型系统、数据流方程、不动点算法、格、闭包等,还将讨论如何选择合理的数据结构和高效的算法来实现上述理论,以及如何运用软件工程中的思想来处理编译器设计中所出现的种种复杂性。
观看教程请点击“了解更多”
一问带你深入分析Java的编译原理
在之前的文章中,有过关于Java语言的编译和反编译的介绍。我们可以通过javac命令将Java程序的源代码编译成Java字节码,即我们常说的class文件。这是我们通常意义上理解的编译。
但是,字节码并不是机器语言,要想让机器能够执行,还需要把字节码翻译成机器指令。这个过程是Java虚拟机做的,这个过程也叫编译。是更深层次的编译。
在编译原理中,把源代码翻译成机器指令,一般要经过以下几个重要步骤:
根据完成任务不同,可以将编译器的组成部分划分为前端(Front End)与后端(Back End)。
前端编译主要指与源语言有关但与目标机无关的部分,包括词法分析、语法分析、语义分析与中间代码生成。
后端编译主要指与目标机有关的部分,包括代码优化和目标代码生成等。
我们可以把将.java文件编译成.class的编译过程称之为前端编译。把将.class文件翻译成机器指令的编译过程称之为后端编译。
Java中的前端编译
前端编译主要指与源语言有关但与目标机无关的部分,包括词法分析、语法分析、语义分析与中间代码生成。
我们所熟知的javac的编译就是前端编译。除了这种以外,我们使用的很多IDE,如eclipse,idea等,都内置了前端编译器。主要功能就是把.java代码转换成.class代码。
词法分析
词法分析阶段是编译过程的第一个阶段。这个阶段的任务是从左到右一个字符一个字符地读入源程序,将字符序列转换为标记(token)序列的过程。这里的标记是一个字符串,是构成源代码的最小单位。在这个过程中,词法分析器还会对标记进行分类。
词法分析器通常不会关心标记之间的关系(属于语法分析的范畴),举例来说:词法分析器能够将括号识别为标记,但并不保证括号是否匹配。
语法分析
语法分析的任务是在词法分析的基础上将单词序列组合成各类语法短语,如“程序”,“语句”,“表达式”等等.语法分析程序判断源程序在结构上是否正确.源程序的结构由上下文无关文法描述。
语义分析
语义分析是编译过程的一个逻辑阶段, 语义分析的任务是对结构上正确的源程序进行上下文有关性质的审查,进行类型审查。语义分析是审查源程序有无语义错误,为代码生成阶段收集类型信息。
语义分析的一个重要部分就是类型检查。比如很多语言要求数组下标必须为整数,如果使用浮点数作为下标,编译器就必须报错。再比如,很多语言允许某些类型转换,称为自动类型转换。
中间代码生成
在源程序的语法分析和语义分析完成之后,很多编译器生成一个明确的低级的或类机器语言的中间表示。该中间表示有两个重要的性质: 1.易于生成; 2.能够轻松地翻译为目标机器上的语言。
在Java中,javac执行的结果就是得到一个字节码,而这个字节码其实就是一种中间代码。
PS:著名的解语法糖操作,也是在javac中完成的。
Java中的后端编译
首先,我们大家都知道,通常通过 javac 将程序源代码编译,转换成 java 字节码,JVM 通过解释字节码将其翻译成对应的机器指令,逐条读入,逐条解释翻译。很显然,经过解释执行,其执行速度必然会比可执行的二进制字节码程序慢很多。这就是传统的JVM的**解释器(Interpreter)**的功能。为了解决这种效率问题,引入了 JIT 技术。
JAVA程序还是通过解释器进行解释执行,当JVM发现某个方法或代码块运行特别频繁的时候,就会认为这是“热点代码”(Hot Spot Code)。然后JIT会把部分“热点代码”翻译 成本地机器相关的机器码,并进行优化 ,然后再把翻译后的机器码缓存 起来,以备下次使用。
HotSpot虚拟机中内置了两个JIT编译器:Client Complier和Server Complier,分别用在客户端和服务端,目前主流的HotSpot虚拟机中默认是采用解释器与其中一个编译器直接配合的方式工作。
当 JVM 执行代码时,它并不立即开始编译代码。首先,如果这段代码本身在将来只会被执行一次,那么从本质上看,编译就是在浪费精力。因为将代码翻译成 java 字节码相对于编译这段代码并执行代码来说,要快很多。第二个原因是最优化,当 JVM 执行某一方法或遍历循环的次数越多,就会更加了解代码结构,那么 JVM 在编译代码的时候就做出相应的优化。
在机器上,执行java -version命令就可以看到自己安装的JDK中JIT是哪种模式:
上图是我的机器上安装的jdk1.8,可以看到,他是Server Compile,但是,需要说明的是,无论是Client Complier还是Server Complier,解释器与编译器的搭配使用方式都是混合模式,即上图中的mixed mode。
热点检测
上面我们说过,要想触发JIT,首先需要识别出热点代码。目前主要的热点代码识别方式是热点探测(Hot Spot Detection),有以下两种:
1、基于采样的方式探测(Sample Based Hot Spot Detection) :周期性检测各个线程的栈顶,发现某个方法经常出险在栈顶,就认为是热点方法。好处就是简单,缺点就是无法精确确认一个方法的热度。容易受线程阻塞或别的原因干扰热点探测。
2、基于计数器的热点探测(Counter Based Hot Spot Detection)。采用这种方法的虚拟机会为每个方法,甚至是代码块建立计数器,统计方法的执行次数,某个方法超过阀值就认为是热点方法,触发JIT编译。
在HotSpot虚拟机中使用的是第二种——基于计数器的热点探测方法,因此它为每个方法准备了两个计数器:方法调用计数器和回边计数器。
方法计数器。顾名思义,就是记录一个方法被调用次数的计数器。
回边计数器。是记录方法中的for或者while的运行次数的计数器。
编译优化
前面提到过,JIT除了具有缓存的功能外,还会对代码做各种优化。说到这里,不得不佩服HotSpot的开发者,他们在JIT中对于代码优化真的算是面面俱到了。
这里简答提及几个我觉得比较重要的优化技术,并不准备直接展开,读者感兴趣的话,我后面再写文章单独介绍。
逃逸分析、 锁消除、 锁膨胀、 方法内联、 空值检查消除、 类型检测消除、 公共子表达式消除
相关问答
电子信息工程 和计算机科学有什么关系? 申请方两者虽有相同之处,但差异明显。电子信息工程(ElectronicandInformationEngineering),电子信息工程专业主要是学习基本电路知识,并掌握用计算机...
想学一下 编译原理 ,有什么书籍推荐吗?引言IT界有三个神兽:芯片、操作系统和编译器。虽然后两者都是纯软件的东西,但是单从技巧而言,开发编译器要求更高一些。经典的编译原理的书籍包括:龙书、...
编译原理 知识点详解?它的知识点主要包括:编译器、词法分析、语法分析、语义分析、中间代码生成、目标代码生成、优化等。编译器是源代码(如C、C++、Java等)转换成可以执行的机器...
学习 编译原理 对以后工作有没有用?好多编程的人说用不到。。...编译原理太有用了好么!!就拿手机游戏来说吧,现在做一个游戏引擎。既然是引擎,就需要提供抽象的东西给上层使用。这里,可以引入脚本系统。这个脚本系...
大三软件 工程 选修4选1, 电子 商务, 编译原理 ,机器学习,计算机图形学,选哪个好?求详细分析?看你毕业后的打算(考研还是工作什么类型的企业和自己的兴趣)编译原理:你能有这个提问,这科就算了吧。图形学:很枯燥靠一门选修课学不到什么东西。看你数学...
编译原理 怎么控制html?你可以去搜索HTML反编译器,其实HTML就是网页组合在一起的,反编译以后就是一个一个的网页。要编辑的话,通过反编译后形成的单个网页用WORD进行编辑,然后在通过...
编译原理 第二版 电子 工业出版社答案和计算机网络课..._网络编...还有很多。。。。。。。数据库系统需要编程的基础。。。。。。。计算机网路需要长时间的实践才会对网络有深刻的了解。。。。。。软件工程导论也...
请问什么是反 编译 , 原理 是怎么样的?反编译的流程,就是虚拟一个执行环境,看程序执行了那些指令,翻译成相应的语句一般的流程是先把程序调入到数据段,虚拟运行环境,一般这分配文件头部,从纪录指...
什么是扫描器 编译原理 ?描描器编译原理:主要是以下几个方面(1)设计扫描器的有限自动机(识别器);(2)设计翻译、生成Token的算法(翻译器);(3)编写代码并上机调试运行通过。...描...
编译原理 难不难?编译原理一般认为是较难的一门课.从网上的评论来看,有人说学了一年半软件理论,就一门编译看不懂;有人甚至说它是大本软件课程里最难的一门;有人抱怨国内的编译...