常数折叠
常数折叠(Constant folding)以及常数传播(constant propagation)都是编译器优化技术,他们被使用在现代的编译器中。高端的常数传播形式,或称之为稀疏有条件的常数传播(sparse conditional constant propagation),可以更精确地传播常数及无缝的移除无用的代码。
常量折叠
常数折叠是一个在编译时期简化常数的一个过程,常数在表达式中仅仅代表一个简单的数值,就像是整数 2
,若是一个变量从未被修改也可作为常数,或者直接将一个变量被明确地被标注为常数,例如下面的描述:
i = 320 * 200 * 32;
多数的现代编译器不会真的产生两个乘法的指令再将结果保存下来,取而代之的,他们会辨识出语句的结构,并在编译时期将数值计算出来(在这个例子,结果为2,048,000),通常会在中介码(IR,intermediate representation)树中进行。
有些编译器,常数折叠会在初期就处理完,所以像是C语言的数组,初始化时就可以接受简单的运算表达式。而将常数折叠放在较后期的阶段的编译器,也相当常见。
常数折叠可以在编译器前端的IR树完成,在代码转换为三地址码之前。常数折叠也可以在后端完成,作为常数传播的附加功能。
常数折叠与跨平台编译
在实现一个跨平台编译器时,必须确保目标平台的算术运算的行为与编译平台结构是吻合的,而且启动常数折叠将会改变程序的行为,这在浮点数的运算中是非常重要的,浮点数精确度问题的影响是非常广的。
常数传播
常数传播是一个替代表达式中已知常数的过程,也是在编译时期进行,包含前述所定义,内置函数也适用于常数,以下列描述为例:
int x = 14;
int y = 7 - x / 2;
return y * (28 / x + 2);
传播x变量将会变成:
int x = 14;
int y = 7 - 14 / 2;
return y * (28 / 14 + 2);
持续传播,则会变成:(还可以再进一步的消除无用代码x及y来进行优化)
int x = 14;
int y = 0;
return 0;
常数传播在编译器中使用定义可达性(Reaching definition)分析实作,如果一个变量的所有定义可达性,都是赋予相同的数值,那么这个变量将会是一个常数,而且会被常数取代。
常数传播也可能导致使状态的分支简化,或是变成更复杂,当状态表达式在编译时期可以被计算为TRUE或是FALSE时,就可以决定他唯一的一种可能。
优化的行为
常数折叠及传播通常会同时被使用在简化以及减少,借由交错使用他们,一直到没有必要再改变,举例来说:
int a = 30;
int b = 9 - a / 5;
int c;
c = b * 4;
if (c > 10) {
c = c - 10;
}
return c * (60 / a);
使用常数传播,再使用常数折叠后,产生:
int a = 30;
int b = 3;
int c;
c = b * 4;
if (c > 10) {
c = c - 10;
}
return c * 2;
再做一次:
int a = 30;
int b = 3;
int c;
c = 12;
if (true) {
c = 2;
}
return c * 2;
当 a
及 b
已经被简化为常数,他们的数值取代了代码中任何一个使用到变量的地方,编译器接着将会使用死码删除(dead code elimination)来消除他们:
int c;
if (true) {
c = 2;
}
return c * 2;
在上述的程序,可以根据编译器的框架来判别可以用1或是其他的布尔常数来取代 True
,伴随传统的常数传播,我们将得到相当多的优化,他无法改变程序的结构。
还有其他类似的优化,被称之为稀疏有条件的常量传播(sparse conditional constant propagation),他依据if状态
选择了合适的分支[1],编译器侦测到 if
的描述中,将永远被赋予TRUE, c
变量可以被消除,完成之后代码变成:
return 4;
如果这个伪代码为一个函数,编译器将可将其以整数 4
来取代,以消除无用的函数调用,改进整体的运行性能。
参见
参考文献
- Wegman, Mark N; Zadeck, F. Kenneth, , ACM Transactions on Programming Languages and Systems, April 1991, 13 (2): 181–210
延伸阅读
- Muchnick, Steven S., , Morgan Kaufmann, 1997, ISBN 9781558603202