前言
链接是代码生成可执行文件中一个非常重要的过程。我们在使用一些库函数时,有时候需要链接库,有时候又不需要,这是为什么呢?了解一些链接的基本过程,能够帮助我们在编译时解决一些疑难问题。比如,下面就有一种奇怪的现象。
一个奇怪的链接问题
程序功能很简单,计算e的n次方。程序清单如下(代码一):
#include<stdio.h>#include<math.h>
int main(int argc,char *argv[])
{
double a = exp(2);
printf("%lf\n",a);
return 0;
}
编译运行:
gcc -o expTest expTest.c./expTest
7.389056
一切似乎顺理成章,我们再来看下面这种情况,将变量b=2传入exp函数(代码二):
#include<stdio.h>#include<math.h>
int main(int argc,char *argv[])
{
int b = 2;
double a = exp(b);
printf("%lf\n",a);
return 0;
}
编译:
gcc -o expTest expTest.c/tmp/ccx5lXbS.o:在函数‘main’中:
expTest.c:(.text+0x20):对‘exp’未定义的引用
collect2: error: ld returned 1 exit status
我们发现,同样的编译方法编译不过了,提示对‘exp’未定义的引用,并且抛出链接出错。
我们通过man命令查看exp函数:
man 3 expNAME
exp, expf, expl - base-e exponential function
SYNOPSIS
#include <math.h>
double exp(double x);
float expf(float x);
long double expl(long double x);
Link with -lm.
发现它除了需要包含头文件math.h外,编译时还需要使用-lm链接。
再次编译运行:
/tmp/ccYT3E65.o:在函数‘main’中:
expTest.c:(.text+0x20):对‘exp’未定义的引用
collect2: error: ld returned 1 exit status
为什么还是不行呢?我们已经按照帮助手册的只是加了-lm了啊?难道是位置不对?我们换个位置试试:
gcc -o expTest expTest.c -lm./expTest
7.389056
现在终于成功编译并运行。
分析
虽然最后终于成功编译运行,但是不免产生了几个疑问:
- 两段代码同样都调用了exp函数,为什么一个需要链接,一个不需要链接呢?
- 到底什么时候需要链接呢?
- 为什么链接的时候放在前面就不行呢?
我们一一解答。
(1)为什么一个需要链接,一个不需要?
我们可以观察到,代码一调用exp传入的参数是常量2,代码二调用exp传入的参数是变量b,那么对于代码一会不会在运行之前就计算好了呢?
我们来看一下它们的汇编代码。
代码一:
.string "%lf\n"
main:
push rbp
mov rbp, rsp
sub rsp, 32
mov DWORD PTR [rbp-20], edi
mov QWORD PTR [rbp-32], rsi
movsd xmm0, QWORD PTR .LC0[rip]
movsd QWORD PTR [rbp-8], xmm0
movsd xmm0, QWORD PTR [rbp-8]
mov edi, OFFSET FLAT:.LC1
mov eax, 1
call printf
mov eax, 0
leave
ret
.LC0:
.long 3100958126
.long 1075678820
代码二:
.LC0:.string "%lf\n"
main:
push rbp
mov rbp, rsp
sub rsp, 32
mov DWORD PTR [rbp-20], edi
mov QWORD PTR [rbp-32], rsi
mov DWORD PTR [rbp-4], 2
cvtsi2sd xmm0, DWORD PTR [rbp-4]
call exp
movq rax, xmm0
mov QWORD PTR [rbp-16], rax
movsd xmm0, QWORD PTR [rbp-16]
mov edi, OFFSET FLAT:.LC0
mov eax, 1
call printf
mov eax, 0
leave
ret
汇编的具体细节我们无需尽知,但是我们可以很明显地看到,第二段代码调用了exp函数(call exp指令),而第一段代码没有看到调用exp的身影。
实际上,通过汇编代码可以看到,当传入参数为常量时,就已经计算好了值(emm0寄存器为浮点运算相关寄存器),最后根本不需要调用exp函数。而对于变量型的参数,其值在运行时确定,因此需要调用。我们还可以通过ldd命令来看它们链接的库有什么不同。
对于代码一:
linux-vdso.so.1 => (0x00007ffec079d000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fd327744000)
/lib64/ld-linux-x86-64.so.2 (0x00007fd327b0e000)
对于代码二:
ldd expTestlinux-vdso.so.1 => (0x00007ffefdfc9000)
libm.so.6 => /lib/x86_64-linux-gnu/libm.so.6 (0x00007f9afcccb000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f9afc901000)
/lib64/ld-linux-x86-64.so.2 (0x00007f9afcfd4000)
可以看到,第二段代码编译出来的可执行文件,多依赖了libm.so.6,也就是exp函数所在的库。
(2)什么时候需要链接?
事实上,C编译器总是主动传送libc.a或libc.so给链接器,也就是说,对于使用包含在libc.a或libc.so库中的函数,是不需要在编译时手动链接的。而调用函数是否需要链接,可以使用命令man 3 函数名查看,如果需要链接库,最后都有说明。
(3)为什么链接的时候放在前面就不行呢?
这个就涉及到链接器的工作原理了,在此只简单说明一下:链接过程中,需要进行符号解析,并且是按照顺序解析;如果库链接在前,就可能出现库中的符号不会被需要,链接器不会把它加到未解析的符号集合中,那么后面引用这个符号的目标文件就不能解析该引用,导致最后链接失败。因此链接库的一般准则是将它们放在命令行的结尾。
总结
通过前面的实例和分析,我们总结出以下几点:
1. 调用包含于libc库中的函数不需要链接。
2. 对于传参为常量的数学函数调用,生成可执行文件过程中可能将其优化,而无需调用该函数。
3. 库链接一般放在命令行结尾。
4. 通过man命令查看在调用某个函数时是否需要链接。
===========我是华丽的分割线===========