C语言的编译链接过程详解

#include <stdio.h>
#include "func.h"
#define NUM_10 10

int main() {
    //这是一条注释
    #ifdef DEBUG
    printf("this is DEBUG model\n");
    #endif
    int result = add(NUM_10, 20);
    printf("The result is: %d\n", result);
    return 0;
}

（二）预处理

预处理是编译过程的第一步，它主要处理源代码中的预处理指令，如#include、#define、#ifdef等。

#include指令：用于引入头文件。例如，#include <stdio.h>会将标准输入输出库的头文件内容插入到当前源文件中。头文件通常包含函数声明、宏定义和类型定义等。

#define指令：用于定义宏。例如，#define NUM_10 10会将源代码中所有出现的NUM_10替换为10。

条件编译指令：如#ifdef、#ifndef、#if、#else、#elif和#endif，用于根据条件包含或排除某些代码片段。这在开发跨平台程序时非常有用，可以根据不同的操作系统或编译器选项选择性地编译代码。

预处理输出：预处理器会生成一个扩展名为.i的文件（如main.i），这个文件是经过预处理后的源代码，其中所有的预处理指令都已被处理完毕，宏也已展开。

示例：main.i

# 1 "main.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 1 "main.c" 2
# 1 "func.h" 1
int add(int a, int b);
# 2 "main.c" 2
# 1 "<built-in>" 2
# 1 "<command-line>" 2
# 1 "/usr/include/stdc-predef.h" 2
# 1 "main.c" 2
int main() {
    int result = add(10, 20);
    printf("The result is: %d\n", result);
    return 0;
}

关键变化：

宏定义NUM_10被替换为10。

注释被删除。

条件编译指令#ifdef DEBUG被处理。如果没有定义DEBUG宏，则printf("this is DEBUG model\n");不会出现在预处理后的文件中。

（二）编译

编译器将预处理后的源代码（.i文件）转换为汇编语言代码。这个过程主要涉及语法分析和语义分析。

语法分析：编译器会检查源代码是否符合C语言的语法规则。例如，检查函数的定义是否正确、变量的声明是否完整、语句的结构是否合法等。如果发现语法错误，编译器会报错并指出错误的位置。

语义分析：编译器会检查源代码的语义是否正确。例如，检查变量是否已声明、函数调用是否与定义匹配、类型转换是否合法等。语义分析确保代码的逻辑是合理的。

中间代码生成：在语法和语义分析之后，编译器会生成中间代码。中间代码是一种与平台无关的代码表示形式，通常比源代码更接近机器代码。它便于后续的代码优化和目标代码生成。

代码优化：编译器会对中间代码进行优化，以提高程序的运行效率。优化的策略包括常量传播、死代码删除、循环展开等。优化的目的是减少程序的执行时间和内存占用。

汇编代码生成：最终，编译器将优化后的中间代码转换为汇编语言代码。汇编语言代码是与目标机器架构相关的低级代码，它可以直接被汇编器转换为机器代码。编译器生成的汇编代码文件通常扩展名为.s（如main.s）。

示例：main.s

.file   "main.c"
    .text
    .globl  main
    .type   main, @function
main:
.LFB0:
    .cfi_startproc
    pushq   %rbp
    .cfi_def_cfa_offset 16
    .cfi_offset 6, -16
    movq    %rsp, %rbp
    .cfi_def_cfa_register 6
    subq    $16, %rsp
    movl    $10, -4(%rbp)
    movl    $20, -8(%rbp)
    movl    -4(%rbp), %esi
    movl    -8(%rbp), %edi
    call    add
    movl    %eax, -12(%rbp)
    movl    -12(%rbp), %esi
    movl    $.LC0, %edi
    movl    $0, %eax
    call    printf
    movl    $0, %eax
    leave
    .cfi_def_cfa 7, 8
    ret
    .cfi_endproc
.LFE0:
    .size   main, .-main
    .section    .data
    .align 4
    .type   .LC0, @object
    .size   .LC0, 4
.LC0:
    .string "The result is: %d\n"
    .ident  "GCC: (GNU) 11.3.0"
    .section    .note.GNU-stack,"",@progbits