5.2 工具链技术备注

本节解释总体构建方法之中的某些基本原理和技术细节。并不需要立即理解本节中的所有问题。在进行实际构建的过程中,绝大部分的信息将会变得愈加清晰。在该过程中可随时查阅本小节的内容。

第五章的总体目标是生成一个临时的系统,它包含一个已知的较好工具集,该工具集可与宿主系统分离。通过使用 chroot,其余各章中的命令将被包含在此环境中,以保证目标 LFS 系统能够洁净且无故障地生成。该构建过程的设计就是为了使得新读者有最少的风险,同时还能有最好的指导价值。

[Note]

注意

在继续之前,请留意工作平台的名称,它通常称作目标系统三段式名称。目标系统三段式名称可通过运行脚本 config.guess 简单获得,许多软件的源码包都附带有该脚本(译者注:目标系统三段式名称描述了代码运行的平台,是GNU 构建系统中的一个核心概念,形如 i686-pc-gnu-linux。它包含三个字段:CPU家族/型号的名称(如 i686)、供应商(pc)和操作系统名称(如 gnu-linux)。更详细的信息请参阅 http://wiki.osdev.org/Target_Triplet)。解压 Binutils 源码包,执行其中的脚本:./config.guess 并查看其输出。例如,对于一个现代的 32 位英特尔处理器,其输出很可能为 i686-pc-linux-gnu

还请留意平台的动态链接器的名称,它通常被称为动态加载器(不要与 Binutils 中的标准链接器 ld 混淆)。该动态链接器由 Glibc 提供,它寻找并加载程序所需的共享库,为程序运行作准备,并运行它。对于 32 位英特尔的机器,动态链接器的名称为 ld-linux.so.2。判断动态链接器的一个可靠方法是检查宿主系统中的任意一个二进制文件,执行:readelf -l <二进制文件名> | grep interpreter 且查看其输出。可在 Glibc 源码树的根目录下的 shlib-versions 文件中找到所有平台的权威参考。

下面是第五章构建方法的几个关键技术点:

Binutils 是首个安装的包,这是因为执行 GCC 和 Glibc 的 configure 时都将进行有关汇编器和链接器的多项特性测试,以判断允许或禁用哪些软件特性。其重要性可能更甚于最初的意识。对 GCC 或 Glibc 的错误配置可能导致工具链出现难以捉摸的问题,可能直到整个构建过程接近尾声时才会显现出这些问题。通常情况下,一次测试套件失败可在你进行太多其它工作前暴露出该错误。

Binutils 将其汇编器和链接器安装在两个位置,即 /tools/bin/tools/$LFS_TGT/bin。一个位置的工具是硬链接到另一个位置的。链接器的一个重要方面是它的库搜索顺序。可给 ld 传递参数 --verbose 获得详细信息。如,ld --verbose | grep SEARCH 可得到当前的搜索路径及其顺序。通过编译一个模拟程序并向链接器传递 --verbose 开关,可显示 ld 都链接了哪些文件。例如,gcc dummy.c -Wl,--verbose 2>&1 | grep succeeded 将显示链接过程中成功打开的所有文件。

下一个安装的包是 GCC。下面是运行 GCC 的 configure 的输出的一个例子:

checking what assembler to use... /tools/i686-lfs-linux-gnu/bin/as
checking what linker to use... /tools/i686-lfs-linux-gnu/bin/ld

基于前述原因,这很重要。它还说明了 GCC 的配置脚本并不会搜索 PATH 目录来寻找使用什么工具。不过,在 gcc 自身的实际运行中,并不需要使用同样的搜索路径。运行:gcc -print-prog-name=ld 可获知 gcc 使用是何种标准链接器(LCTT 译注:gcc -print-prog-name 这个命令是为了显示 gcc 使用的某些内部工具的绝对路径,但事实上,ld 并不是 GCC 的内部工具,因此这条命令实际上没什么用)。

在编译模拟程序时,向 gcc 传递命令行选项 -v 可获得详细信息。例如,gcc -v dummy.c 将显示预处理器、编译和汇编阶段的详细信息,包括 gcc 的 include 搜索路径及其顺序。

下一个安装的包是经过净化的 Linux API 头文件。这些头文件可使得标准 C 库(Glibc)与 Linux 内核提供的特性进行交行交互。

下一个安装的包是 Glibc。构建 Glibc 时,最重要的考量是编译器、二进制工具和内核头文件。由于 Glibc 总是使用传递给它的配置脚本的 --host 参数有关的编译器,如,在我们这个场景中是 i686-lfs-linux-gnu-gcc,因此编译器通常不是一个问题。二进制工具和内核头文件可能会更复杂一些。因此,请谨慎行事并利用可用的配置开关以强制使用正确的选择。configure 运行完毕,目录 glibc-build 下的文件 config.make 包含有所有的重要细节。需要注意的是,CC="i686-lfs-gnu-gcc" 用来控制使用哪个二进制工具,-nostdinc-isystem 标志用来控制编译器的 include 搜索路径。这些条目强调了 Glibc 包的一个重要方面,即其构建机制是非常自给自足的,通常并不依赖默工具链的默认设置。

在第二遍编译 Binutils 过程中,我们能够利用配置开关 --with-lib-path 来控制 ld 的库搜索路径。

第二遍编译 GCC 时,也需要修改其源代码以告诉 GCC 使用新的动态链接器。如果不加修改,将会导致 GCC 自身的程序嵌入来自宿主系统目录 /lib 的动态链接器名称,这将破坏远离宿主系统的目标。正是基于前面的这个出发点,核心工具链是自包含和自托管的。第五章其它的软件包都将在 /tools 中的新 Glibc 的基础上进行构建。

在进入第六章中的 chroot 环境前,将安装的首个主要的软件包是 Glibc,这是因为它天生具有前面提及的自给自足特点。一旦将 Glibc 安装到 /usr 中,我们将快速改变工具链的默认设置,然后继续构建目标 LFS 系统的其余部分。