Linux 下使用 make 从源码编译

环境准备

  • Linux 版本 (64 bit)

    • CentOS 7 (GPU 版本支持 CUDA 11.0 - 12.0)

    • Ubuntu 18.04 (GPU 版本支持 CUDA 11.0 - 12.0)

    • Ubuntu 20.04 (GPU 版本支持 CUDA 11.0 - 12.0)

  • Python 版本 3.8/3.9/3.10/3.11/3.12 (64 bit)

选择 CPU/GPU

  • 如果您的计算机没有 NVIDIA® GPU,请安装 CPU 版本的 PaddlePaddle

  • 如果您的计算机有 NVIDIA® GPU,请确保满足以下条件以编译 GPU 版 PaddlePaddle

    • CUDA 工具包配合 cuDNN 8(如需多卡支持,需配合 NCCL2.7 及更高)

    • GPU 运算能力超过 6.0 的硬件设备

    您可参考 NVIDIA 官方文档了解 CUDA 和 CUDNN 的安装流程和配置方法,请见CUDAcuDNN

安装步骤

在 Linux 的系统下有 2 种编译方式,推荐使用 Docker 编译。 Docker 环境中已预装好编译 Paddle 需要的各种依赖,相较本机编译环境更简单。

使用 Docker 编译

Docker是一个开源的应用容器引擎。使用 Docker,既可以将 PaddlePaddle 的安装&使用与系统环境隔离,也可以与主机共享 GPU、网络等资源

使用 Docker 编译 PaddlePaddle,您需要:

请您按照以下步骤安装:

1. 请首先选择您希望储存 PaddlePaddle 的路径,然后在该路径下使用以下命令将 PaddlePaddle 的源码从 github 克隆到本地当前目录下名为 Paddle 的文件夹中:

git clone https://github.com/PaddlePaddle/Paddle.git

2. 进入 Paddle 目录下:

cd Paddle

3. 拉取 PaddlePaddle 镜像

对于国内用户,因为网络问题下载 docker 比较慢时,可使用百度提供的镜像:

  • CPU 版的 PaddlePaddle:

    docker pull registry.baidubce.com/paddlepaddle/paddle:latest-dev
    
  • GPU 版的 PaddlePaddle:

    docker pull registry.baidubce.com/paddlepaddle/paddle:latest-dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2
    

如果您的机器不在中国大陆地区,可以直接从 DockerHub 中的 paddle 镜像仓库 拉取镜像:

  • CPU 版的 PaddlePaddle:

    docker pull paddlepaddle/paddle:latest-dev
    
  • GPU 版的 PaddlePaddle(建议使用较新的镜像,并确保已经成功安装 NVIDIA Container Toolkit):

    docker pull paddlepaddle/paddle:latest-dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2
    

上例中,latest-dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 仅作示意用,表示安装 GPU 版的镜像。如果您还想安装其他 cuda/cudnn 版本的镜像,可以将其替换成其他版本(建议拉取最新的 GPU 版本)。 您可以访问DockerHub获取与您机器适配的镜像。

4. 创建并进入已配置好编译环境的 Docker 容器:

  • 编译 CPU 版本的 PaddlePaddle:

    用从百度拉取的镜像创建容器:

    docker run --name paddle-test -v $PWD:/paddle --network=host -it registry.baidubce.com/paddlepaddle/paddle:latest-dev /bin/bash
    
    • --name paddle-test:为您创建的 Docker 容器命名为 paddle-test;

    • -v $PWD:/paddle: 将当前目录挂载到 Docker 容器中的/paddle 目录下(Linux 中 PWD 变量会展开为当前路径的绝对路径);

    • -it: 与宿主机保持交互状态;

    • registry.baidubce.com/paddlepaddle/paddle:latest-dev:使用名为registry.baidubce.com/paddlepaddle/paddle:latest-dev的镜像创建 Docker 容器,/bin/bash 进入容器后启动/bin/bash 命令。

    若使用的是从 DockerHub 拉取的镜像创建容器,则修改镜像名即可:

    docker run --name paddle-test -v $PWD:/paddle --network=host -it paddlepaddle/paddle:latest-dev /bin/bash
    
  • 编译 GPU 版本的 PaddlePaddle:

    用从百度拉取的镜像创建容器

    docker run --gpus all --name paddle-test -v $PWD:/paddle --network=host -it registry.baidubce.com/paddlepaddle/paddle:latest-dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 /bin/bash
    
    • --gpus all: 在 Docker 容器中允许使用 gpu;

    • --name paddle-test:为您创建的 Docker 容器命名为 paddle-test;

    • -v $PWD:/paddle: 将当前目录挂载到 Docker 容器中的/paddle 目录下(Linux 中 PWD 变量会展开为当前路径的绝对路径);

    • -it: 与宿主机保持交互状态;

    • registry.baidubce.com/paddlepaddle/paddle:latest-dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2:使用名为registry.baidubce.com/paddlepaddle/paddle:latest-dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2的镜像创建 Docker 容器,/bin/bash 进入容器后启动/bin/bash 命令。

    若使用的是从 DockerHub 拉取的镜像创建容器,则修改镜像名即可:

    docker run --gpus all --name paddle-test -v $PWD:/paddle --network=host -it paddlepaddle/paddle:latest-dev-cuda12.0-cudnn8.9-trt8.6-gcc12.2 /bin/bash
    

注意: 请确保至少为 docker 分配 4g 以上的内存,否则编译过程可能因内存不足导致失败。

使用 GPU 版本镜像时,请确保成功安装 NVIDIA Container Toolkit ,否则无法在镜像中启用 GPU ,并且建议选择最新的 CPU 或者 GPU 镜像,否则可能会由于代码迭代较快,出现编译相关问题。

5. 进入 Docker 后进入 paddle 目录下:

cd /paddle

6. 切换到 develop 版本进行编译:

git checkout develop

paddle 支持 Python 3.8 以上版本

7. 创建并进入/paddle/build 路径下:

mkdir -p /paddle/build && cd /paddle/build

8. 使用以下命令安装相关依赖:

  • 安装 protobuf。

pip3.10 install protobuf

注意:以上用 Python3.10 命令来举例,如您的 Python 版本为 3.8/3.9/3.11/3.12,请将上述命令中的 pip3.10 改成 pip3.8/pip3.9/pip3.11/pip3.12

  • 安装 patchelf,PatchELF 是一个小而实用的程序,用于修改 ELF 可执行文件的动态链接器和 RPATH。

apt install patchelf

9. 执行 cmake:

  • 对于需要编译CPU 版本 PaddlePaddle的用户:

    cmake .. -DPY_VERSION=3.10 -DWITH_GPU=OFF
    
  • 对于需要编译GPU 版本 PaddlePaddle的用户:

    cmake .. -DPY_VERSION=3.10 -DWITH_GPU=ON
    
  • 具体编译选项含义请参见编译选项表

  • 请注意修改参数-DPY_VERSION为您希望编译使用的 python 版本, 例如-DPY_VERSION=3.10表示 python 版本为 3.10

  • 我们目前不支持 CentOS 6 下使用 Docker 编译 GPU 版本的 PaddlePaddle

10. 执行编译:

使用多核编译

make -j$(nproc)

注意: 编译过程中需要从 github 上下载依赖,请确保您的编译环境能正常从 github 下载代码。

11. 编译成功后进入/paddle/build/python/dist目录下找到生成的.whl包:

cd /paddle/build/python/dist

12. 在当前机器或目标机器安装编译好的.whl包:

For Python3:

pip3.10 install -U [whl 包的名字]

注意: 以上用 Python3.10 命令来举例,如您的 Python 版本为 3.8/3.9/3.11/3.12,请将上述命令中的 pip3.10 改成 pip3.8/pip3.9/pip3.11/pip3.12。

恭喜,至此您已完成 PaddlePaddle 的编译安装。您只需要进入 Docker 容器后运行 PaddlePaddle,即可开始使用。更多 Docker 使用请参见Docker 官方文档

本机编译

1. 检查您的计算机和操作系统是否符合我们支持的编译标准:

uname -m && cat /etc/*release

2. 更新系统源

  • CentOS 环境

    更新yum的源:

    yum update
    

    并添加必要的 yum 源:

    yum install -y epel-release
    
  • Ubuntu 环境

    更新apt的源:

    apt update
    

3. 安装 NCCL(可选)

  • 如果您需要使用 GPU 多卡,请确保您已经正确安装 nccl2,或者按照以下指令安装 nccl2(这里提供的是 CUDA11.2,cuDNN8 下 nccl2 的安装指令,更多版本的安装信息请参考 NVIDIA官方网站):

      ```
      rm -f /usr/local/lib/libnccl.so
      wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-2.10.3-1+cuda11.4.x86_64.rpm
      wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
      wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
      rpm -ivh libnccl-2.10.3-1+cuda11.4.x86_64.rpm
      rpm -ivh libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
      rpm -ivh libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
      ```
    

4. 安装必要的工具

bzip2以及make

yum install -y bzip2 make

or

apt install -y bzip2 make

cmake 需要 3.18 以上:

wget -q https://cmake.org/files/v3.18/cmake-3.18.0-Linux-x86_64.tar.gz
tar -zxvf cmake-3.18.0-Linux-x86_64.tar.gz
rm cmake-3.18.0-Linux-x86_64.tar.gz
PATH=/home/cmake-3.18.0-Linux-x86_64/bin:$PATH

gcc 需要 8.2 以上:

wget -q --no-proxy https://paddle-ci.gz.bcebos.com/gcc-8.2.0.tar.xz && \
tar -xvf gcc-8.2.0.tar.xz && \
cd gcc-8.2.0 && \
sed -i 's#ftp://gcc.gnu.org/pub/gcc/infrastructure/#https://paddle-ci.gz.bcebos.com/#g' ./contrib/download_prerequisites && \
unset LIBRARY_PATH CPATH C_INCLUDE_PATH PKG_CONFIG_PATH CPLUS_INCLUDE_PATH INCLUDE && \
./contrib/download_prerequisites && \
cd .. && mkdir temp_gcc82 && cd temp_gcc82 && \
../gcc-8.2.0/configure --prefix=/usr/local/gcc-8.2 --enable-threads=posix --disable-checking --disable-multilib && \
make -j8 && make install

5. 我们支持使用 virtualenv 进行编译安装,首先请使用以下命令创建一个名为paddle-venv的虚环境:

  • a. 安装 Python-dev:

    (请参照 Python 官方流程安装)

  • b. 安装 pip:

    (请参照 Python 官方流程安装)

  • c.(Only For Python3)设置 Python3 相关的环境变量,这里以 python3.10 版本示例,请替换成您使用的版本(3.8、3.9、3.10、3.11、3.12):

    1. 首先使用

      find `dirname $(dirname $(which python3))` -name "libpython3.so"
      

      找到 Python lib 的路径,如果是 3.8、3.9、3.10、3.11、3.12,请将python3改成python3.8python3.9python3.10python3.11python3.12,然后将下面[python-lib-path]替换为找到文件路径

    2. 设置 PYTHON_LIBRARIES:

      export PYTHON_LIBRARY=[python-lib-path]
      
    3. 其次使用

      find `dirname $(dirname $(which python3))`/include -name "python3.10"
      

      找到 Python Include 的路径,请注意 python 版本,然后将下面[python-include-path]替换为找到文件路径

    4. 设置 PYTHON_INCLUDE_DIR:

      export PYTHON_INCLUDE_DIRS=[python-include-path]
      
    5. 设置系统环境变量路径:

      export PATH=[python-lib-path]:$PATH
      

      (这里将[python-lib-path]的最后两级目录替换为/bin/)

  • d. 安装虚环境virtualenv以及virtualenvwrapper并创建名为paddle-venv的虚环境:(请注意对应 python 版本的 pip3 的命令,如 pip3.8、pip3.9、pip3.10、pip3.11、pip3.12)

    1. 安装virtualenv

      pip install virtualenv
      

      pip3 install virtualenv
      
    2. 安装virtualenvwrapper

      pip install virtualenvwrapper
      

      pip3 install virtualenvwrapper
      
    3. 找到virtualenvwrapper.sh

      find / -name virtualenvwrapper.sh
      

      (请找到对应 Python 版本的virtualenvwrapper.sh

    4. 查看virtualenvwrapper.sh中的安装方法:

      cat vitualenvwrapper.sh
      

      该 shell 文件中描述了步骤及命令

    5. 按照virtualenvwrapper.sh中的描述,安装virtualwrapper

    6. 设置 VIRTUALENVWRAPPER_PYTHON:

      export VIRTUALENVWRAPPER_PYTHON=[python-lib-path]:$PATH
      

      (这里将[python-lib-path]的最后两级目录替换为/bin/)

    7. 创建名为paddle-venv的虚环境:

      mkvirtualenv paddle-venv
      

6. 进入虚环境:

workon paddle-venv

7. 执行编译前请您确认在虚环境中安装有编译依赖表中提到的相关依赖:

  • 这里特别提供patchELF的安装方法,其他的依赖可以使用yum install或者pip install/pip3 install 后跟依赖名称和版本安装:

    yum install patchelf
    

    不能使用 yum 安装的用户请参见 patchElF github官方文档

8. 将 PaddlePaddle 的源码 clone 在当下目录下的 Paddle 的文件夹中,并进入 Padde 目录下:

git clone https://github.com/PaddlePaddle/Paddle.git
cd Paddle

9. 切换到 develop 分支进行编译:

git checkout develop

10. 并且请创建并进入一个叫 build 的目录下:

mkdir build && cd build

11. 执行 cmake:

具体编译选项含义请参见编译选项表

  • 对于需要编译CPU 版本 PaddlePaddle的用户:

    cmake .. -DPY_VERSION=3.10 -DPYTHON_INCLUDE_DIR=${PYTHON_INCLUDE_DIRS} \
    -DPYTHON_LIBRARY=${PYTHON_LIBRARY} -DWITH_GPU=OFF
    

    如果遇到Could NOT find PROTOBUF (missing:  PROTOBUF_LIBRARY PROTOBUF_INCLUDE_DIR)可以重新执行一次 cmake 指令。 请注意 PY_VERSION 参数更换为您需要的 python 版本

  • 对于需要编译GPU 版本 PaddlePaddle的用户:(** CUDA11.0 - CUDA12.0 **)

    1. 请确保您已经正确安装 nccl2,或者按照以下指令安装 nccl2(这里提供的是 CUDA11.2,cuDNN8 下 nccl2 的安装指令,更多版本的安装信息请参考 NVIDIA官方网站):

      rm -f /usr/local/lib/libnccl.so
      wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-2.10.3-1+cuda11.4.x86_64.rpm
      wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
      wget --no-check-certificate -q https://nccl2-deb.cdn.bcebos.com/libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
      rpm -ivh libnccl-2.10.3-1+cuda11.4.x86_64.rpm
      rpm -ivh libnccl-devel-2.10.3-1+cuda11.4.x86_64.rpm
      rpm -ivh libnccl-static-2.10.3-1+cuda11.4.x86_64.rpm
      
    2. 如果您已经正确安装了nccl2,就可以开始 cmake 了:(For Python3: 请给 PY_VERSION 参数配置正确的 python 版本)

      cmake .. -DPYTHON_EXECUTABLE:FILEPATH=[您可执行的 Python3 的路径] -DPYTHON_INCLUDE_DIR:PATH=[之前的 PYTHON_INCLUDE_DIRS] -DPYTHON_LIBRARY:FILEPATH=[之前的 PYTHON_LIBRARY] -DWITH_GPU=ON
      

注意:以上涉及 Python3 的命令,用 Python3.10 来举例,如您的 Python 版本为 3.8/3.9/3.11/3.12,请将上述命令中的 Python3.10 改成 Python3.8/Python3.9/Python3.11/Python3.12

12. 使用以下命令来编译:

make -j$(nproc)

使用多核编译

如果编译过程中显示“Too many open files”错误时,请使用指令 ulimit -n 8192 来增大当前进程允许打开的文件数,一般来说 8192 可以保证编译完成。

13. 编译成功后进入/paddle/build/python/dist目录下找到生成的.whl包:

cd /paddle/build/python/dist

14. 在当前机器或目标机器安装编译好的.whl包:

pip install -U(whl 包的名字)

pip3 install -U(whl 包的名字)

恭喜,至此您已完成 PaddlePaddle 的编译安装

验证安装

安装完成后您可以使用 pythonpython3 进入 python 解释器,输入

import paddle

再输入

paddle.utils.run_check()

如果出现PaddlePaddle is installed successfully!,说明您已成功安装。

如何卸载

请使用以下命令卸载 PaddlePaddle:

  • CPU 版本的 PaddlePaddle:

    pip uninstall paddlepaddle
    

    pip3 uninstall paddlepaddle
    
  • GPU 版本的 PaddlePaddle:

    pip uninstall paddlepaddle-gpu
    

    pip3 uninstall paddlepaddle-gpu
    

使用 Docker 安装 PaddlePaddle 的用户,请进入包含 PaddlePaddle 的容器中使用上述命令,注意使用对应版本的 pip