天数 GPGPU 安装说明¶

飞桨框架 iluvatar_gpu 版支持天数 GPGPU 的训练和推理，提供两种安装方式：

通过飞桨官网发布的 wheel 包安装
通过源代码编译得到 wheel 包安装

天数 GPGPU 系统要求¶

要求类型	要求内容
芯片型号	天数智芯系列芯片，包括 BI150
操作系统	Linux 操作系统，包括 CentOS、Ubuntu、KylinV10 等

运行环境准备¶

推荐使用天数官方发布的天数 IXUCA 开发镜像，该镜像预装有天数 IXUCA 基础运行环境库。

          # 拉取镜像
docker pull ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-ixuca:latest

          # 在 host 上安装 driver
wget https://ai-rank.bj.bcebos.com/Iluvatar/corex-driver-linux64-4.3.0.rc.9.20250624_x86_64_10.2.run
bash corex-driver-linux64-4.3.0.rc.9.20250624_x86_64_10.2.run

         

          # 启动容器
docker run -itd --name paddle-ixuca-dev -v /usr/src:/usr/src -v /lib/modules:/lib/modules \
    -v /dev:/dev -v /home:/home --privileged --cap-add=ALL --pid=host \
    ccr-2vdh3abv-pub.cnc.bj.baidubce.com/device/paddle-ixuca:latest
docker exec -it paddle-ixuca-dev bash

         

选项说明及可调整参数¶

① `--name paddle-ixuca-dev`¶

作用：指定容器名称。
可调整：
- 用户可改为其他名称，例如 paddle-ixuca-test，方便区分不同实验。

            # 检查容器内是否正常识别天数 GPGPU 设备
ixsmi

            # 预期输出
+-----------------------------------------------------------------------------+
|  IX-ML: 4.3.0       Driver Version: 4.3.0       CUDA Version: 10.2          |
|-------------------------------+----------------------+----------------------|
| GPU  Name                     | Bus-Id               | Clock-SM  Clock-Mem  |
| Fan  Temp  Perf  Pwr:Usage/Cap|      Memory-Usage    | GPU-Util  Compute M. |
|===============================+======================+======================|
| 0    Iluvatar BI-V150         | 00000000:10:00.0     | 1500MHz   1600MHz    |
| N/A  40C   P0    N/A / N/A    | 64MiB / 32768MiB     | 0%        Default    |
+-------------------------------+----------------------+----------------------+
| 1    Iluvatar BI-V150         | 00000000:13:00.0     | 1500MHz   1600MHz    |
| N/A  39C   P0    104W / 350W  | 64MiB / 32768MiB     | 0%        Default    |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU        PID      Process name                                Usage(MiB) |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

           

安装飞桨框架¶

安装方式一：wheel 包安装¶

iluvatar-gpu 支持插件式安装，需先安装飞桨 CPU 安装包，再安装飞桨 iluvatar-gpu 插件包。在启动的 docker 容器中，执行以下命令：

           # 先安装飞桨 CPU 安装包
python -m pip install  --pre paddlepaddle -i https://www.paddlepaddle.org.cn/packages/nightly/cpu/

# 再安装飞桨 iluvatar-gpu 插件包
python -m pip install --pre paddle-iluvatar-gpu -i https://www.paddlepaddle.org.cn/packages/nightly/ixuca/

⚠️ 注意：nightly 版本为每日构建，可能存在不稳定性。如果需要更稳定的版本，建议使用 3.1 版本:https://www.paddlepaddle.org.cn/packages/stable/ixuca/

安装方式二：源代码编译安装¶

在启动的 docker 容器中，先安装飞桨 CPU 安装包，再下载 PaddleCustomDevice 源码编译得到飞桨 iluvatar-gpu 插件包。

           # 下载 PaddleCustomDevice 源码
git clone https://github.com/PaddlePaddle/PaddleCustomDevice

# 在 PaddleCUstomDevice 根目录下执行以下指令更新子模块代码
git submodule sync
git submodule update --init --recursive

# 进入硬件后端(天数 iluvatar_gpu)目录
cd backends/iluvatar_gpu

# 先安装飞桨 CPU 安装包
python -m pip install  --pre paddlepaddle -i https://www.paddlepaddle.org.cn/packages/nightly/cpu/

# 安装编译所需依赖
cd /tmp
wget https://github.com/protocolbuffers/protobuf/releases/download/v21.12/protoc-21.12-linux-x86_64.zip
unzip protoc-21.12-linux-x86_64.zip
mv bin/protoc /usr/local/bin/
rm -rf protoc-21.12-linux-x86_64.zip include bin
cd -

pip install --upgrade setuptools wheel

# 执行编译脚本
bash build_paddle.sh

# 编译产出在 build_pip 路径下，使用安装脚本进行安装
bash install_paddle.sh

          

⚠️ 注意：nightly 版本为每日构建，可能存在不稳定性。如果需要更稳定的版本，建议使用 3.1 版本。

基础功能检查¶

安装完成后，在 docker 容器中输入如下命令进行飞桨基础健康功能的检查。

          # 列出可用硬件后端
python3 -c "import paddle; print(paddle.device.get_all_custom_device_type())"

          # 预期得到如下输出结果
['iluvatar_gpu']

          # 使用 paddle utils 模块的 `run_check` 功能检查 paddle_iluvatar_gpu 插件和 PaddlePaddle 主框架是否正常安装，需要指定 xccl 的后端为 iluvatar_gpu
export PADDLE_XCCL_BACKEND=iluvatar_gpu
python3 -c "import paddle; paddle.utils.run_check()"

         

          # 预期得到输出如下
Running verify PaddlePaddle program ...
PaddlePaddle works well on 1 iluvatar_gpu.
PaddlePaddle works well on 16 iluvatar_gpus.
PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now.

         

如何卸载¶

请使用以下命令卸载 Paddle:

pip uninstall paddlepaddle paddle-iluvatar-gpu