You need to enable JavaScript to run this app.
\u200E
开始使用
特性
文档
API
使用指南
工具平台
工具
AutoDL
PaddleHub
PARL
ERNIE
全部
平台
AI Studio
EasyDL
EasyEdge
资源
模型和数据集
学习资料
应用案例
develop
2.6
2.5
2.4
2.3
2.2
2.1
2.0
1.8
中文(简)
English(En)
安装指南
Pip 安装
Linux 下的 PIP 安装
macOS 下的 PIP 安装
Windows 下的 PIP 安装
Conda 安装
Linux 下的 Conda 安装
macOS 下的 Conda 安装
Windows 下的 Conda 安装
Docker 安装
Linux 下的 Docker 安装
macOS 下的 Docker 安装
Docker 列表
从源码编译
Linux 下使用 make 从源码编译
macOS 下使用 make 从源码编译
Linux 下使用 ninja 从源码编译
macOS 下使用 ninja 从源码编译
Windows 下从源码编译
飞腾/鲲鹏下从源码编译
申威下从源码编译
兆芯下从源码编译
龙芯下从源码编译
昆仑 XPU 芯片
海光 DCU 芯片
昇腾 NPU 芯片
寒武纪 MLU 芯片
附录
使用指南
模型开发入门
Tensor 介绍
模型开发更多用法
使用 VisualDL 可视化模型,数据和训练
自动微分机制介绍
使用 paddle.nn.Layer 自定义网络
梯度裁剪方式介绍
飞桨模型转 ONNX 模型
隐式数据类型提升介绍
动态图转静态图
使用样例
转换原理
支持语法
案例解析
报错调试
Limitations
推理部署
服务器部署 — Paddle Inference
移动端/嵌入式部署 — Paddle Lite
模型自动化压缩工具(ACT)
分布式训练
分布式训练简介
环境部署
快速开始-数据并行
快速开始-参数服务器
数据并行
原理和实践案例
前向重计算
自动混合精度
Gradient Merge
参数服务器
参数服务器概述
纯 GPU 参数服务器
CPUPS 流式训练示例
张量模型并行
流水线并行
分组切分并行
MoE
自动并行训练
静态图流水并行时序图可视化工具
性能调优
自动混合精度训练(AMP)
模型性能分析(Profiler)
训练全流程自动调优(Beta)
模型迁移
迁移指南
从 PyTorch 迁移到飞桨
CV - 快速上手
CV - 迁移经验汇总
NLP - 快速上手
NLP - 迁移经验汇总
解读网络结构转换
解读 Bert 模型权重转换
PyTorch 最新 release 与 Paddle develop API 映射表
PyTorch 自定义算子转写教程
使用 X2Paddle 迁移推理模型
迁移飞桨旧版本
升级指南
版本迁移工具
兼容载入旧格式模型
Paddle 1.8 与 Paddle 2.0 API 映射表
附录: 飞桨框架 2.x
硬件支持
飞桨产品硬件支持表
昆仑 XPU 芯片
昆仑 XPU 安装说明
昆仑 XPU 运行示例
昆仑 XPU 支持模型
海光 DCU 芯片
海光 DCU 安装说明
海光 DCU 运行示例
海光 DCU 支持模型
昇腾 NPU 芯片
昇腾 NPU 安装说明
昇腾 NPU 运行示例
寒武纪 MLU 芯片
寒武纪 MLU 安装说明
寒武纪 MLU 运行示例
寒武纪 MLU 支持模型
自定义算子
自定义 C++算子
自定义 C++ 扩展
自定义 Python 算子
环境变量 FLAGS
cudnn
数值计算
调试
check nan inf 工具
设备管理
分布式
执行器
存储管理
昇腾 NPU
其他
硬件支持
飞桨产品硬件支持表
昆仑 XPU 芯片
昆仑 XPU 基于框架的使用指南
昆仑 XPU 基于套件的使用指南
昆仑芯 XPU 支持模型
海光 DCU 芯片
海光 DCU 基于框架的使用指南
海光 DCU 基于套件的使用指南
海光 DCU 验证模型
昇腾 NPU 芯片
昇腾 NPU 基于框架的使用指南
昇腾 NPU 基于套件的使用指南
昇腾 NPU 验证模型
寒武纪 MLU 芯片
寒武纪 MLU 基于框架的使用指南
寒武纪 MLU 基于套件的使用指南
寒武纪 MLU 验证模型
应用实践
快速上手
计算机视觉
自然语言处理
推荐
强化学习
时序数据
动转静
生成式对抗网络
API 文档
贡献指南
概述
代码贡献流程
新增 API 开发&提交流程
贡献前阅读
开发 API Python 端
开发 C++ 算子
API 设计和命名规范
API 文档书写规范
API 单测开发及验收规范
算子性能优化 提交流程
算子性能优化 方法介绍
算子性能优化 验收规范
Kernel Primitive API
API 介绍
API 介绍 - IO
API 介绍 - Compute
API 介绍 - OpFunc
API 示例
示例 - ElementwiseAdd
示例 - Reduce
示例 - Model
算子数据类型扩展 提交流程
算子数据类型扩展 验收规范
低精度算子开发贡献指南
低精度算子支持开发规范
低精度算子单测开发规范
曙光开发指南
曙光智算平台-Paddle 源码编译和单测执行
Paddle 适配 C86 加速卡详解
Paddle 框架下 ROCm(HIP)算子单测修复指导
硬件接入飞桨后端指南
硬件接入飞桨后端方案介绍
训练硬件 Custom Device 接入方案介绍
自定义 Runtime
数据类型
Device 接口
Memory 接口
Stream 接口
Event 接口
集合通讯接口
Profiler 接口
自定义 Kernel
Kernel 函数声明
Kernel 实现接口
Context API
Tensor API
Exception API
Kernel 注册接口
新硬件接入示例
文档贡献指南
规范和参考信息
代码规范
报错信息文案书写规范
代码风格检查指南
Paddle CI 测试详解
Python 文档示例代码书写规范
常见问题与解答
2.0 升级常见问题
安装常见问题
数据及其加载常见问题
组网、训练、评估常见问题
模型保存常见问题
参数调整常见问题
分布式训练常见问题
其他常见问题
2.6.0 Release Note
API 示例
»
贡献指南
»
算子性能优化 提交流程
»
Kernel Primitive API
»
API 示例
在 GitHub 上修改
API 示例
¶
ElementwiseAdd
: 加法操作,输入和输出具有相同 Shape。
Reduce
: 针对最高维进行规约操作。
Model
: Resnet50 执行流程。