[ 输入参数用法不一致 ]torch.nn.SyncBatchNorm¶
torch.nn.SyncBatchNorm¶
torch.nn.SyncBatchNorm(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True, process_group=None, device=None, dtype=None)
paddle.nn.SyncBatchNorm¶
paddle.nn.SyncBatchNorm(num_features, epsilon=1e-5, momentum=0.9, weight_attr=None, bias_attr=None, data_format='NCHW', name=None)
两者功能一致但参数不一致,部分参数名不同,具体如下:
参数映射¶
PyTorch | PaddlePaddle | 备注 |
---|---|---|
num_features | num_features | 表示输入 Tensor 通道数。 |
eps | epsilon | 为了数值稳定加在分母上的值。 |
momentum | momentum | 表示归一化函数中的超参数, PyTorch 和 Paddle 公式实现细节不一致,两者正好是相反的,需要转写。 |
- | weight_attr | 指定权重参数属性的对象。如果为 False, 则表示每个通道的伸缩固定为 1,不可改变。默认值为 None,表示使用默认的权重参数属性。 |
- | bias_attr | 指定偏置参数属性的对象。如果为 False, 则表示每一个通道的偏移固定为 0,不可改变。默认值为 None,表示使用默认的偏置参数属性。 |
- | data_format | 指定输入数据格式, PyTorch 无此参数,Paddle 保持默认即可。 |
affine | - | 是否进行反射变换, Paddle 无此参数,需要转写。 |
track_running_stats | use_global_stats | 表示是否已加载的全局均值和方差。 |
process_group | - | 统计信息的同步分别在每个进程组内发生, Paddle 无此参数,暂无转写方式。 |
device | - | 设备类型,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
dtype | - | 参数类型,Paddle 无此参数,一般对网络训练结果影响不大,可直接删除。 |
转写示例¶
affine:是否进行反射变换¶
affine=False 时,表示不更新:
# PyTorch 写法
m = torch.nn.SyncBatchNorm(24, affine=False)
# Paddle 写法
m = paddle.nn.SyncBatchNorm(24, weight_attr=False, bias_attr=False)
affine=True 时,表示更新:
# PyTorch 写法
m = torch.nn.SyncBatchNorm(24)
# Paddle 写法
m = paddle.nn.SyncBatchNorm(24)
momentum:¶
# PyTorch 写法
m = torch.nn.SyncBatchNorm(24, momentum=0.2)
# Paddle 写法
m = paddle.nn.SyncBatchNorm(24, momentum=0.8)