参数调整常见问题¶

问题：如何将本地数据传入`paddle.nn.embedding`的参数矩阵中？¶

答复：需将本地词典向量读取为NumPy数据格式，然后使用paddle.nn.initializer.Assign这个API初始化paddle.nn.embedding里的param_attr参数，即可实现加载用户自定义（或预训练）的Embedding向量。

问题：如何实现网络层中多个feature间共享该层的向量权重？¶

答复：你可以使用paddle.ParamAttr并设定一个name参数，然后再将这个类的对象传入网络层的param_attr参数中，即将所有网络层中param_attr参数里的name设置为同一个，即可实现共享向量权重。如使用embedding层时，可以设置param_attr=paddle.ParamAttr(name="word_embedding")，然后把param_attr传入embedding层中。

问题：使用optimizer或ParamAttr设置的正则化和学习率，二者什么差异？¶

答复：ParamAttr中定义的regularizer优先级更高。若ParamAttr中定义了regularizer，则忽略Optimizer中的regularizer；否则，则使用Optimizer中的regularizer。ParamAttr中的学习率默认为1.0，在对参数优化时，最终的学习率等于optimizer的学习率乘以ParamAttr的学习率。

问题：如何导出指定层的权重，如导出最后一层的weights和bias？¶

答复：

在动态图中，使用paddle.save API，并将最后一层的layer.state_dict() 传入至save方法的obj 参数即可，然后使用paddle.load 方法加载对应层的参数值。详细可参考API文档save 和load。
在静态图中，使用paddle.static.save_vars保存指定的vars，然后使用paddle.static.load_vars加载对应层的参数值。具体示例请见API文档：load_vars 和 save_vars 。

问题：训练过程中如何固定网络和Batch Normalization（BN）？¶

答复：

对于固定BN：设置 use_global_stats=True，使用已加载的全局均值和方差：global mean/variance，具体内容可查看官网API文档batch_norm。
对于固定网络层：如： stage1→ stage2 → stage3 ，设置stage2的输出，假设为y，设置 y.stop_gradient=True，那么， stage1→ stage2整体都固定了，不再更新。

问题：训练的step在参数优化器中是如何变化的？¶

答复：

step表示的是经历了多少组mini_batch，其统计方法为exe.run(对应Program)运行的当前次数，即每运行一次exe.run，step加1。举例代码如下：

          # 执行下方代码后相当于step增加了N x Epoch总数
for epoch in range(epochs):
    # 执行下方代码后step相当于自增了N
    for data in [mini_batch_1,2,3...N]:
        # 执行下方代码后step += 1
        exe.run(data)

         

问题：如何修改全连接层参数，比如weight，bias？¶

答复：可以通过param_attr设置参数的属性，paddle.ParamAttr(initializer=paddle.nn.initializer.Normal(0.0, 0.02), learning_rate=2.0)，如果learning_rate设置为0，该层就不参与训练。也可以构造一个numpy数据，使用paddle.nn.initializer.Assign来给权重设置想要的值。

参数调整常见问题¶

问题：如何将本地数据传入paddle.nn.embedding的参数矩阵中？¶

问题：如何实现网络层中多个feature间共享该层的向量权重？¶

问题：使用optimizer或ParamAttr设置的正则化和学习率，二者什么差异？¶

问题：如何导出指定层的权重，如导出最后一层的weights和bias？¶

问题：训练过程中如何固定网络和Batch Normalization（BN）？¶

问题：训练的step在参数优化器中是如何变化的？¶

问题：如何修改全连接层参数，比如weight，bias？¶

问题：如何将本地数据传入`paddle.nn.embedding`的参数矩阵中？¶