torch.nn.utils.clip_grads_with_norm_¶
- torch.nn.utils.clip_grads_with_norm_(parameters, max_norm, total_norm, foreach=None)[source]¶
根据预先计算的总范数和期望的最大范数,缩放参数迭代器的梯度。
梯度将根据以下公式进行缩放
梯度会被原地修改。
此函数等同于使用预先计算的总范数的
torch.nn.utils.clip_grad_norm_()
。
根据预先计算的总范数和期望的最大范数,缩放参数迭代器的梯度。
梯度将根据以下公式进行缩放
梯度会被原地修改。
此函数等同于使用预先计算的总范数的 torch.nn.utils.clip_grad_norm_()
。