torch.nn.functional.kl_div¶
- torch.nn.functional.kl_div(input, target, size_average=None, reduce=None, reduction='mean', log_target=False)[source][source]¶
计算 KL 散度损失。
详情请参阅
KLDivLoss
。- 参数
input (Tensor) – 形状任意的对数概率张量。
target (Tensor) – 形状与 input 相同的张量。关于 target 的解释,请参阅
log_target
。size_average (bool, 可选) – 已弃用(请参阅
reduction
)。默认情况下,损失会在 batch 中的每个损失元素上平均。请注意,对于某些损失,每个样本有多个元素。如果将size_average
字段设置为False
,则改为对每个 mini-batch 的损失求和。当 reduce 为False
时,忽略此参数。默认值:True
reduce (bool, 可选) – 已弃用(请参阅
reduction
)。默认情况下,根据size_average
对每个 mini-batch 的观测值进行平均或求和。当reduce
为False
时,返回每个 batch 元素的损失,并忽略size_average
。默认值:True
reduction (str, 可选) – 指定应用于输出的归约方式:
'none'
|'batchmean'
|'sum'
|'mean'
。'none'
:不应用归约。'batchmean'
:输出的总和将除以 batch 大小。'sum'
:对输出求和。'mean'
:输出将除以输出中的元素数量。默认值:'mean'
log_target (bool) – 一个标志,指示 target 是否以对数空间传入。建议在对数空间中传入某些分布(如
softmax
),以避免显式log
引起的数值问题。默认值:False
- 返回类型
注意
size_average
和reduce
正在弃用中,在此期间,指定这两个参数中的任何一个将覆盖reduction
。警告
reduction
='mean'
不会返回真正的 KL 散度值,请使用reduction
='batchmean'
,它与 KL 数学定义一致。