torch.nn.functional.kl_div¶
- torch.nn.functional.kl_div(input, target, size_average=None, reduce=None, reduction='mean', log_target=False)[源代码][源代码]¶
计算 KL 散度损失。
详情请参阅
KLDivLoss
。- 参数
input (Tensor) – 对数概率的任意形状张量。
target (Tensor) – 与输入形状相同的张量。有关目标的解释,请参阅
log_target
。size_average (bool, optional) – 已弃用(请参阅
reduction
)。默认情况下,损失在批次中的每个损失元素上取平均值。请注意,对于某些损失,每个样本有多个元素。如果字段size_average
设置为False
,则损失将改为对每个小批量求和。当 reduce 为False
时,将被忽略。默认值:True
reduce (bool, optional) – 已弃用(请参阅
reduction
)。默认情况下,损失根据size_average
在每个小批量的观测值上取平均值或求和。当reduce
为False
时,将改为返回每个批次元素的损失,并忽略size_average
。默认值:True
reduction (str, optional) – 指定应用于输出的缩减方式:
'none'
|'batchmean'
|'sum'
|'mean'
。'none'
:不应用任何缩减'batchmean'
:输出的总和将除以批次大小'sum'
:输出将被求和'mean'
:输出将除以输出中的元素数。默认值:'mean'
log_target (bool) – 一个标志,指示
target
是否在对数空间中传递。建议在对数空间中传递某些分布(如softmax
),以避免由显式log
引起的数值问题。默认值:False
- 返回类型
注意
size_average
和reduce
正在逐步弃用,与此同时,指定这两个参数中的任何一个都将覆盖reduction
。警告
reduction
='mean'
不会返回真实的 kl 散度值,请使用reduction
='batchmean'
,这与 KL 数学定义对齐。