torch.nn.functional.kl_div¶

torch.nn.functional.kl_div(input, target, size_average=None, reduce=None, reduction='mean', log_target=False)[源代码][源代码]¶

计算 KL 散度损失。

详情请参阅 KLDivLoss。

参数

input (Tensor) – 对数概率的任意形状张量。
target (Tensor) – 与输入形状相同的张量。有关目标的解释，请参阅 log_target。
size_average (bool, optional) – 已弃用（请参阅 reduction）。默认情况下，损失在批次中的每个损失元素上取平均值。请注意，对于某些损失，每个样本有多个元素。如果字段 size_average 设置为 False，则损失将改为对每个小批量求和。当 reduce 为 False 时，将被忽略。默认值：True
reduce (bool, optional) – 已弃用（请参阅 reduction）。默认情况下，损失根据 size_average 在每个小批量的观测值上取平均值或求和。当 reduce 为 False 时，将改为返回每个批次元素的损失，并忽略 size_average。默认值：True
reduction (str, optional) – 指定应用于输出的缩减方式：'none' | 'batchmean' | 'sum' | 'mean'。'none'：不应用任何缩减 'batchmean'：输出的总和将除以批次大小 'sum'：输出将被求和 'mean'：输出将除以输出中的元素数。默认值：'mean'
log_target (bool) – 一个标志，指示 target 是否在对数空间中传递。建议在对数空间中传递某些分布（如 softmax），以避免由显式 log 引起的数值问题。默认值：False

返回类型

Tensor

注意

size_average 和 reduce 正在逐步弃用，与此同时，指定这两个参数中的任何一个都将覆盖 reduction。

警告

reduction = 'mean' 不会返回真实的 kl 散度值，请使用 reduction = 'batchmean'，这与 KL 数学定义对齐。

文档