torch.nn.functional.kl_div¶

torch.nn.functional.kl_div(input, target, size_average=None, reduce=None, reduction='mean', log_target=False)[源代码]¶

计算 KL 散度损失。

有关详细信息，请参见 KLDivLoss。

参数

input (张量) – 对数概率中任意形状的张量。
target (张量) – 与输入具有相同形状的张量。有关目标的解释，请参见 log_target。
size_average (布尔值，可选) – 已弃用（请参见 reduction）。默认情况下，损失在批次中每个损失元素上取平均值。请注意，对于某些损失，每个样本有多个元素。如果字段 size_average 设置为 False，则损失将针对每个小批次进行求和。在 reduce 为 False 时忽略。默认值：True
reduce (布尔值，可选) – 已弃用（请参见 reduction）。默认情况下，损失在每个小批次中针对观测结果取平均值或求和，具体取决于 size_average。当 reduce 为 False 时，返回每个批次元素的损失，并忽略 size_average。默认值：True
reduction (字符串，可选) – 指定要应用于输出的缩减：'none' | 'batchmean' | 'sum' | 'mean'。 'none'：不应用任何缩减 'batchmean'：输出的总和将除以批次大小 'sum'：输出将求和 'mean'：输出将除以输出中的元素数量默认值：'mean'
log_target (布尔值) – 一个标志，指示是否在对数空间中传递 target。建议在对数空间中传递某些分布（例如 softmax），以避免由于显式 log 导致的数值问题。默认值：False

返回类型

张量

注意

size_average 和 reduce 正在被弃用，同时，指定这两个参数中的任何一个都会覆盖 reduction。

警告

reduction = 'mean' 不会返回真正的 kl 散度值，请使用 reduction = 'batchmean'，它与 KL 数学定义一致。

文档