torch.nn.functional.cross_entropy¶
- torch.nn.functional.cross_entropy(input, target, weight=None, size_average=None, ignore_index=-100, reduce=None, reduction='mean', label_smoothing=0.0)[source][source]¶
计算输入 logits 和目标之间的交叉熵损失。
有关详细信息,请参阅
CrossEntropyLoss
。- 参数
input (Tensor) – 预测的未归一化 logits;有关支持的形状,请参阅下面的 Shape 部分。
target (Tensor) – 真实标签类别索引或类别概率;有关支持的形状,请参阅下面的 Shape 部分。
weight (Tensor, optional) – 赋予每个类别的手动重缩放权重。如果给定,则必须是大小为 C 的 Tensor
size_average (bool, optional) – 已弃用(请参阅
reduction
)。默认情况下,损失在批次中每个损失元素上取平均值。 请注意,对于某些损失,每个样本有多个元素。如果字段size_average
设置为False
,则损失将改为为每个小批量求和。当 reduce 为False
时忽略。默认值:True
ignore_index (int, optional) – 指定一个要忽略的目标值,该值不影响输入梯度。当
size_average
为True
时,损失在非忽略目标上取平均值。请注意,ignore_index
仅在目标包含类别索引时适用。默认值: -100reduce (bool, optional) – 已弃用(请参阅
reduction
)。默认情况下,损失根据size_average
在每个小批量的观测值上取平均值或求和。当reduce
为False
时,返回每个批次元素的损失,并忽略size_average
。默认值:True
reduction (str, optional) – 指定应用于输出的缩减方式:
'none'
|'mean'
|'sum'
。'none'
:不应用任何缩减,'mean'
:输出的总和将除以输出中的元素数量,'sum'
:输出将被求和。注意:size_average
和reduce
正在被弃用,在此期间,指定这两个参数中的任何一个都将覆盖reduction
。默认值:'mean'
label_smoothing (float, optional) – [0.0, 1.0] 范围内的浮点数。指定计算损失时的平滑量,其中 0.0 表示不平滑。目标变为原始真实标签和均匀分布的混合,如 Rethinking the Inception Architecture for Computer Vision 中所述。默认值: 。
- 返回类型
- 形状
输入:形状 , 或 其中 在 K 维损失的情况下。
目标:如果包含类别索引,则形状为 , 或 其中 在 K 维损失的情况下,其中每个值应介于 之间。 如果包含类别概率,则形状与输入相同,并且每个值应介于 之间。
其中
示例
>>> # Example of target with class indices >>> input = torch.randn(3, 5, requires_grad=True) >>> target = torch.randint(5, (3,), dtype=torch.int64) >>> loss = F.cross_entropy(input, target) >>> loss.backward() >>> >>> # Example of target with class probabilities >>> input = torch.randn(3, 5, requires_grad=True) >>> target = torch.randn(3, 5).softmax(dim=1) >>> loss = F.cross_entropy(input, target) >>> loss.backward()