快捷方式

余弦嵌入损失

class torch.nn.CosineEmbeddingLoss(margin=0.0, size_average=None, reduce=None, reduction='mean')[source]

创建一个标准,用于测量给定输入张量 x1x_1, x2x_2 和一个 Tensor 标签 yy 的损失,其值为 1 或 -1。使用 (y=1y=1) 来最大化两个输入的余弦相似度,否则使用 (y=1y=-1)。这通常用于学习非线性嵌入或半监督学习。

每个样本的损失函数为

loss(x,y)={1cos(x1,x2),if y=1max(0,cos(x1,x2)margin),if y=1\text{loss}(x, y) = \begin{cases} 1 - \cos(x_1, x_2), & \text{if } y = 1 \\ \max(0, \cos(x_1, x_2) - \text{margin}), & \text{if } y = -1 \end{cases}
参数
  • margin (float, 可选) – 应该是一个介于 1-111 之间的数字,建议使用 000.50.5。如果 margin 缺失,则默认值为 00

  • size_average (bool, 可选) – 已弃用(参见 reduction)。默认情况下,损失在批次中的每个损失元素上平均。请注意,对于某些损失,每个样本可能有多个元素。如果字段 size_average 设置为 False,则损失将改为对每个小批量求和。当 reduceFalse 时忽略。默认:True

  • reduce (bool, 可选) – 已弃用(参见 reduction)。默认情况下,损失根据 size_average 在每个小批量的观测值上平均或求和。当 reduceFalse 时,将返回每个批次元素的损失,并忽略 size_average。默认:True

  • reduction (str, 可选) – 指定要应用于输出的缩减:'none' | 'mean' | 'sum''none':不应用任何缩减,'mean':输出的总和将除以输出中的元素数量,'sum':输出将求和。注意:size_averagereduce 正在被弃用,在此期间,指定这两个参数中的任何一个将覆盖 reduction。默认:'mean'

形状
  • 输入 1:(N,D)(N, D)(D)(D),其中 N 是批次大小,D 是嵌入维度。

  • 输入 2:(N,D)(N, D)(D)(D),与输入 1 形状相同。

  • 目标:(N)(N)()().

  • 输出:如果 reduction'none',则为 (N)(N),否则为标量。

示例

>>> loss = nn.CosineEmbeddingLoss()
>>> input1 = torch.randn(3, 5, requires_grad=True)
>>> input2 = torch.randn(3, 5, requires_grad=True)
>>> target = torch.ones(3)
>>> output = loss(input1, input2, target)
>>> output.backward()

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获取您的问题解答

查看资源