快捷方式

函数指标

聚合指标

auc

使用梯形法则计算曲线下面积 (AUC)。

mean

计算加权平均值。

sum

计算加权和。

throughput

计算吞吐量值,即每秒处理的元素数量。

分类指标

binary_accuracy

计算二分类准确率,即输入匹配目标的频率。

binary_auprc

计算 AUPRC,也称为平均精度,它是二分类的精度-召回曲线下的面积。

binary_auroc

计算 AUROC,它是二分类的 ROC 曲线下的面积。

binary_binned_auroc

计算 AUROC,它是二分类的 ROC 曲线下的面积。

binary_binned_precision_recall_curve

使用给定的阈值计算精度-召回曲线。

binary_confusion_matrix

计算二分类混淆矩阵,一个 2x2 的张量,包含计数 ( (真阳性, 假阴性) , (假阳性, 真阴性) )

binary_f1_score

计算二分类 F1 分数,即精度和召回率的调和平均值。

binary_normalized_entropy

计算预测输入和真实二进制目标之间的归一化二进制交叉熵。

binary_precision

计算二分类类的精度分数,计算方法为真阳性 (TP) 数量与预测阳性 (TP + FP) 总数之比。

binary_precision_recall_curve

返回二分类任务的精度-召回对及其对应的阈值。

binary_recall

计算二分类类的召回率,计算方法为真阳性 (TP) 数量与实际阳性 (TP + FN) 总数之比。

binary_recall_at_fixed_precision

返回二分类任务在给定最小精度的情况下可能达到的最高召回率。

multiclass_accuracy

计算准确率,即输入匹配目标的频率。

multiclass_auprc

计算 AUPRC,也称为平均精度,它是多分类的精度-召回曲线下的面积。

multiclass_auroc

计算 AUROC,它是多分类的 ROC 曲线下的面积。

multiclass_binned_auroc

计算 AUROC,它是多分类的 ROC 曲线下的面积。

multiclass_binned_precision_recall_curve

使用给定的阈值计算精度-召回曲线。

multiclass_confusion_matrix

计算多类别混淆矩阵,一个维度为类别数 x 类别数的矩阵,其中位置 (i,j) 处的每个元素是真实类别为 i 但被预测为类别 j 的示例数。

multiclass_f1_score

计算 F1 分数,定义为精度和召回率的调和平均值。

multiclass_precision

计算精度分数,它是真阳性 (TP) 数量与分类为阳性 (TP + FP) 的总点数之比。

multiclass_precision_recall_curve

返回多分类任务的精度-召回对及其对应的阈值。

multiclass_recall

计算召回率,计算方法为真阳性 (TP) 数量与实际阳性 (TP + FN) 总数之比。

multilabel_accuracy

计算多标签准确率,即输入匹配目标的频率。

multilabel_auprc

计算 AUPRC,也称为平均精度,它是多标签分类的精度-召回曲线下的面积。

multilabel_precision_recall_curve

返回多标签分类任务的精度-召回对及其对应的阈值。

multilabel_recall_at_fixed_precision

返回多标签分类任务中每个标签在给定最小精度的情况下可能达到的最高召回率及其对应的阈值。

topk_multilabel_accuracy

计算多标签准确率,即预测的前 k 个标签匹配目标的频率。

排名指标

click_through_rate

根据给定的点击事件计算点击率。

frequency_at_k

根据给定的频率列表和阈值 k 计算频率。

hit_rate

计算正确类别在前 k 个预测类别中的命中率。

num_collisions

根据给定的输入(id)列表计算冲突次数。

reciprocal_rank

计算正确类别在前 k 个预测类别中的倒数排名。

weighted_calibration

计算加权校准指标。

回归指标

mean_squared_error

计算均方误差,它是 输入目标 的平方误差的平均值。其类版本为 torcheval.metrics.MeanSquaredError

r2_score

计算 R 平方分数,它是因变量中可由自变量解释的方差比例。

文本指标

bleu_score

根据每个翻译的翻译和参考计算 BLEU 分数。

perplexity

困惑度衡量模型预测样本数据的程度。

word_error_rate

计算预测词序列与参考词序列的词错误率。

word_information_preserved

计算预测词序列相对于参考词序列的词信息保留分数。

word_information_lost

词信息丢失率是自动语音识别系统性能的指标。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源