目录

快捷方式

函数指标¶

聚合指标¶

`auc`	使用梯形法则计算曲线下面积 (AUC)。
`mean`	计算加权平均值。
`sum`	计算加权和。
`throughput`	计算吞吐量值，即每秒处理的元素数量。

分类指标¶

`binary_accuracy`	计算二分类准确率，即输入匹配目标的频率。
`binary_auprc`	计算 AUPRC，也称为平均精度，它是二分类的精度-召回曲线下的面积。
`binary_auroc`	计算 AUROC，它是二分类的 ROC 曲线下的面积。
`binary_binned_auroc`	计算 AUROC，它是二分类的 ROC 曲线下的面积。
`binary_binned_precision_recall_curve`	使用给定的阈值计算精度-召回曲线。
`binary_confusion_matrix`	计算二分类混淆矩阵，一个 2x2 的张量，包含计数 ( (真阳性, 假阴性) , (假阳性, 真阴性) )
`binary_f1_score`	计算二分类 F1 分数，即精度和召回率的调和平均值。
`binary_normalized_entropy`	计算预测输入和真实二进制目标之间的归一化二进制交叉熵。
`binary_precision`	计算二分类类的精度分数，计算方法为真阳性 (TP) 数量与预测阳性 (TP + FP) 总数之比。
`binary_precision_recall_curve`	返回二分类任务的精度-召回对及其对应的阈值。
`binary_recall`	计算二分类类的召回率，计算方法为真阳性 (TP) 数量与实际阳性 (TP + FN) 总数之比。
`binary_recall_at_fixed_precision`	返回二分类任务在给定最小精度的情况下可能达到的最高召回率。
`multiclass_accuracy`	计算准确率，即输入匹配目标的频率。
`multiclass_auprc`	计算 AUPRC，也称为平均精度，它是多分类的精度-召回曲线下的面积。
`multiclass_auroc`	计算 AUROC，它是多分类的 ROC 曲线下的面积。
`multiclass_binned_auroc`	计算 AUROC，它是多分类的 ROC 曲线下的面积。
`multiclass_binned_precision_recall_curve`	使用给定的阈值计算精度-召回曲线。
`multiclass_confusion_matrix`	计算多类别混淆矩阵，一个维度为类别数 x 类别数的矩阵，其中位置 (i,j) 处的每个元素是真实类别为 i 但被预测为类别 j 的示例数。
`multiclass_f1_score`	计算 F1 分数，定义为精度和召回率的调和平均值。
`multiclass_precision`	计算精度分数，它是真阳性 (TP) 数量与分类为阳性 (TP + FP) 的总点数之比。
`multiclass_precision_recall_curve`	返回多分类任务的精度-召回对及其对应的阈值。
`multiclass_recall`	计算召回率，计算方法为真阳性 (TP) 数量与实际阳性 (TP + FN) 总数之比。
`multilabel_accuracy`	计算多标签准确率，即输入匹配目标的频率。
`multilabel_auprc`	计算 AUPRC，也称为平均精度，它是多标签分类的精度-召回曲线下的面积。
`multilabel_precision_recall_curve`	返回多标签分类任务的精度-召回对及其对应的阈值。
`multilabel_recall_at_fixed_precision`	返回多标签分类任务中每个标签在给定最小精度的情况下可能达到的最高召回率及其对应的阈值。
`topk_multilabel_accuracy`	计算多标签准确率，即预测的前 k 个标签匹配目标的频率。

排名指标¶

`click_through_rate`	根据给定的点击事件计算点击率。
`frequency_at_k`	根据给定的频率列表和阈值 k 计算频率。
`hit_rate`	计算正确类别在前 k 个预测类别中的命中率。
`num_collisions`	根据给定的输入（id）列表计算冲突次数。
`reciprocal_rank`	计算正确类别在前 k 个预测类别中的倒数排名。
`weighted_calibration`	计算加权校准指标。

回归指标¶

`mean_squared_error`	计算均方误差，它是输入和目标的平方误差的平均值。其类版本为 `torcheval.metrics.MeanSquaredError`。
`r2_score`	计算 R 平方分数，它是因变量中可由自变量解释的方差比例。

文本指标¶

`bleu_score`	根据每个翻译的翻译和参考计算 BLEU 分数。
`perplexity`	困惑度衡量模型预测样本数据的程度。
`word_error_rate`	计算预测词序列与参考词序列的词错误率。
`word_information_preserved`	计算预测词序列相对于参考词序列的词信息保留分数。
`word_information_lost`	词信息丢失率是自动语音识别系统性能的指标。

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源