题目

在模型性能评估中,以下哪个指标用于衡量模型区分不同类别能力?A. 准确率(Accuracy)B. 精确率(Precision)C. 召回率(Recall)D. ROC-AUC分数

在模型性能评估中,以下哪个指标用于衡量模型区分不同类别能力?

A. 准确率(Accuracy)

B. 精确率(Precision)

C. 召回率(Recall)

D. ROC-AUC分数

题目解答

答案

D. ROC-AUC分数

解析

本题考查模型性能评估指标的相关知识，解题思路是分别分析每个选项所代表的指标含义，判断其是否用于衡量模型区分不同类别能力。

选项A：准确率(Accuracy)
准确率是指分类正确的样本数占总样本数的比例，其计算公式为：
$Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$
其中，$TP$（True Positive）表示真正例，即实际为正类且被模型预测为正类的样本数；$TN$（True Negative）表示真反例，即实际为反类且被模型预测为反类的样本数；$FP$（False Positive）表示假正例，即实际为反类但被模型预测为正类的样本数；$FN$（False Negative）表示假反例，即实际为正类但被模型预测为反类的样本数。
准确率主要反映了模型整体的分类正确程度，但它不能很好地衡量模型区分不同类别样本的能力，尤其是在类别不平衡的情况下，准确率可能会产生误导。
选项B：精确率(Precision)
精确率是指被预测为正类的样本中，实际为正类的样本所占的比例，其计算公式为：
$Precision = \frac{TP}{TP + FP}$
精确率主要关注的是模型预测为正类的样本的准确性，它衡量的是模型在预测正类时的可靠性，但不能全面地反映模型区分不同类别样本的能力。
选项C：召回率(Recall)
召回率是指实际为正类的样本中，被模型预测为正类的样本所占的比例，其计算公式为：
$Recall = \frac{TP}{TP + FN}$
召回率主要关注的是模型对正类样本的识别能力，它衡量的是模型在实际正类样本中能够正确识别出的比例，但同样不能全面地反映模型区分不同类别样本的能力。
选项D：ROC - AUC分数
ROC曲线（Receiver Operating Characteristic curve）是一种用于评估二分类模型性能的工具，它以假正例率（False Positive Rate，FPR）为横坐标，真正例率（True Positive Rate，TPR）为纵坐标绘制而成。其中，假正例率的计算公式为：
$FPR = \frac{FP}{FP + TN}$
真正例率的计算公式为：
$TPR = \frac{TP}{TP + FN}$
AUC（Area Under the Curve）是ROC曲线下的面积，其取值范围在0到1之间。AUC值越接近1，说明模型的区分能力越强；AUC值越接近0.5，说明模型的区分能力越弱，相当于随机猜测。因此，ROC - AUC分数可以很好地衡量模型区分不同类别样本的能力。