题目
在模型性能评估中,以下哪个指标用于衡量模型区分不同类别能力?A. 准确率(Accuracy)B. 精确率(Precision)C. 召回率(Recall)D. ROC-AUC分数
在模型性能评估中,以下哪个指标用于衡量模型区分不同类别能力?
A. 准确率(Accuracy)
B. 精确率(Precision)
C. 召回率(Recall)
D. ROC-AUC分数
题目解答
答案
D. ROC-AUC分数
解析
本题考查模型性能评估指标的相关知识,解题思路是分别分析每个选项所代表的指标含义,判断其是否用于衡量模型区分不同类别能力。
- 选项A:准确率(Accuracy)
准确率是指分类正确的样本数占总样本数的比例,其计算公式为:
$Accuracy = \frac{TP + TN}{TP + TN + FP + FN}$
其中,$TP$(True Positive)表示真正例,即实际为正类且被模型预测为正类的样本数;$TN$(True Negative)表示真反例,即实际为反类且被模型预测为反类的样本数;$FP$(False Positive)表示假正例,即实际为反类但被模型预测为正类的样本数;$FN$(False Negative)表示假反例,即实际为正类但被模型预测为反类的样本数。
准确率主要反映了模型整体的分类正确程度,但它不能很好地衡量模型区分不同类别样本的能力,尤其是在类别不平衡的情况下,准确率可能会产生误导。 - 选项B:精确率(Precision)
精确率是指被预测为正类的样本中,实际为正类的样本所占的比例,其计算公式为:
$Precision = \frac{TP}{TP + FP}$
精确率主要关注的是模型预测为正类的样本的准确性,它衡量的是模型在预测正类时的可靠性,但不能全面地反映模型区分不同类别样本的能力。 - 选项C:召回率(Recall)
召回率是指实际为正类的样本中,被模型预测为正类的样本所占的比例,其计算公式为:
$Recall = \frac{TP}{TP + FN}$
召回率主要关注的是模型对正类样本的识别能力,它衡量的是模型在实际正类样本中能够正确识别出的比例,但同样不能全面地反映模型区分不同类别样本的能力。 - 选项D:ROC - AUC分数
ROC曲线(Receiver Operating Characteristic curve)是一种用于评估二分类模型性能的工具,它以假正例率(False Positive Rate,FPR)为横坐标,真正例率(True Positive Rate,TPR)为纵坐标绘制而成。其中,假正例率的计算公式为:
$FPR = \frac{FP}{FP + TN}$
真正例率的计算公式为:
$TPR = \frac{TP}{TP + FN}$
AUC(Area Under the Curve)是ROC曲线下的面积,其取值范围在0到1之间。AUC值越接近1,说明模型的区分能力越强;AUC值越接近0.5,说明模型的区分能力越弱,相当于随机猜测。因此,ROC - AUC分数可以很好地衡量模型区分不同类别样本的能力。