如何计算多类的整体准确性,敏感性和特异性?

时间:2019-04-11 14:49:15

标签: machine-learning confusion-matrix multiclass-classification

有人能解释如何计算多类数据集的准确性,敏感性和特异性吗?

谢谢。 enter image description here

1 个答案:

答案 0 :(得分:2)

每个类别的敏感度可以根据其

进行计算

TP /(TP + FN)

每个类别的特异性可以通过其

来计算

TN /(TN + FP)

有关概念和方程式的更多信息 http://en.wikipedia.org/wiki/Sensitivity_and_specificity

对于多类分类,可以对所有方法使用一种。

假设有三类:C1,C2和C3

“ TP of C1”是所有归类为C1的C1实例。

“ C1的TN”是所有未归类为C1的非C1实例。

“ C1的FP”是所有归类为C1的非C1实例。

“ C1的FN”是所有未归类为C1的C1实例。

要查找C2或C3的这四个术语,可以将C1替换为C2或C3。

简单的句子:

在2x2中,一旦您选择了一个类别为正,则另一类别将自动为负。使用9个类别,您基本上有9种不同的敏感度,具体取决于您选择的9种类别中的“阳性”。您可以通过收缩为2x2来计算这些值,即Class1与not-Class1,然后Class2与not-Class2,依此类推。

示例:

我们得到了7种玻璃的混淆矩阵:

=== Confusion Matrix ===

  a  b  c  d  e  f  g   <-- classified as
 50 15  3  0  0  1  1 |  a = build wind float
 16 47  6  0  2  3  2 |  b = build wind non-float
  5  5  6  0  0  1  0 |  c = vehic wind float
  0  0  0  0  0  0  0 |  d = vehic wind non-float
  0  2  0  0 10  0  1 |  e = containers
  1  1  0  0  0  7  0 |  f = tableware
  3  2  0  0  0  1 23 |  g = headlamps

每种玻璃的真实阳性率(灵敏度)加上总加权平均值:

=== Detailed Accuracy By Class ===

 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
 0.714    0.174    0.667      0.714    0.690      0.532    0.806     0.667     build wind float
 0.618    0.181    0.653      0.618    0.635      0.443    0.768     0.606     build wind non-float
 0.353    0.046    0.400      0.353    0.375      0.325    0.766     0.251     vehic wind float
 0.000    0.000    0.000      0.000    0.000      0.000    ?         ?         vehic wind non-float
 0.769    0.010    0.833      0.769    0.800      0.788    0.872     0.575     containers
 0.778    0.029    0.538      0.778    0.636      0.629    0.930     0.527     tableware
 0.793    0.022    0.852      0.793    0.821      0.795    0.869     0.738     headlamps
 0.668    0.130    0.670      0.668    0.668      0.539    0.807     0.611     Weighted Avg.