Sensitivity vs. Specificity

灵敏度和特异度是统计学中用来表征二项分类测试特征的数据。

灵敏度

灵敏度(Sensitivity,也称为真阳性率、召回率(Recall))是指实际为阳性的样本中,判断为阳性的比例(例如真正有生病的人中,被医院判断为有生病者的比例),计算方式是真阳性除以真阳性+假阴性(实际为阳性,但判断为阴性)的比值。

特异度

特异度(Specificity,也称为真阴性率)是指实际为阴性的样本中,判断为阴性的比例(例如真正未生病的人中,被医院判断为未生病者的比例),计算方式是真阴性除以真阴性+假阳性(实际为阴性,但判断为阳性)的比值。

说明

灵敏度可以作为避免假阴性的量化指标,而特异度可以作为避免假阳性的量化指标。对于任何测试而言,都需要在灵敏度及特异度之间进行取舍。

例如机场安检中对于登机人员是否有携带危险物品的检查,扫描器可能会在检查到像皮带头或锁匙等低危险物品时触发(低特异度),但会减少实际携带了危险物品,但没有检查到的可能性(高灵敏度)。

这个取舍可以用ROC曲线(接收者操作特征曲线)来表示。完美的分类器可以达到100%的灵敏度(所有生病的人都会检测为生病),及100%的特异度(没有一个健康不生病的人会被检测为生病)。但是理论上所有的分类器都会有最小的误差范围,称为贝叶斯错误率。

举例

在个100人的样本中,有10人事实上患有A病(阳性),经过检测后,9人判定患有A病(真阳性),而1人判定并不患有A病(假阴性); 另外的90人实际上并不患有A病(阴性),然后经过检测后,其中的5人被判定患有A病(假阳性),另外的85人判定不患有A病(真阴性)。

灵敏度 = 真阳性 / (真阳性 + 假阴性) = 9/(9+1) = 90% 特异度 = 真阴性 / (真阴性 + 假阳性) = 85/(85+5) = 94.4%

此处,灵敏度即为在患病人群中,成功确证患病的概率;而特异度即为在不患病的人群中,成功排除患病的概率。