因为随着阈值的逐渐变大(从0-1),我们发现sensitivities在逐渐变小,而specificities在逐渐变大。我们取极端情况考虑,当阈值为0时,大于0的全为正例,即模型能完美的找出所有正例(敏感性=1),但很可惜,所有的负例也被定义为正例,故特异性=0,反之阈值=1时也成立。在正常情况下,我们肯定不愿意让模型瞎猜乱蒙,故我们需要一种均衡(统计优化),类似于方差-残差均衡(但现实情况不一定完全一致),我们希望二者都能同时达到相对最优的状态。所以有最佳阀值
为了获取ROC曲线的最佳阈值,需要使用一个指标--约登指数,也称正确指数。
借助于matlab的roc函数可以得出计算。
ROC曲线下的面积值在1.0和0.5之间。在AUC>0.5的情况下,AUC越接近于1