roc曲线的意义:原创ROC曲线怎么看,曲线上的每个部分都代表了什么?|小白心理-312/347考研答疑

股票学习网 发布:2021-11-02 10:49:30 阅读:353次

ROC曲线怎么看,曲线上的每个部分都代表了什么?|小白心理-312/347考研答疑

ROC曲线,即receiver operating characteristic curve,接受者操作特征曲线,也称“感受性曲线”。

ROC曲线,接受者操作特征曲线

如上图3-15所示:

对于不同的ROC曲线,其曲率/曲度越大,即离偶然事件的45度对角线越远(对角线代表被试的辨别力为0),被试的辨别力d'越大,感受性越强。

决定ROC曲线的曲度的因素是:1.被试的感受性(感受性越强,曲度越高),2信号的强度(强度越强,曲度越高)

同一条ROC曲线,其辨别力d'(即感受性)是恒定的。在短时间内,对于同一个被试来说,其感受性是客观存在的,不会发生变化。

如上图3-16所示:

ROC曲线的横坐标是虚报率,纵坐标是击中率。

对于同一条ROC曲线,曲线上的点越靠近左下角,说明击中率低,虚报率也低,被试的判断标准β越高。

02

ROC曲线

ROC曲线,其实就是一条二维平面上的曲线,其中X轴为伪阳性率(FPR),Y轴为真阳性率(TPR)。

用直观的话,来理解这两个值,其实就是覆盖率(其实召回率并没有覆盖率好理解)和误报率,我们模型期待的当然就是覆盖率越高越好,而误报率越低越好。

但是覆盖率和误报率这对冤家却没那么听话,结果往往是一个增加,而另一个也会减少。

例如在营销活动中,如果我们要覆盖所有的目标客户,那我们就得对所有人去做营销,这时误报率也是最高的100%,因为所有本来不是目标客户的人都被误判为潜在客户了,营销成本也很大。

把FPR值作为X轴,把TPR值作为Y轴,ROC曲线大概长下面的德行:

从 (0, 0) 到 (1,1) 的对角线(就是上图的虚线)将ROC空间划分为左上/右下两个区域,在这条线的以上的点代表了一个好的分类结果(胜过随机分类),而在这条线以下的点代表了差的分类结果(劣于随机分类)。

完美的预测是一个在左上角的点,在ROC空间座标 (0,1)点,X=0 代表着没有伪阳性,Y=1 代表着没有伪阴性(所有的阳性都是真阳性);也就是说,不管分类器输出结果是阳性或阴性,都是100%正确。

一个随机的预测会得到位于从 (0, 0) 到 (1, 1) 对角线(也叫无识别率线)上的一个点;最直观的随机预测的例子就是抛硬币。

如果在ROC曲线上寻找最优的零界点,那我们可以找曲线上里点(0,1)最近的点。不过在实际应用的时候,往往还没有这么简单,实际在实施的时候,可能会受到现实条件的制约,例如成本等。

例如,如果警察要对人群中的犯罪嫌疑人排除,最优的方案可能是对其中的30%的人进行排查,但受现实警力的条件限制,可能只能对其中的20%的人做排查。

03

怎么画ROC曲线

上面我们说的ROC曲线,但是并没有说是怎么画出来的,网上也有很多介绍ROC曲线的文章,但是很多都没有讲清楚ROC曲线是怎么画出来的。

例如,如果我们使用二分类模型(例如逻辑回归)来判断一个人是否是我们的目标客户,这时模型会得到这个人是目标客户的得分(或者叫概率)。

例如有一个20人的样本集,这20人我们已经知道其分类特征,其中10人是我们的目标客户,另外10人不是,而我们的模型也给每个人打了分数(score),分数越高则是目标客户的概率越大。

我们按照得分倒序排序如下:

其中p表示目标客户,n表示非目标客户。

点击确定输出结果。

四、结果解读

这就是ROC曲线,对角线为参考线。双击图标可进入编辑状态。

这是对ROC曲线下面积的检验,曲线下面积为0.792,P=0.002,有统计学意义,说明ADA对结核的诊断有意义。曲线下面积越大,说明该项检验的诊断效能越大。

这是曲线的坐标点,以及相应的敏感性,1-特异性。

如何确定最佳界值:

除非特别指明,最佳界值的确定常用“尤登指数”,即敏感性+特异性-1,该指数值的取最大值处就是最佳的界值。

利用上表“曲线的坐标”,可以求得各个坐标点敏感性+特异性-1的值,其最大值对应的就是最佳界值。

End.

roc曲线的意义:原创ROC曲线怎么看,曲线上的每个部分都代表了什么?|小白心理-312/347考研答疑所属专题: roc曲线专题   本文《roc曲线的意义:原创ROC曲线怎么看,曲线上的每个部分都代表了什么?|小白心理-312/347考研答疑》链接:http://www.gzhwuliu.cn/31246/
回顶部