微啦网 首页 > 健康

ROC~本倔强

2019-08-13 06:17 梁永平

摇滚(Rock and Roll)肉肯肉,灵活大胆和富有激情,起源于20世纪40年代末期的美国,50年代早期开始流行,60~70年形成一股热潮。在那个大国对抗,体系崩塌的动荡年代摇滚乐凭借独有的魅力风靡全球,大师辈出、万丈光芒的黄金时代!

今天介绍的这个是摇滚的表弟,他就是集编曲天赋与演奏才华于一身的ROC曲线~

诊断性试验的常用评价指标中,Se、Sp、+LR和-LR属于稳定指标(那稳定性刚刚滴如tank一般,稳刚!)

展开全文

Acc为相对稳定指标,而PPV和NPV为不稳定的指标(不提也罢~Σ( ° △ °|||)︴)。

小天使的大名叫做~受试者工作特征曲线(receiver operator characteristic curve, ROC曲线),

这个名字源于评价雷达性能而生的,所以小名儿叫:接收者操作特性曲线。

ROC基于SE(sensitivity)和SP(specificity)衍生出来,且只能用于二分类模型的评价。

ROC曲线是以真阳TPR(SE)为纵坐标,FPR假阳(1-SP)为横坐标绘制的曲线。

诊断模型的其他指标都依赖一个threshold(临界值或阈值),单一的界点是有偏颇的。

ROC:每个分类器作出的预测,都是基于一个probability score(机率评分)。一般默认的threshold都是0.5,如果probability>0.5,那么这个sample被模型分成正例了,反之则是反例。

ROC曲线是一系列threshold下的(FPR,TPR)数值点的连线。不同阈值下模型的sensitivity和specificity不同。

(0,0):TP=0,FP=0,可以发现该分类器预测所有的样本都为负样本(Negative) (1,1):TN=0,FN=0,可以发现该分类器预测所有的样本都为正样本(Positive) (0,1):FP=0,FN=0,它将所有的样本都正确分类 (1,0):TP=0,TN=0,它将所有的样本都错误分类

ROC曲线 检验项目(自变量)一般为连续性变量(各类检查的测值)前篇提过的"拉面"!而非"投钢镚儿"这类离散变量!

ROC曲线的金标准(因变量)一般为生存/死亡~二分类变量(阳性/阴性 ~飞机 、飞鸟~正面、反面)。

二、ROC曲线有个鸟用?

1.ROC曲线能很容易地查出:任意界限值时的对疾病的识别能力。

三、ROC曲线的关键点

1.正确选择临界点(cutoff)

1)Se越高,漏诊病例越少;而1-Sp越低,误诊率越少!ROC曲线上两值都取得最好的效果,左上角找!

2)最近左上角那点为最佳临界点(敏感度与特异度都较高,假阳性与假阴性也最少),点上的值即

最佳临界值=约登指数取得最大值的界值(约登指数=敏感度+特异度-1)

2.AUC用于评估试验的诊断价值

AUC(area under the ROC curve, AUC)即ROC曲线下面积,AUC越大越好,提示该分类器效果越好(试验的诊断价值越高)。AUC的意义:分别随机从正负样本集中抽取一个正样本,一个负样本,正样本的预测值大于负样本的概率。Wilcoxon-Mann-Witney Test。

1)AUC≈1.0:最理想的检查指标,天仙姐姐Ἀφροδίτη(Aphrodite),只在神话中;