首页天道酬勤precision,查准率和查全率

precision,查准率和查全率

张世龙 06-24 05:19 17次浏览

查准率和查全率1 .概念解读2. F 1 F_1 F1度量3 .了解ff _ _ beta f度量

1 .概念解读

在两个分类问题中,非对是错误的

实际情况\预测情况positivenegativetruetptnfalsefpfn http://www.Sina.com /以上图表是反例,错误的原因是T\F的使用,t表示预测正确,f表示预测错误

实际情况\预测情况positivenegativetruetpfnfalsefptn核对率

precison=tptp fn\text RM { precison }=\frac {\math RM { TP } { tpfn } precison=TPF NTP比对率

recall=tptp FP\text RM { recall }=\frac {\math RM { TP } { tpfp } recall=tpfptprecision }表示在您认为正确的样本中有多少

全率(Recall )在所有正确的样本中,找到了多少,或者判断为有多少是正确的?

Notice:我刚接触这两个概念的时候,总是笨得不明白,在这里记录下我现在的看法。 当在水平方向上观看数据集的正和负分布时,上面的数据包括正集合: TP(fn (文本RM (TP ) cup ) textRM(fn ) TP(fn ); 负集: FP(TN (文本RM (FP ) cup )文本RM ) TN ) FP(TN )。 首先,准确率和准确率的分子都是TP \textrm{TP} TP,表示所有准确率的正集合,准确率以被认为预测集合正确的样本为对象,分母为T P F

P TP+FP TP+FP;查全率针对的是所有正确的样例,分母是 T P + F N TP+FN TP+FN。

这里有一个问题: :查准率和查全率是一对矛盾的度量。一般来说查准率高时,查全率往往偏低;反之同理。 可是为什么就不能两个都高呢?
引用西瓜书上面的回答:

若希望将好瓜尽可能多的选出来,则可通过增加选瓜的数量来实现,如果将所有的西瓜都选上,那么所有的好瓜也必然都被选上了,但这样查准率就会较低,通常只有简单的问题,才会使查全率和查准率都很高。

2. F 1 F_1 F1​度量

F 1 F_1 F1​度量是基于查全率与查准率的调和平均(harmonic mean)。
定义为:
1 F 1 = 1 2 ( 1 P + 1 R ) \frac{1}{F_1}=\frac{1}{2}(\frac{1}{P}+\frac{1}{R}) F1​1​=21​(P1​+R1​)
F 1 = 2 × P × R P + R = 2 × T P 2 × T P + F P + F N F_1=\frac{2\times P\times R}{P+R}=\frac{2\times TP}{2\times TP+FP+FN} F1​=P+R2×P×R​=2×TP+FP+FN2×TP​

3. F β F_\beta Fβ​度量

F β F_\beta Fβ​是加权调和平均,是F1度量的一般形式。
1 F β = 1 1 + β 2 ( 1 P + β 2 R ) \frac{1}{F_\beta}=\frac{1}{1+\beta^2}(\frac{1}{P}+\frac{\beta^2}{R}) Fβ​1​=1+β21​(P1​+Rβ2​)

recall指标,precision怎么算 precision,逻辑回归分类阈值