企业网站邮箱建设,做网站和做网页的区别,安徽省建设工程信息网平台官网,数据统计网站有哪些查准率和查全率定义 查准率与查全率真的必然负相关吗#xff1f;
先说结论#xff0c;两者并非绝对负相关#xff0c;只是在统计学上表现出大概率的负相关性#xff0c;而数学证明上无法严格证明两个的负相关性。
枚举来证明两者并非必然负相关
一组数据#xff1a;A1、…查准率和查全率定义 查准率与查全率真的必然负相关吗
先说结论两者并非绝对负相关只是在统计学上表现出大概率的负相关性而数学证明上无法严格证明两个的负相关性。
枚举来证明两者并非必然负相关
一组数据A1、B1、C1、D0、E0、F0其中1代表正例0代表反例。 第一次分类预测预测为正例的样本为A1、B1、D0预测为反例的样本为C1、E0、F0此时TP2FP1 FN1TN2P2/3R2/3。 第二次分类预测提高P值预测为正例的样本为A1、B1、C1、D0预测为反例的样本为E0、F0此时TP3FP1 FN0TN2P3/4R1。 从以上枚举可以发现提高PR也可以提高因此证明了并非查准率与查全率真的必然负相关。
逻辑推理证明两者负相关的概率比较大
对于R值分母TPFN样本真实的正例数量必然保持不变。因此要提高R值则只能提高TP在此条件下再来看P值分子提高但是逻辑上来说如果要提高分子也就是预测正例正确的数量那么在其他条件一致的情况下比如预测的机制不变只有尽可能多的预测比如之前预测10个正例正确5个要使得TP增加在不改变预测机制的情况下就只能预测30个正例从概率上来说可能预测正确的数量会高于5个但是因为预测正例的数量增加了概率上来说FP也增加了因此综合起来TP增加的速度可能小于TPFP增加的速度因此P值实际上可能是降低的因为分子增加的速度小于分母增加的速度。所以真实的PR曲线是非光滑的也并非是一直是复斜率的。