选择做印象绍兴网站的原因,网络服务提供商是指什么,网站模仿,无锡百姓网免费发布信息网文章目录 1. 分布不平衡的数据集2. TP、TN 、FP 、FN3. 混淆矩阵4. 各自的计算公式5. 例题应用 1. 分布不平衡的数据集 1. 精度#xff08;precision#xff09;和召回率#xff08;recall#xff09;是衡量机器学习模型性能的重要指标#xff0c;特别是数据集分布不平衡的… 文章目录 1. 分布不平衡的数据集2. TP、TN 、FP 、FN3. 混淆矩阵4. 各自的计算公式5. 例题应用 1. 分布不平衡的数据集 1. 精度precision和召回率recall是衡量机器学习模型性能的重要指标特别是数据集分布不平衡的案例中。 2. 不平衡数据集广泛存在于各种分类问题中包括二分类和多分类问题。以下是一个简单的二分类问题的例子假设有100个样本其中80个样本被标记为类别1其余20个样本被标记为类别2。这个数据集就是不平衡数据集类别1和类别2的样本数量之比为4:1。另一个不平衡分类问题出现在当疾病在公众中的发病率很低时的疾病监测。
2. TP、TN 、FP 、FN 我们检查身体的时候经常会听到检测结果呈真阳性、假阴性等说法。
“真”、假说的是检查结果的对错。”真“意味着检测结果是正确的假意味着检测结果是错误的。“阳性”、阴性说的是此次的检查结果。阳性意味检测出了预定的目标。阴性意味着没查出预定的目标。
检测结果英文术语含义真阳性True Positive正确地检测到阳性结果即检测结果正确并且结果呈现阳性假阳性False Positive错误地检测到阳性结果即检测结果错误并且结果呈现阳性真阴性True Negative正确地检测到阴性结果即检测结果正确并且结果呈现阴性假阴性False Negative错误地检测到阴性结果即检测结果错误并且结果呈现阴性
3. 混淆矩阵 1. 混淆矩阵是机器学习领域中用于精度评价的一种标准格式也被称为误差矩阵。混淆矩阵的每一行代表一个真实的标签每一列代表一个预测的标签。矩阵的对角线元素表示模型正确分类的实例数非对角线元素则表示模型错误分类的实例数。 2.1TPFPTNFN样本总数。2TPFN实际正样本数。3TPFP预测结果为正样本的总数包括预测正确的和错误的。4FPTN实际负样本数。5TNFN预测结果为负样本的总数包括预测正确的和错误的。 4. 各自的计算公式 1. 准确率accuracy就是在全部预测中正确预测结果所占的比例。计算公式为 2. 精度precision就是在全部阳性预测中正确预测结果所占的比例。比如你预报了10次下雨结果只下了3次你的预报的精度就是 0.3因为 TP 3 , FP 7。计算公式为 3. 召回率recall就是在全部阳性事件中正确预测结果所占的比例。比如下了10次雨结果你只正确预报了2次你的预报的召回率就是 0.2因为 TP 2 , FN 8 , P 10。计算公式为 5. 例题应用 下面图片中的红色叉表示真实情况中的正例蓝色圆圈表示真实情况中的反例。 1、答案5、3、0、2、0.625、1.00 2、答案4、2、1、3、0.67、0.80 3、答案3、0、2、5、1.00、0.60 4、答案0.60、0.60、0.60