当前位置: 首页 > news >正文

浙江百度查关键词排名最优惠的网站优化

浙江百度查关键词排名,最优惠的网站优化,装修设计软件免费版下载,网络营销软文范例5001.回归模型 回归模型常常使用MSE均方误差#xff0c;预测值与真实值之间的平均差距 2.分类模型 2.1 Accuracy正确率 分类正确的数目的占比 但在类别不平衡的情况下#xff0c;模型可能倾向于预测占多数的类别#xff0c;导致Acc高但对少数类别的预测效果其实比较差的。…1.回归模型 回归模型常常使用MSE均方误差预测值与真实值之间的平均差距 2.分类模型 2.1 Accuracy正确率 分类正确的数目的占比     但在类别不平衡的情况下模型可能倾向于预测占多数的类别导致Acc高但对少数类别的预测效果其实比较差的。 2.2 类别不平衡的指标 1.先验知识 假设1为positive正向类-1为negative负向类。对于一个分类模型会有如下情况 ​ True positiveTP预测为positive实际上确实为positive。正确的预测了正向类 False negativeFN预测为negative实际上却为positive。错误的预测成负向类False positiveFP预测为positive实际上却为negative。错误的预测成正向类 True negativeTN预测为negative实际上确实为negative。正确的预测了负向类 样本总数量TotalTPFNTN 正向类样本数量PTPFN 负向类样本数量NTNFP 于是我们可以得到一些指标 ​   2.Receiver Operating Characteristics Curve,ROC——接受者操作特征曲线 2.1 如何得到ROC曲线 假设我们有一个二分类模型也就是逻辑回归模型​ ​         注意现在这个式子和以前有些不同现在多了一个阈值thresholdb当​时经过sigmoid函数输出会大于0.5最终会输出1有些地方的描述是修改输出1的阈值两者想要说明的效果是一样的 当b趋向于-∞时恒0即恒0.5,最终对于任意x输入都预测为1。此时FN0,TN0,          当b趋向于∞时恒0即恒0.5,最终对于任意x输入都预测为1。此时FN0,TN0,         当b由小变大时FRP和TPR的值都会增加 最终对于每一个b我们都可以得到一对TRP和FPR的值以FPR为x轴TPR为y轴绘制的图就是ROC图如下图示例 在二元分类任务中ROC曲线用于描述接受真正样本并同时拒绝负样本的学习模型的性能。 2.2 如何通过ROC曲线判断比较模型性能 通常我们希望模型的TPR更高而FPR更低 第一种方法更靠近左上角的曲线性能是更好的因为PR更高而FPR更低 如蓝色的曲线的模型就好于红色曲线的模型 第二种方法通过ROC曲线下方与坐标轴围成的面积大小AUCArea under the curve,AUC越大对应的模型性能越好。故又叫AUC-ROC曲线 2.3 对角线的意义 AUC-ROC 曲线的对角线代表随机猜测模型的性能。这条对角线是指当模型对样本进行随机分类时得到的 ROC 曲线。在这条对角线上TPRFPR因为随机猜测的模型的正确率为0.5对正负样本的分类没有区分度所以这种情况下 ROC 曲线表现为一条直线斜率为 1。 对于 AUC-ROC 曲线如果一个模型的 ROC 曲线在对角线上方AUC 值大于 0.5表示模型的性能优于随机猜测而如果 ROC 曲线在对角线以下AUC 值小于 0.5则说明模型性能不如随机猜测。 因此AUC-ROC 曲线下的面积AUC 值越接近于 1代表模型的性能越好而越接近 0.5则说明模型的性能越接近于随机猜测。 3.Precision and Recall 3.1 定义 1.召回率/查全率Recall召回率是指在所有实际属于正类别的样本中被分类器正确预测为正类别的样本所占的比例。例在所有实际上有恶性肿瘤的病人中成功预测有恶性肿瘤的百分比 2.精确率/查准率Precision精确率是指在所有被分类器预测为正类别的样本中实际上确实属于正类别的样本所占的比例。例我所有我们预测有恶性肿瘤的病人中实际上由恶性肿瘤的病人的百分比 3.2 性质 召回率和精确率适用于类别不平衡 提高精确率可能会导致召回率下降常常是提高预测1的阈值因为模型更谨慎更倾向于只将非常确信是正例的样本预测为正例这可能导致漏掉一些的真正例从而降低召回率。 提高召回率可能会导致精确率下降常常是降低预测1的阈值因为模型更倾向于将更多的样本预测为正例包括一些可能不是真正正例的样本这可能会增加假正例的数量从而降低精确率。 一个好的模型两者都应该兼并良好的精确率和召回率​​​​​ 3.3 PR-curve 同样的我们将不同的阈值情况下得到两者的值绘制成图表就得到了PR-curve 3.4 平均精度Average PrecisionAP PR-curve曲线与坐标轴围成的面积。AP 考虑了不同阈值下精确率和召回率之间的平衡一个较高的 AP 值意味着在保持高精确率的同时也能保持较高的召回率。AP是针对单个类来说的。 3.5 Mean Average Precision (mAP) mAP 是衡量模型对多个类别的检测性能的常见指标。对每个类别都会计算其对应的 AP然后将所有类别的 AP 取平均得到 mAP。 C代表类别数目 当类别平衡时我们更关注精确率而不是召回率于是mAP可以修改为如下 ​​​​​​​        ​​​​​​​        ​​​​​​​ 直接使用每个类精确率的均值 3.6 F-Score F-分数是精确率和召回率的加权调和平均值用于评估模型在不同类别之间取得平衡的能力。 β 用于调整 F-分数中精确率和召回率的权重产生不同的平衡效果。 当 β 1 时模型对召回率的重视程度更高F-分数更倾向于关注召回率。当 β 1 时模型对精确率的重视程度更高F-分数更倾向于关注精确率。当 β 1 时即为 F1-Score ​​​​​​​        ​​​​​​​        ​​​​​​​        ​​​​​​​         2.3 混淆矩阵Confusion Matrix 混淆矩阵是一个分类情况的可视化工具 混淆矩阵的每一列代表了模型预测类别每一列方格总数目代表模型预测该列类别的数目/占比每一行代表了数据的真实类别每一行方格总数目代表真实该行类别的数目/占比行列反过来也可以方格中以数目或者比例的形式显示常常还会有热力图提高可视化效果 ​​​​​​​ 解读一下这个混淆矩阵 类别共有三类setosaversicolorvirginica13代表模型预测为setosa同时真实标签也为setosa为13个10代表模型预测为versicolor同时真实标签为versicolor为10个依次类推 ​​​​​​​         左上角1代表所有的setosa都被正确预测0.62代表模型预测versicolor正确的占versicolor总数目比例62%另外有38%被预测成了virginica
http://www.zqtcl.cn/news/797799/

相关文章:

  • 2022建站市场国际新闻直播
  • 茗哥网站建设装饰公司网站规划方案
  • 北京天津网站建设公司做平台网站要多久
  • 做我女朋友的表白句的网站做seo_教你如何选择网站关键词
  • 如何对网站用户分析徐州网站制作如何定位
  • 网站定制生成器龙岗网站设计讯息
  • 镇江市建设工程网站蜘蛛爬取网站
  • 个人备案网站可以做电影站吗微信做的地方门户网站
  • 网站上传根目录美点网络公司网站
  • 长春微信做网站网站开发和设计如何合作
  • 江门网站制作报价买网站不给我备案
  • 太原百度网站快速优化网站 后台 数据 下载
  • 某网站开发项目进度表天元建设集团有限公司赵唐元
  • 网站外链收录很多 内链收录几个西安网站seo优化
  • 网站源码制作网站产品类别顺序如果修改
  • 北京定制网站开发公司浩森宇特本机快速做网站
  • 校网站建设方案网站怎么优化关键词快速提升排名
  • 手机号注册的网站wordpress蚂蚁主题
  • 专业的集团网站设计公司优化网站服务
  • 深圳专业网站建设公司好吗个人网站排名欣赏
  • 百度网站流量查询网站建设流程总结
  • 使用代理服务器后看什么网站怎么做动态的实时更新的网站
  • 网站修改titlephp 网站下载器
  • 网站开发飞沐东莞人才市场档案服务中心
  • 北京中小企业网站建设智慧团建官网登录口手机版
  • wordpress插 件seo服务是什么
  • 推荐几个安全没封的网站湖南长大建设集团股份有限公司网站
  • 免费淘宝客网站模板下载怎么申请注册公司
  • 网站动画用什么做wordpress 主题 下载
  • 制作网站的app推动高质量发展的必要性