当前位置: 首页 > news >正文

企业门户网站建设优势免费制作logo软件

企业门户网站建设优势,免费制作logo软件,ppt模板工作汇报,锦州网站建设渠道机器学习分类与性能度量 数据集:训练集(Training Set)、验证集(Validation Set)和测试集(Test Set) 1、 当模型无需人为设定超参数#xff0c;所用参数都通过学习得到#xff0c;则不需要验证集。验证集适合多个不同超参数训练多个模型#xff0c;通过验证集#xff0c;…机器学习分类与性能度量 数据集:训练集(Training Set)、验证集(Validation Set)和测试集(Test Set) 1、 当模型无需人为设定超参数所用参数都通过学习得到则不需要验证集。验证集适合多个不同超参数训练多个模型通过验证集选择最好的模型及其相应的超参数。 2、监督学习(supervised learning ): 有导师学习,分类和回归 从给定的训练数据集中学习出一个函数(模型参数),当输入新数据时可以根据这个函数预测结果。 分类(classification): 输出是离散型变量是一种定性输出如1、-1。回归(regression)输出是是连续型变量是一种定量输出。 3 、无监督学习(unsupervised learning):无导师学习聚类和维度约简。 输入数据没有标签样本数据类别未知需要根据样本间的相似性对样本集进行划分是类内差距最小化类间差距最大化。 基于概率密度函数估计的直接方法基于样本间相似性度量的聚类方法 4、强化学习(reinforcement learning):再励学习、评价学习或增强学习 用于描述和解决智能体(agent) 在与环境的交互过程中通过学习策略以达成汇报最大化或实现特定目标的问题。 不同于监督学习和无监督学习强化学习不要求预先给定任何数据而是通过接受环境对动作的奖励( 反馈)获得学习信息并更新模型参数。 误差(error) 指的是模型输出与真值的偏离程度通常定义一个损失函数来衡量误差大小。 经验误差/训练误差在训练集上产生的误差大小反应了模型在训练数据上拟合效果的好坏。泛化误差模型在未知样本上的误差通常将测试误差作为泛化误差的近似值泛化误差用于衡量训练好的模型对未知数据的预测能力。 过拟合和欠拟合 1、过拟合模型在训练样本中表现的过于优越导致在验证集以及测试集上表现不佳。 2、欠拟合指模型在训练和预测时表现的都不好。 评估方法 1、留出法 数据集分为互斥的训练集和测试集。数据分布保持一致。测试集比例保持在1/3 至1/5。 2、交叉验证法 数据集平均分为互斥的k份每次训练从数据集中选择出一份作为测试集经过k次后就k份测试集求误差的平均值。 3、 自助法 数据集D中包含m个样本对数据集D进行m次有放回采样采样到的数据构成数据集S将S作为训练集未出现在S中的数据作为测试集。 样本不出现在S中的概率为 适合小数据集不会减小训练集规模但改变了数据分布易引起估计偏差。 性能度量 分类模型性能度量方法 1、混淆矩阵(confusion matrix)误差矩阵主要用于分类结果和实例的真实信息。以二分类为例如下。 真正TP模型预测为正的正样本 假正FP模型预测为正的负样本 假负FN模型预测为负的正样本 真负TN模型预测为负的负样本 准确率正确预测的正反例数/总数 AccuracyTPTNTPFNFPTN\frac{TPTN}{TPFNFPTN}TPFNFPTNTPTN​ 精确率正确预测的正例数/预测正例总数 PrecisionTPTPFP\frac{TP}{TPFP}TPFPTP​ 召回率正确预测的正例数/实际正例数总和 RecallTPTPFN\frac{TP}{TPFN}TPFNTP​ F-score : precision和recall的调和值 a β2β^2β2 F-score(1a)precision∗Recalla∗precisionRecall\frac{precision*Recall}{a* precisionRecall}a∗precisionRecallprecision∗Recall​ β1时称为F1-score或F1-Measure精确率和召回率都很重要权重相同。 β1时精确率更重要。 β1时召回率更重要。 F1-scoreprecision和Recall的调和平均评估指标。 F1-score2*precision∗RecallprecisionRecall\frac{precision*Recall}{precisionRecall}precisionRecallprecision∗Recall​ 2、ROC曲线根据结果计算得到ROC空间中相应的点连接这些点形成ROC曲线。值越大代表预测准确率越高。 真正率(TPR):预测为正的正样本/正样本实际数。 TPRTP/(TPFN) 假正率(FPR)预测为正的负样本数/负样本实际数 FPRFP/(FPTN) 3、AUCROC曲线下的面积(ROC的积分) AUC1 ,100%完美识别正负类不管阈值怎么设定都能得出完美预测0.5AUC1;优于随机猜测。 4、PR曲线:precision对recall的曲线 在同一测试集上面的曲线比在下面的曲线好。光滑曲线比不光滑曲线好。 5、PR曲线与ROC曲线 相同点采用TPR(Recall)来衡量,用AUC来衡量分类器效果。不同点ROC曲线使用了FPRPR曲线使用了precision。 回归模型性能度量 1、解释变异给定数据中的变异能被数学模型所解释的部分通常方差来量化变异。 Explainedvariance(y,y_)1- Var(y−y)Vary\frac{Var(y-y_)}{Var y}VaryVar(y−y)​​ 2、决定系数回归关系已经解释的y值变异在其总变异中所占的比率。 3、兰德指数(rand index) 给定实际类别信息C假设K是聚类结果a表示在C与K中都是同类别的元素对数b表示在C与K都是不同类别的元素对数。 4、调整兰德指数 ARIRI−E(RI)max(RI−E(RI)\frac{RI-E(RI)}{max(RI-E(RI)}max(RI−E(RI)RI−E(RI)​ARI取值范围[-1,1] 5 、 互信息用来衡量两个数据分布的吻合程度。 假设U与V是对N个样本标签的分布情况则 其中P(i,j)∣Ui∩Vj∣N\frac{|U_i∩V_j |}{N}N∣Ui​∩Vj​∣​ 6、 标准化互信息NMI 7、调整互信息 8、轮廓系数 对于单个样本设a是它与同类别中其他样本的平均距离b是与它距离最近不同类别中样本的平均距离 Sb−amax⁡(ab)\frac{b-a}{max⁡(ab)}max⁡(ab)b−a​取值范围[-1,1]。 适用于实际类别信息未知的情况。
http://www.zqtcl.cn/news/346324/

相关文章:

  • 云主机开网站教程模板网会员
  • 网站建设无锡虚拟网站官网
  • 品牌网站设计联系东莞网站优化公
  • 自己做整个网站的流程php装修网站源码
  • 天津网站建设班模拟网站建设软件有哪些
  • 服务类的网站怎么做做软件的网站担保网站
  • 最新电子产品网站模板海口网站排名提升
  • 北京社保网站减员怎么做phpcms v9 实现网站搜索
  • 视频运营管理网站济南网站建设 济南货梯
  • html电影网站模板下载工具阿里云网站建设 部署与发布笔记
  • 建设跨境网站微信seo是什么意思
  • 我做彩票网站开发彩票网站搭建织梦如何仿手机网站源码下载
  • 东仓建设网站手机便宜的网站建设
  • 吕梁市住房与城乡建设厅网站wordpress 乐趣公园
  • 沈阳正规制作网站公司吗德成建设集团有限公司网站
  • 做网站标准步骤大学两学一做专题网站
  • 如何在手机上做网站Windows怎么建设网站
  • 专门做稀有产品的网站海口网站制作设计
  • 怎么查看自己的网站是否被百度收录网站的设计制作流程
  • 视觉设计网站芜湖做网站找哪家好
  • flash网站源码带asp后台电子商务有限公司网站
  • 一个网站有多少网页简单的logo设计
  • 重庆专业网站营销长春建站免费模板
  • 企业建设网站多少钱爱的网站歌曲
  • 宁波网站优化如何欣宝儿在什么网站做直播
  • 东营网签查询系统官方网站超炫的网站模板
  • 请人做网站谁来维护南宁营销型网站设计
  • 汕头做网站的公司西安建筑科技大学华清学院教务网
  • 免费行情网站在线石家庄正规制作网站公司
  • 站长工具网凡科网商城