当前位置: 首页 > news >正文

dede旅游网站西青网站文化建设

dede旅游网站,西青网站文化建设,保定网站维护,wordpress最底部版权引言#xff1a;分类是数据挖掘三大核心技术( 关联规则、分类、聚类) 之一 ,其实质是产生一个目标函数 f , 该函数将输入数据集的属性集 x 映射到已经定义的类标签 y 上。该目标函数通常也被称为分类模型或分类器 机器学习分为三个阶段#xff1a; 第一阶段#xff1a;学习模… 引言分类是数据挖掘三大核心技术( 关联规则、分类、聚类) 之一 ,其实质是产生一个目标函数 f , 该函数将输入数据集的属性集 x 映射到已经定义的类标签 y 上。该目标函数通常也被称为分类模型或分类器 机器学习分为三个阶段 第一阶段学习模型。采用学习算法通过对训练集进行归纳学习得到分类模型 第二阶段测试模型。将已经学习得到的分类模型用于测试集对测试集中未知类别的实例进行分类。 第三阶段性能评估。显然通过测试集产生的分类未必是最佳的这就导致对测试集的分类可能产生错误。而人们希望尽量得到信呢个最佳的分类模型就是的对分类器性能评价至关重要。只有通过优秀的评价标准才能选择出性能更好的分类器。 在机器学习、数据挖掘、推荐系统完成建模之后需要对模型的效果做评价。业内目前常常采用的评价指标有精确率(Precision)、召回率(Recall)、F值(F-Measure)等下图是不同机器学习算法的评价指标。下文讲对其中某些指标做简要介绍。 分类器评估准则混淆矩阵目前 ,分类器性能评价标准很多,其中比较常用的主要有准确度或错误率、查全率、查准率和F1等。为了清楚地认识这些评价标准, 首先介绍一下混淆矩阵。 定义混淆矩阵(Confusion matrix)就是用于总结有指导分类结果的矩阵。沿着主对角线上的项表示正确分类的总数其他非主对角线的项表示分类的错误数。 二分类的混淆矩阵 True Positive(真正, TP)将正类预测为正类数.True Negative(真负 , TN)将负类预测为负类数.False Positive(假正, FP)将负类预测为正类数 → 误报 (Type I error).False Negative(假负 , FN)将正类预测为负类数 → 漏报 (Type II error). 注实际正例数(p)TPFN实际负例数(N)FPTN实例总数(C)PN。一个混合矩阵已经能够显示出评价分类器性能的一些必要信息。为了更方便地比较不同分类器的性能从混合矩阵中总结出准确率、精确率、召回率、F-值F-measure等。 多类分类的混淆矩阵定义对于一个m分的标准分类问题来说也可以定义如表1所示m×m的m分混淆矩阵和每一个类属的Recall、Precision、F-measure和Accuracy值。 其相应的整个分类器的准确率表达式如下 准确率(accuracy)定义正确分类的测试实例个数占测试实例总数的比例用于衡量模型正确的预测新的或先前未见过的数据的类标号的能力。 计算公式Accuracy (TPTN)/(TPTNFPFN) 。 在正负样本不平衡的情况下准确率这个评价指标有很大的缺陷。比如在互联网广告里面点击的数量是很少的一般只有千分之几如果用Accuracy即使全部预测成负类不点击Accuracy也有 99% 以上没有意义。 所谓不平衡分类问题 ,是指训练样本数量在类间分布不平衡的模式分类问题。关于不平衡问题的具体问题可参考叶志飞, 文益民, 吕宝粮. 不平衡分类问题研究综述[J]. 智能系统学报, 2009, 4(2):148-156.。对于不平衡数据的评估标准不平衡数据下的机器学习方法简介 影响分类器准确率的因素有训练数据集记录的数目、属性的数目、属性中的信息、测试数据集记录的分布情况等。 误分率定义错误分类的测试实例个数占测试实例总数的比例表示分类器做出错误分类的概率有多大。 计算公式Error_rate1-Accuracy (FNFP)/(TPTNFPFN)。 精确率(precision)定义正确分类的正例个数占分类为正例的实例个数的比例也称查准率。 计算公式TP/(TPFP) 召回率(recall)定义正确分类的正例个数占实际正例个数的比例 也称查全率。 计算公式TP/(TPFN) F-值F-Measure定义F-Measure是查全率与查准率加权调和平均又称为F-Score。 计算公式1F1 2PR/(PR)2TP/(2TPFPFN)2F- (α^21)PR/(α^2)P R) 此处α0用于衡量查全率对查准率的相对重要性[Van Rijsbergen1979]。α1时退化为标准的F1(基于P、R的调和平均)α1时查全率有更大的影响α1时查准率有更大影响。 其中α2和α0.5是相对F1两个常用的F-measure1当α2则表示recall的影响要大于precision2当α0.5则表示precision的影响要大于recall. 精确率和准确率都高的情况下F1值也会高。P和R指标有时候会出现的矛盾的情况这样就需要综合考虑他们。F1值在实际应用中较常用。相比于P、R的算术平均和几何平均G-meanF1值更重视较小值不平衡数据下的稀有类这也说明F1对于衡量数据更有利。 G-mean定义G-mean是正例准确率与负例准确率的综合指标。 可参考文献Kubat M, Holte R C, Matwin S. Machine Learning for the Detection of Oil Spills in Satellite Radar Images[J]. Machine Learning, 1998, 30(2-3):195-215. 计算公式 与F1的比较在数据平衡度不是很大的情况下F1和G-mean可以作为较好的评测指标但是当训练样本很不平衡时F1更好。 G-mean评估一个学习算法的综合性能。 根据之前的研究, 为了能够获得尽可能多的关于每个类别对最终性能的贡献大小信息,并且考虑到数据的不平衡率, 很多研究者试图在不平衡领域提出新的度量指标。 如调整G-mean,提出了 Adjusted G-mean。 上述的评价标准对于类分布的改变较敏感。 约登指数Informedness 登指数灵敏度(召回率)特异度-1(TP/(TPFN))(TN/(FPTN))-1 R (TN/(FPTN)) - 1 MCC 马修斯相关系数MCCMatthews correlation coefficient是应用在机器学习中用以测量二分类的分类性能的指标[83]。该指标考虑了真阳性、真阴性和假阳性和假阴性通常认为该指标是一个比较均衡的指标即使是在两类别的样本含量差别很大时也可以应用它。MCC本质上是一个描述实际分类与预测分类之间的相关系数它的取值范围为[-1,1]取值为1时表示对受试对象的完美预测取值为0时表示预测的结果还不如随机预测的结果-1是指预测分类和实际分类完全不一致。 衡量不平衡数据集的指标比较好。 宏平均macro-average和微平均micro-average宏平均和微平均一般用在文本分类器, 如果只有一个二分类混淆矩阵那么用以上的指标就可以进行评价但是当我们在n个二分类混淆矩阵上要综合考察评价指标的时候就会用到宏平均和微平均。 宏平均Macro-averaging: 是先对每一个类统计指标值然后在对所有类求算术平均值。宏平均指标相对微平均指标而言受小类别的影响更大。 微平均Micro-averaging:是对数据集中的每一个实例的性能指标的算术平均。 宏平均指标相对微平均指标而言受小类别的影响更大。宏平均比微平均更合理但也不是说微平均一无是处具体使用哪种评测机制还是要取决于数据集中样本分布,来自多类分类(Multi-label classification)性能评价之宏平均(macro-average)与微平均(micro-average)。 ROC曲线Receiver Operating Characteristic比如在逻辑回归里面我们会设一个阈值大于这个值的为正类小于这个值为负类。如果我们减小这个阀值那么更多的样本会被识别为正类。这会提高正类的识别率但同时也会使得更多的负类被错误识别为正类。为了形象化这一变化在此引入 ROC ROC 曲线可以用于评价一个分类器好坏。ROC 关注两个指标: 直观上TPR 代表能将正例分对的概率FPR 代表将负例错分为正例的概率。在 ROC 空间中每个点的横坐标是 FPR纵坐标是 TPR这也就描绘了分类器在 TP真正率和 FP假正率间的 trade-off2。 ROC曲线是一个二维图形横轴为FPR纵轴为TPR直观的展示FPR与TPR之间的对应关系。 FPR0TPR0意味着将每一个实例都预测为负例FPR1TPR1意味着将每一个实例都预测为正例FPR0TPR1为最优分类器点实际上通过有限实例产生的ROC曲线实际上是一个阶梯函数该曲线近似于实例数量接近无限时对应的ROC曲线。 一个优秀分类器对应的ROC曲线应该尽量靠近单位方形的左上角。而如果一条ROC曲线沿着将负分类器点和正分类器点连接构成的对角线则该分类器的预测效果与随机猜测的同样差。 ROC曲线有个很好的特性当测试集中的正负样本的分布变化的时候ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡class imbalance现象即负样本比正样本多很多或者相反而且测试数据中的正负样本的分布也可能随着时间变化。 AUCArea Under Curve提出背景用ROC curve来表示分类器的performance很直观好用。可是人们总是希望能有一个数值来标志分类器的好坏。 定义AUC为ROC曲线下的面积显然这个面积的数值不会大于1。随机挑选一个正样本以及一个负样本分类器判定正样本的值高于负样本的概率就是AUC值。简单说AUC值越大的分类器正确率越高 AUC1完美分类器采用这个预测模型时不管设定什么阈值都能得出完美预测。绝大多数预测的场合不存在完美分类器。 0.5AUC1优于随机猜测。这个分类器模型妥善设定阈值的话能有预测价值。AUC0.5跟随机猜测一样例丢铜板模型没有预测价值。AUC0.5比随机猜测还差但只要总是反预测而行就优于随机猜测因此不存在 AUC0.5 的情况。 既然已经这么多评价标准为什么还要使用ROC和AUC呢因为ROC曲线有个很好的特性当测试集中的正负样本的分布变化的时候ROC曲线能够保持不变。在实际的数据集中经常会出现类不平衡class imbalance现象即负样本比正样本多很多或者相反。 ROC曲线和AUC的优势不受类分布的影响适合与评估、比较类分布不平衡的数据集。因此ROC曲线与AUC已被广泛用于医疗决策制定、模式识别和数据挖掘等领域。但是ROC和AUC仅适合于两类问题 ,对多类问题 ,无法直接应用。 PR曲线Precision-Recall曲线查准率和查全率是一对矛盾的度量一般来说查准率高时查全率往往偏低而查全率高时查准率往往偏低。很多情形下可以根据学习器的预测结果对样例进行排序排在前面的学习器认为“最可能”是正例的样本排在最后的则是学习器认为“最不可能”是正例的样本。按此顺序逐个把样本的作为正例进行预测则每次可以计算当前的查全率、查准率。以查准率为纵轴、查全率作为横轴作图。就会得到如下图的查准率-查全率曲线简称“P-R曲线”显示该曲线的图称为“P-R图”。 P-R图直观地显示出学习器在样本总体上的查全率、查准率。在进行比较时如图中A包住C说明A的查全率、查准率均高于C,A优于C而对于A、B存在交叉的情况采用曲线下面积大小衡量性能面积越大性能越好此处A优于B。 另外一种比较A、B学习器的方法是平衡点Break-Event Point简称BEP它是当查全率等于查准率时的取值有图可知此时A的BEP大于B故A优于B。 举个例子例子来自PaperLearning from eImbalanced Data假设N_cP_c即Negative的数量远远大于Positive的数量若FP很大即有很多N的sample被预测为P因为这里写图片描述因此FP_rate的值仍然很小如果利用ROC曲线则会判断其性能很好但是实际上其性能并不好但是如果利用PR因为Precision综合考虑了TP和FP的值因此在极度不平衡的数据下Positive的样本较少PR曲线可能比ROC曲线更实用。 其他评估指标计算复杂度决定着算法执行的速度和占用的资源它依赖于具体的实现细节和软硬件环境。由于数据挖掘的操作对象是海量的数据库因而空间和时间的复杂度将是非常重要的问题。 速度这涉及产生和使用模型的时间花费。 可解释性分类结果只有可解释性好容易理解才能更好地用于决策支持。 可伸缩性一个模型的可伸缩性使之在给定内存和磁盘空间等可用的系统资源的前提下算法的运行时间应当随数据库大小线性增加。 稳定性一个模型是稳定的是指它没有随着它所针对数据的变换而过于剧烈变化。 成本这涉及预测错误代价所产生的计算花费。   使用这些评价标准可以对分类器进行评估尤其是其中的准确率或误分率是比较常用的分类器性能评价标准。   但是所有浙西诶性能评价标准都只在一个操作点有效这个操作点即是选择使得错误率概率最小的点。而且这些评价标准都有一个共同的弱点即它们对于类分布的改变显然不够强壮。当测试集中正例和负例的比例发生改变时它们可能不在具有良好的性能甚至不被接受。 回归评估平均绝对误差Mean Absolute ErrorMAE又被称为 l1 范数损失l1-norm loss 平均平方误差Mean Squared ErrorMSE又被称为 l2 范数损失l2-norm loss 参考资料 周志华《机器学习》第2章模型评估与选择 机器学习准确率(Precision)、召回率(Recall)、F值(F-Measure)、ROC曲线、PR曲线机器学习性能评估指标第三章4-分类器性能评价-20140925分类器的分类性能评价指标机器学习-浅谈模型评估的方法和指标 (介绍比较全)ROC和AUC介绍以及如何计算AUC
http://www.zqtcl.cn/news/807799/

相关文章:

  • 网站怎么防黑客网站建设一般要多大空间
  • 做网站一般要多钱织梦做网站被告
  • 响应式网站如何设计网页设计与制作课程标准化项目申报书
  • 苏州公司技术支持 苏州网站建设蔬菜类网站建设规划书
  • 主流做网站wordpress字体设置
  • 大连网站建设解决方案加快政务网站群建设管理
  • 淮南网站建设全包成都设计咨询集团有限公司
  • 网站管理助手v3wordpress主题防盗版
  • 国外网页加速器seo优化排名怎么做
  • 网站后台做图片尺寸是多大企业网站的常见服务
  • 给企业建设网站的流程图南昌网站建设模板网络公司
  • 谷歌wordpress建站中山网站推广服务
  • php网站建设网站兼职做网站在那里接任务
  • 网站现在怎么做排名wordpress做成淘宝客
  • 广州网站设计成功柚米wordpress 总站模板
  • 江苏常州建设银行网站广州中学生网站制作
  • 微信公众平台怎么做微网站weirdcore制作网站
  • 国外网站如何建设seo关键词优化外包公司
  • 郑州商城网站建设多少钱商城类网站建设方案
  • 哈尔滨做网站哪好做网站公司分为国内还是国外
  • 饰品企业网站建设大连工程信息建设网
  • 昆山网站推广四川网站建设费用
  • 中国建设银行网站易方达消费我有域名怎么做网站
  • 网站图片规格2023年7 8月十大新闻
  • 建立一个小型网站多少钱晋城网站制作
  • 泰安哪家做网站好定制app软件
  • 成品网站设计网站wordpress 登录慢
  • 广州营销型网站建设公司哪家名气大朝阳网络公司
  • 网站怎么做排查修复关键词排名优化网站
  • 上海企业网站动易网站模版的制作