当前位置: 首页 > news >正文

网站的发布方案有哪些常州做网站价位

网站的发布方案有哪些,常州做网站价位,wordpress修改自适应,宜宾seo网站建设转自#xff1a;http://blog.csdn.net/haidao2009/article/details/7514787 浅谈 Adaboost 算法 机器学习是利用一些方法来使机器实现人的学习行为#xff0c;以便获取新的知识或技能#xff0c;重新组织已有的知识结构使之不断改善自身的性能。 AdaBoost全名“adaptive B… 转自http://blog.csdn.net/haidao2009/article/details/7514787   浅谈 Adaboost 算法          机器学习是利用一些方法来使机器实现人的学习行为以便获取新的知识或技能重新组织已有的知识结构使之不断改善自身的性能。          AdaBoost全名“adaptive Boost”         一 Boosting 算法的起源 boost 算法系列的起源来自于PAC Learnability(PAC 可学习性)。这套理论主要研究的是什么时候一个问题是可被学习的当然也会探讨针对可学习的问题的具体的学习算法。这套理论是由Valiant提出来的也因此还有其他贡献哈他获得了2010年的图灵奖。这里也贴出Valiant的头像表示下俺等菜鸟的膜拜之情。哈哈哈 PAC 定义了学习算法的强弱   弱学习算法---识别错误率小于1/2(即准确率仅比随机猜测略高的学习算法)   强学习算法---识别准确率很高并能在多项式时间内完成的学习算法 同时 ,Valiant和 Kearns首次提出了 PAC学习模型中弱学习算法和强学习算法的等价性问题,即任意给定仅比随机猜测略好的弱学习算法 ,是否可以将其提升为强学习算法 ? 如果二者等价 ,那么只需找到一个比随机猜测略好的弱学习算法就可以将其提升为强学习算法 ,而不必寻找很难获得的强学习算法。 也就是这种猜测让无数牛人去设计算法来验证PAC理论的正确性。 不过很长一段时间都没有一个切实可行的办法来实现这个理想。细节决定成败再好的理论也需要有效的算法来执行。终于功夫不负有心人 Schapire在1996年提出一个有效的算法真正实现了这个夙愿它的名字叫AdaBoost。AdaBoost把多个不同的决策树用一种非随机的方式组合起来表现出惊人的性能第一把决策树的准确率大大提高可以与SVM媲美。第二速度快且基本不用调参数。第三几乎不Overfitting。我估计当时Breiman和Friedman肯定高兴坏了因为眼看着他们提出的CART正在被SVM比下去的时候AdaBoost让决策树起死回生Breiman情不自禁地在他的论文里赞扬AdaBoost是最好的现货方法off-the-shelf即“拿下了就可以用”的意思。(这段话摘自统计学习那些事) 了解了这段有意思的起源下面来看adaboost算法应该会兴趣大增。 二 Boosting算法的发展历史摘自http://stblog.baidu-tech.com/?p19 Boosting算法是一种把若干个分类器整合为一个分类器的方法在boosting算法产生之前还出现过两种比较重要的将多个分类器整合 为一个分类器的方法即boostrapping方法和bagging方法。我们先简要介绍一下bootstrapping方法和bagging方法。   1bootstrapping方法的主要过程   主要步骤   i)重复地从一个样本集合D中采样n个样本   ii)针对每次采样的子样本集进行统计学习获得假设Hi   iii)将若干个假设进行组合形成最终的假设Hfinal   iv)将最终的假设用于具体的分类任务   2bagging方法的主要过程 -----bagging可以有多种抽取方法   主要思路   i)训练分类器   从整体样本集合中抽样n*  N个样本 针对抽样的集合训练分类器Ci   ii)分类器进行投票最终的结果是分类器投票的优胜结果   但是上述这两种方法都只是将分类器进行简单的组合实际上并没有发挥出分类器组合的威力来。直到1989年Yoav Freund与 Robert Schapire提出了一种可行的将弱分类器组合为强分类器的方法。并由此而获得了2003年的哥德尔奖Godel price。   Schapire还提出了一种早期的boosting算法其主要过程如下   i)从样本整体集合D中不放回的随机抽样n1  n个样本得到集合 D1   训练弱分类器C1   ii)从样本整体集合D中抽取 n2  n个样本其中合并进一半被C1 分类错误的样本。得到样本集合D2   训练弱分类器C2   iii)抽取D样本集合中C1 和 C2 分类不一致样本组成D3   训练弱分类器C3   iv)用三个分类器做投票得到最后分类结果   到了1995年Freund and schapire提出了现在的adaboost算法其主要框架可以描述为   i)循环迭代多次   更新样本分布   寻找当前分布下的最优弱分类器   计算弱分类器误差率   ii)聚合多次训练的弱分类器 三 Adaboost 算法   AdaBoost 是一种迭代算法其核心思想是针对同一个训练集训练不同的分类器即弱分类器然后把这些弱分类器集合起来构造一个更强的最终分类器。(很多博客里说的三个臭皮匠赛过诸葛亮)   算法本身是改变数据分布实现的它根据每次训练集之中的每个样本的分类是否正确以及上次的总体分类的准确率来确定每个样本的权值。将修改权值的新数据送给下层分类器进行训练然后将每次训练得到的分类器融合起来作为最后的决策分类器。 完整的adaboost算法如下 简单来说Adaboost有很多优点:   1)adaboost是一种有很高精度的分类器   2)可以使用各种方法构建子分类器adaboost算法提供的是框架   3)当使用简单分类器时计算出的结果是可以理解的。而且弱分类器构造极其简单   4)简单不用做特征筛选   5)不用担心overfitting 四 Adaboost 举例 也许你看了上面的介绍或许还是对adaboost算法云里雾里的没关系百度大牛举了一个很简单的例子你看了就会对这个算法整体上很清晰了。   下面我们举一个简单的例子来看看adaboost的实现过程   图中“”和“-”分别表示两种类别在这个过程中我们使用水平或者垂直的直线作为分类器来进行分类。   第一步   根据分类的正确率得到一个新的样本分布D2­一个子分类器h1   其中划圈的样本表示被分错的。在右边的途中比较大的“”表示对该样本做了加权。 也许你对上面的ɛ1ɑ1怎么算的也不是很理解。下面我们算一下不要嫌我啰嗦我最开始就是这样思考的只有自己把算法演算一遍你才会真正的懂这个算法的核心后面我会再次提到这个。 算法最开始给了一个均匀分布 D 。所以h1 里的每个点的值是0.1。ok当划分后有三个点划分错了根据算法误差表达式得到 误差为分错了的三个点的值之和所以ɛ1(0.10.10.1)0.3而ɑ1 根据表达式 的可以算出来为0.42. 然后就根据算法 把分错的点权值变大。如此迭代最终完成adaboost算法。   第二步   根据分类的正确率得到一个新的样本分布D3一个子分类器h2   第三步   得到一个子分类器h3   整合所有子分类器   因此可以得到整合的结果从结果中看及时简单的分类器组合起来也能获得很好的分类效果在例子中所有的。 五 Adaboost 疑惑和思考   到这里也许你已经对adaboost算法有了大致的理解。但是也许你会有个问题为什么每次迭代都要把分错的点的权值变大呢这样有什么好处呢不这样不行吗? 这就是我当时的想法为什么呢我看了好几篇介绍adaboost 的博客都没有解答我的疑惑也许大牛认为太简单了不值一提或者他们并没有意识到这个问题而一笔带过了。然后我仔细一想也许提高错误点可以让后面的分类器权值更高。然后看了adaboost算法和我最初的想法很接近但不全是。 注意到算法最后的表到式为这里面的a 表示的权值是由得到的。而a是关于误差的表达式到这里就可以得到比较清晰的答案了所有的一切都指向了误差。提高错误点的权值当下一次分类器再次分错了这些点之后会提高整体的错误率这样就导致 a 变的很小最终导致这个分类器在整个混合分类器的权值变低。也就是说这个算法让优秀的分类器占整体的权值更高而挫的分类器权值更低。这个就很符合常理了。到此我认为对adaboost已经有了一个透彻的理解了。 六 总结   最后我们可以总结下adaboost算法的一些实际可以使用的场景   1用于二分类或多分类的应用场景   2用于做分类任务的baseline   无脑化简单不会overfitting不用调分类器   3用于特征选择feature selection)   4Boosting框架用于对badcase的修正   只需要增加新的分类器不需要变动原有分类器   由于adaboost算法是一种实现简单应用也很简单的算法。Adaboost算法通过组合弱分类器而得到强分类器同时具有分类错误率上界随着训练增加而稳定下降不会过拟合等的性质应该说是一种很适合于在各种分类场景下应用的算法。
http://www.zqtcl.cn/news/672612/

相关文章:

  • 汉字叔叔花了多少钱做网站免费原创视频素材
  • 网站开发提现功能互联网推广工作好做吗
  • 做阿里渠道的销售要有哪些网站网站评论怎么做的
  • 建设中网站如何上传图片深圳营销型网站建设设计公司
  • 建设电商网站需要多少钱家具网页设计素材
  • 物流网站html5模板网站整站开发
  • 网站随机代码网站开发技术试验教程
  • 做翻译 网站吗仿京东电商的网站开发报价
  • 霞山网站建设公司网站开发怎样手机号验证
  • 大型门户网站建设苏州优化网站建设
  • 网站步骤怎么搭建个人网站
  • 荥阳网站建设公司wordpress会员上限
  • 采购需求网站建设呼伦贝尔网站开发
  • 东莞网站建设方案服务极速网站建设定制价格
  • 网站建设费记账福州百度网络推广
  • 中国农村建设网站邵阳房产网
  • 做非法网站网站上海备案查询
  • 网站制作要学哪些北京信管局 网站备案
  • 百度新闻源网站有哪些wordpress怎么配置七牛cdn加速
  • 山东城乡住房建设厅网站wordpress 购物网站主题
  • 石家庄制作网站查网站流量查询工具
  • 信誉好的永州网站建设静态网站的短处
  • wordpress主题汉化软件河南网站优化哪家好
  • 关于水果的网站建设前端页面设计
  • 随州网站推广哪家好河南网站seo营销多少费用
  • 重庆网站优化排名软件方案谁能做网站开发
  • 河南官网网站建设报价app网站制作多少钱
  • 做网站页面一般用什么软件网站建设项目说明书
  • 做国外lead应该做什么网站网站运营报告
  • 建立一个自己的网站需要多少钱我的世界查找建筑网站