晋城两学一做网站,wordpress 手机浏览,手机上有趣的网站,微信商店怎么开通集成方法#xff08;ensemble method#xff09;又叫元算法#xff08;meta-algorithm#xff09;#xff1a;将不同的分类器组合起来。 通俗的说#xff1a;就是三个臭皮匠赛过诸葛亮。做决定时#xff0c;考虑多个人的意见#xff0c;不是一个人的意见 集成方法…集成方法ensemble method又叫元算法meta-algorithm将不同的分类器组合起来。 通俗的说就是三个臭皮匠赛过诸葛亮。做决定时考虑多个人的意见不是一个人的意见 集成方法 1. bagging自举汇聚法基于数据随机重抽样的分类器构建方法。并行算法 2. boosting再学习基于所有分类器的加权求和的方法。 串行算法。 bagging从原始数据集选择S次后得到S个新数据集的一种技术。新数据集和原数据集的大小相等。 其实就是有放回采样获得一个和原来大小一样的新数据集。这个新数据集可能会有重复值原始数据集的某些值在新数据集中可能不在出现。 用这样的方法构建S个新的数据集参与训练就会得到S个分类器。测试新数据时送到S个分类器里得到的结果投票数量最多的就是分类结果得民心者得天下。 boosting串行训练。第一个训练完第二个在第一个的基础上接着训练。重点关注前面分类器错分的数据说白了就是背锅侠前面哥们犯的错后面的去解决。 目前 bagging 方法最流行的版本是: 随机森林(random forest)选男友美女选择择偶对象的时候会问几个闺蜜的建议最后选择一个综合得分最高的一个作为男朋友 目前 boosting 方法最流行的版本是: AdaBoost追女友3个帅哥追同一个美女第1个帅哥失败-(传授经验姓名、家庭情况) 第2个帅哥失败-(传授经验兴趣爱好、性格特点) 第3个帅哥成功 bagging和boosting共同点和差异点 bagging 是一种与 boosting 很类似的技术, 无论是boosting还是bagging所使用的多个分类器的类型数据量和特征量都是一致的就是说要用KNN都用KNN要用决策树那就都用决策树。bagging 是由不同的分类器1.数据随机化 2.特征随机化经过训练综合得出的出现最多分类结果boosting 是通过调整已有分类器错分的那些数据来获得新的分类器得出目前最优的结果。bagging 中的分类器权重是相等的而 boosting 中的分类器加权求和所以权重并不相等每个权重代表的是其对应分类器在上一轮迭代中的成功度。就是说bagging投票是一人一票权重相等。而boosting权重不等可能有的权重大有的权重小 转载于:https://www.cnblogs.com/gezhuangzhuang/p/10004304.html