临猗县 保障住房和建设住建网站,网站做电子公章违法吗,seo三人行论坛,wordpress 章节 插件个体与集成 同质#xff1a;相同的基学习器#xff0c;实现容易#xff0c;但是很难保证差异性。异质#xff1a;不同的基学习器#xff0c;实现复杂#xff0c;不同模型之间本来就存在差异性#xff0c;但是很难直接比较不同模型的输出#xff0c;需要复杂的配准方法。…个体与集成 同质相同的基学习器实现容易但是很难保证差异性。异质不同的基学习器实现复杂不同模型之间本来就存在差异性但是很难直接比较不同模型的输出需要复杂的配准方法。 好而不同
boosting Adaboost 求解h 求解alpha bagging 随机森林
数据集划分使用类似自助法的k折交叉验证有放回的取出分别训练T个决策树。 随机一个是训练集的随机一个是属性的随机每次在当前属性中随机取K个构成属性子集在子集中选择信息增益最大的属性
结合策略
集合的好处
可能多个假设在训练集上达到同等性能使用单学习器可能因为误选而导致泛化性能不佳。单个可能陷入局部极小点。可以使相应的假设空间扩大。
结合方法
平均法
简单平均加权平均
投票法
绝对多数投票大于一半则预测为该标记否则拒绝相对多数投票加权投票法
学习法
利用初始数据集训练出初级学习器然后生成一个新数据集训练一个次级学习器。
多样性增强
数据样本扰动输入属性扰动输出表示扰动算法参数扰动