当前位置: 首页 > news >正文

网站规划书500字怎么建立一个个人网站

网站规划书500字,怎么建立一个个人网站,那个网站可以做学历认证,wordpress个人博客主题好看本文目录#xff1a; 一、集成学习概念**核心思想#xff1a;** 二、集成学习分类#xff08;一#xff09;Bagging集成#xff08;二#xff09;Boosting集成(三#xff09;两种集成方法对比 三、随机森林 一、集成学习概念 集成学习是一种通过结合多个基学习器#… 本文目录 一、集成学习概念**核心思想** 二、集成学习分类一Bagging集成二Boosting集成(三两种集成方法对比 三、随机森林 一、集成学习概念 集成学习是一种通过结合多个基学习器弱学习器的预测结果来提升模型整体性能的机器学习方法。其核心思想是“集思广益”通过多样性Diversity和集体决策降低方差Variance或偏差Bias从而提高泛化能力。 核心思想 弱学习器指性能略优于随机猜测的简单模型如决策树桩、线性模型 强学习器通过组合多个弱学习器构建的高性能模型 核心目标减少过拟合降低方差或欠拟合降低偏差。 传统机器学习算法 (例如决策树逻辑回归等) 的目标都是寻找一个最优分类器尽可能的将训练数据分开。集成学习 (Ensemble Learning) 算法的基本思想就是将多个分类器组合从而实现一个预测效果更好的集成分类器。集成算法可以说从一方面验证了中国的一句老话三个臭皮匠赛过诸葛亮。 二、集成学习分类 集成学习算法一般分为bagging和boosting 一Bagging集成 Bagging 框架通过有放回的抽样产生不同的训练集从而训练具有差异性的弱学习器然后通过平权投票、多数表决的方式决定预测结果。 二Boosting集成 Boosting 体现了提升思想每一个训练器重点关注前一个训练器不足的地方进行训练通过加权投票的方式得出预测结果。 Boosting是一组可将弱学习器升为强学习器算法这类算法的工作机制类似 1.先从初始训练集训练出一个基学习器 2.在根据基学习器的表现对训练样本分布进行调整使得先前基学习器做错的训练样本增加权重在后续得到最大的关注 3.然后基于调整后的样本分布来训练下一个基学习器 4.如此重复进行直至基学习器数目达到实现指定的值T为止。 5.再将这T个基学习器进行加权结合得到集成学习器。 简而言之每新加入一个弱学习器整体能力就会得到提升 (三两种集成方法对比 三、随机森林 随机森林是基于 Bagging 思想实现的一种集成学习算法通过构建多棵决策树并结合它们的预测结果来提高模型的准确性和鲁棒性。它由Leo Breiman在2001年提出广泛应用于分类和回归任务。 其构造过程是 训练 1有放回的产生训练样本 2随机挑选 n 个特征n 小于总特征数量)。预测 1分类任务投票多数表决 2回归任务平均预测值。 优点与缺点 实例 #1.数据导入 #1.1导入数据 import pandas as pd #1.2.利用pandas的read.csv模块从互联网中收集泰坦尼克号数据集 titanicpd.read_csv(data/泰坦尼克号.csv) titanic.info() #查看信息 #2人工选择特征pclass,age,sex Xtitanic[[Pclass,Age,Sex]] ytitanic[Survived] #3.特征工程 #数据的填补 X[Age].fillna(X[Age].mean(),inplaceTrue) X pd.get_dummies(X) #数据的切分 from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test train_test_split(X,y,test_size0.25,random_state22)#4.使用单一的决策树进行模型的训练及预测分析 from sklearn.tree import DecisionTreeClassifier dtcDecisionTreeClassifier() dtc.fit(X_train,y_train) dtc_y_preddtc.predict(X_test) dtc.score(X_test,y_test)#5.随机森林进行模型的训练和预测分析 from sklearn.ensemble import RandomForestClassifier rfcRandomForestClassifier(max_depth6,random_state9) rfc.fit(X_train,y_train) rfc_y_predrfc.predict(X_test) rfc.score(X_test,y_test)#6.性能评估 from sklearn.metrics import classification_report print(dtc_report:,classification_report(dtc_y_pred,y_test)) print(rfc_report:,classification_report(rfc_y_pred,y_test))# 随机森林做预测 # 1 实例化随机森林 rf RandomForestClassifier() # 2 定义超参数的选择列表 param{n_estimators:[80,100,200], max_depth: [2,4,6,8,10,12],random_state:[9]} # 超参数调优 # 3 使用GridSearchCV进行网格搜索 from sklearn.model_selection import GridSearchCV gc GridSearchCV(rf, param_gridparam, cv2) gc.fit(X_train, y_train) print(随机森林预测的准确率为, gc.score(X_test, y_test))
http://www.zqtcl.cn/news/658620/

相关文章:

  • 做网站不会框架网站开发逻辑图
  • 东莞网站制作个性化宜都网站建设
  • 空壳网站查询网络服务提供者不履行法律、行政法规
  • 付费阅读网站代码做网站需要什么软件
  • 泗阳网站设计外贸网站特点
  • 国外logo设计网站推荐网页浏览器证书失效怎么修复
  • asp.net建立手机网站校园网站设计代码
  • 网站图标怎么下载肇庆新农村建设内容在哪个网站
  • 上海建站哪家好临沂建设工程质量 监督网站
  • 中国建设银行网站地图上海最新新闻热点事件
  • wordpress4.95淘宝优化标题都是用什么软件
  • 大网站用wordpress吗网站广告费怎么做分录
  • 江西建设安全网站会展平面设计主要做什么
  • 阿里巴巴免费做网站吗企业商务网站建设策划书
  • 广州网站制作哪家专业深圳网站制作开发
  • 网站icp备案管理系统个人网站源代码
  • 西安网站建设公司云网wordpress 文章分类
  • 长沙优化网站服务r18cn wordpress
  • 建材网站设计延安网站建设电话
  • 做视频网站犯法么华为公司网站建设案例分析
  • 陕煤化建设集团网站矿建二公司网站制作系统
  • 网站建设类别wordpress下载付费
  • 廊坊做网站的成都网站建设网站建设
  • 如何自己开网站网络服务检测与维护
  • 古镇网站建设熊掌号专业网站开发哪里有
  • 专业做网站服务上海网站开发哪家好
  • 科普重庆网站浙江网站开发
  • 怎么搭建自己的网站后台邹城网站建设哪家好
  • 二手房在哪个网站做合同wordpress 局域网 慢
  • 全包胶衣网站wordpress 3.1