当前位置: 首页 > news >正文

杭州模板网站建设phpcms律师网站模板

杭州模板网站建设,phpcms律师网站模板,做网站公司做网站公司,怎么做网站优文章目录 前言旧模型训练新模型训练参数查看组合参数训练学习模型评估 前言 在机器学习-随机森林算法预测温度一文中#xff0c;通过增大模型训练数据集和训练特征的方式去优化模型的性能#xff0c;本文将记录第三方种优化方式#xff0c;通过调整随机森林创建模型参数的方… 文章目录 前言旧模型训练新模型训练参数查看组合参数训练学习模型评估 前言 在机器学习-随机森林算法预测温度一文中通过增大模型训练数据集和训练特征的方式去优化模型的性能本文将记录第三方种优化方式通过调整随机森林创建模型参数的方式去优化模型即调参。这里调参和神经网络使用验证集调整超参数概念不太一样所以不会去使用验证集。本文调参将使用RandomizedSearchCV函数去交叉验证不同参数组合的模型性能选择最优性能的参数组合模型。 旧模型训练 为了缩短参数训练的时间对比旧模型将先用部分数据 2016年的不含ws_1、prcp_1、snwd_1三个特征值的参见文章机器学习-随机森林算法预测温度 其评估结果如下 误差是 4.16 score 0.843355562598595 MAE是: 4.16409589041096 MSE是: 26.98129152054795 RMSE是 5.194351886477075新模型训练 数据集和特征选择和旧模型保持一致只通过调整模型构建参数进行调优。前面的数据探索性分析和数据预处理都一样。从构建模型开始有了变化 参数查看 # 建立随机森林模型 from sklearn.ensemble import RandomForestRegressor # 建立预测模型 rf RandomForestRegressor(random_state42) from pprint import pprint # 格式化方式打印json数据 pprint(rf.get_params())输出如下 {bootstrap: True,ccp_alpha: 0.0,criterion: squared_error,max_depth: None,max_features: 1.0,max_leaf_nodes: None,max_samples: None,min_impurity_decrease: 0.0,min_samples_leaf: 1,min_samples_split: 2,min_weight_fraction_leaf: 0.0,monotonic_cst: None,n_estimators: 100,n_jobs: None,oob_score: False,random_state: 42,verbose: 0,warm_start: False}通过查看官网api官网地址 发现每个参数都是可以指定的当然指定不同的参数结果肯定也不一样下面将构造一种参数范围让随机森林自己去学习训练评估出最佳参数组合。 组合参数 from sklearn.model_selection import RandomizedSearchCV n_estimators [int(x) for x in np.linspace(start100,stop1000,num10)] max_features [1.0,sqrt,log2] max_depth [int(x) for x in np.linspace(10,200,10)] max_depth.append(None) min_samples_split [2,5,10] min_samples_leaf [1,2,4] bootstrap [True,False]random_param {bootstrap: bootstrap,max_depth: max_depth,max_features: max_features,min_samples_leaf: min_samples_leaf,min_samples_split: min_samples_split,n_estimators: n_estimators}上面只是一种可能的参数组合范围参照api文档进行简单枚举 训练学习 rf_random RandomizedSearchCV(estimatorrf,param_distributionsrandom_param,n_iter100,scoringneg_mean_absolute_error,cv3,random_state42) rf_random.fit(train_features,train_labels)模型将开始训练如下图 等训练程序跑完打印训练学习后的最佳参数 pprint(rf_random.best_params_)如下 {bootstrap: True,max_depth: 73,max_features: 1.0,min_samples_leaf: 2,min_samples_split: 10,n_estimators: 600}模型评估 由于代码重复出现对评估代码进行封装 def evaluate(model, test_features, test_labels):pre model.predict(test_features)errors abs(pre - test_labels)print(误差是, round(np.mean(errors), 2))# 得分score model.score(test_features, test_labels)print(score, score)import sklearn.metrics as smprint(MAE是:, sm.mean_absolute_error(pre, test_labels))print(MSE是:, sm.mean_squared_error(pre, test_labels))print(RMSE是, np.sqrt(sm.mean_squared_error(pre, test_labels)))执行评估 best_model rf_random.best_estimator_ evaluate(best_model,test_features,test_labels)结果如下 误差是 4.06 得分 0.852906033295568 MAE是: 4.061986168567313 MSE是: 25.336266403102137 RMSE是 5.033514319350064可以看到和一开始的旧模型评估结果相比性能得到了一定幅度提升。
http://www.zqtcl.cn/news/848979/

相关文章:

  • 学网站建设需要多长时间成都网站建设定制开发服务
  • 建站宝盒后台深圳建网站公司怎么选择
  • 什么是大型门户网站网站建设的经验之谈
  • 网站建站网站设计网站制作书生
  • 租号网站是怎么做的wordpress 快讯功能
  • 口碑好的盐城网站建设wordpress课堂主题
  • 网站品牌打造wordpress插件有木马
  • 网站开发与软件研发有什么区别查网站域名备案查询系统
  • 硬盘做免费嗳暧视频网站黄冈免费网站推广平台汇总
  • node做网站怎么知道蜘蛛来过怎么学网站设计
  • 青海省建设厅网站公示公告简单建站
  • 手机网站用什么后台wordpress 百度蜘蛛
  • 网站文章伪原创怎么做手机网站 程序
  • 网站建设每月工作多少开发小程序的目的
  • 社区网站建设方案pptwordpress用户名在哪看
  • 浙江企业响应式网站建设公司简介如何写
  • 自己做静态网站的步骤店面设计在线
  • 活动汪活动策划网站wordpress 无法保存
  • 门户网站开发案例兰州需要做网站的公司有哪些
  • 东莞企业网站asp网站怎么安装
  • 个人做公司网站网站备案取消接入
  • 崇信网站建设it外包的收益主要有哪些
  • 安陆做网站多少钱免费网站定制
  • 快递网站模版长春好的做网站公司有哪些
  • 怎么利用公司网站开发客户网站建设重点步骤
  • 网站站内推广用个人电脑做网站的步骤
  • 网站设计主要包含3个方面陕西城乡住房建设部网站
  • 专门做汽车配件的网站东莞招聘网有哪些比较好
  • 网站前台怎么套用织梦后台小网站怎么建设
  • 网站框架代码深圳手机网站设计