当前位置: 首页 > news >正文

长沙市网站制作公司线上营销推广方案有哪些

长沙市网站制作公司,线上营销推广方案有哪些,做淘宝客网站服务器,上海互联网公司现在正处于百模乱战的时期#xff0c;对于模型微调#xff0c;想必您是有所了解了#xff0c;毕竟国外的大语言模型一开源#xff0c;国内便纷纷基于该模型进行微调#xff0c;从而开始宣称领先于某某、超越了谁。可到头来#xff0c;却让人发现他们套壳了国外大语言模型… 现在正处于百模乱战的时期对于模型微调想必您是有所了解了毕竟国外的大语言模型一开源国内便纷纷基于该模型进行微调从而开始宣称领先于某某、超越了谁。可到头来却让人发现他们套壳了国外大语言模型对外开放的API。 好了我们不说国内各种大模型宣称超过了谁毕竟嘴巴长在别人脸上我们管不了也管不着吹牛终将是会露馅的 当我们需要对开源大模型进行微调时看看有几种方法可以做到这一点的 网格搜索 手动调整超参数直到找到超参数值的完美组合。 这将是一项非常乏味的工作而且您可能没有时间去探索多种组合。 相反您可以使用 Scikit-Learn的 GridSearchCV类来搜索您。 您需要做的就是告诉它您希望它试验哪些超参数以及要尝试哪些值它将使用交叉验证来评估超参数值的所有可能组合。 例如以下代码搜索 RandomForestRegressor的最佳超参数值组合 from sklearn.model_selection import GridSearchCVfull_pipeline Pipeline([ (preprocessing, preprocessing), (random_forest, RandomForestRegressor(random_state42)), ]) param_grid [{preprocessing__geo__n_clusters: [5, 8, 10], random_forest__max_features: [4, 6, 8]}, {preprocessing__geo__n_clusters: [10, 15], random_forest__max_features: [6, 8, 10]}, ] grid_search GridSearchCV(full_pipeline, param_grid, cv3, scoringneg_root_mean_squared_error) grid_search.fit(housing, housing_labels) 请注意您可以引用管道中任何估计器的任何超参数即使该估计器嵌套在多个管道和列转换器的深处。 例如当 Scikit-Learn看到“preprocessing__geo__n_clusters”时它会在双下划线处分割该字符串然后在管道中查找名为“preprocessing”的估计器并找到预处理 ColumnTransformer。 接下来它在此 ColumnTransformer 中查找名为“geo”的转换器并找到我们在纬度和经度属性上使用的 ClusterSimilarity 转换器。 然后它找到该变压器的n_clusters 超参数。 同样random_forest__max_features指的是名为“random_forest”的估计器的max_features超参数这当然是RandomForest模型。 这个param_grid中有两个字典因此GridSearchCV将首先评估第一个字典中指定的n_clusters和max_features超参数值的所有3×39个组合然后它将尝试第一个字典中指定的所有2×36个超参数值组合 第二个字典。 因此网格搜索总共将探索 9 6 15 种超参数值组合并且每个组合都会对管道进行 3 次训练因为我们使用的是 3 折交叉验证。 这意味着总共将有 15 × 3 45 轮训练 这可能需要一段时间但是完成后您可以获得如下参数的最佳组合 grid_search.best_params_ {preprocessing__geo__n_clusters: 15, random_forest__max_features: 6} 您可以使用 grid_search.best_estimator_ 访问最佳估计器。 如果 GridSearchCV使用refitTrue 这是默认值进行初始化那么一旦它使用交叉验证找到最佳估计器它就会在整个训练集上重新训练它。 这通常是一个好主意因为向其提供更多数据可能会提高其性能。 评估分数可使用 grid_search.cv_results_ 获得。 这是一个字典但如果将其包装在 DataFrame中您将获得每个超参数组合和每个交叉验证分割的所有测试分数的良好列表以及所有分割的平均测试分数 最佳模型的平均测试 RMSE 分数为 44,042这比您之前使用默认超参数值获得的分数47,019要好。 恭喜您已成功微调您的最佳模型 随机搜索 当您探索相对较少的组合时如前面的示例所示网格搜索方法很好但 RandomizedSearchCV通常更可取特别是当超参数搜索空间很大时。 该类的使用方式与 GridSearchCV类大致相同但它不是尝试所有可能的组合而是评估固定数量的组合在每次迭代时为每个超参数选择一个随机值。 这听起来可能令人惊讶但这种方法有几个好处 如果您的某些超参数是连续的或离散的但有许多可能的值并且您让随机搜索运行例如 1,000 次迭代那么它将为每个超参数探索 1,000 个不同的值而网格搜索只会探索 您为每个值列出的几个值。假设某个超参数实际上没有太大影响但您还不知道。 如果它有 10 个可能的值并将其添加到网格搜索中那么训练时间将延长 10 倍。 但如果将其添加到随机搜索中则不会有任何区别。如果有6 个超参数需要探索每个超参数都有10 个可能的值那么网格搜索除了训练模型一百万次之外别无选择而随机搜索始终可以运行您选择的任意次数的迭代。 对于每个超参数您必须提供可能值的列表或概率分布 from sklearn.model_selection import RandomizedSearchCV from scipy.stats import randintparam_distribs {preprocessing__geo__n_clusters: randint(low3, high50), random_forest__max_features: randint(low2, high20)}rnd_search RandomizedSearchCV( full_pipeline, param_distributionsparam_distribs, n_iter10, cv3, scoringneg_root_mean_squared_error, random_state42)rnd_search.fit(housing, housing_labels) Scikit-Learn还具有 HalvingRandomSearchCV和 HalvingGridSearchCV超参数搜索类。 他们的目标是更有效地使用计算资源要么更快地训练要么探索更大的超参数空间。 它们的工作原理如下在第一轮中使用网格方法或随机方法生成许多超参数组合称为“候选者”。 然后像往常一样这些候选者被用来训练模型并使用交叉验证进行评估。 然而训练使用的资源有限这大大加快了第一轮的速度。 默认情况下“有限资源”意味着模型在训练集的一小部分上进行训练。 然而其他限制也是可能的例如如果模型具有超参数来设置它则减少训练迭代的次数。 一旦每个候选人都经过评估只有最好的候选人才能进入第二轮在那里他们将获得更多资源来竞争。 经过几轮之后最终的候选人将使用全部资源进行评估。 这可能会节省您一些调整超参数的时间。
http://www.zqtcl.cn/news/48283/

相关文章:

  • 网站推广和优化的原因网址创建
  • 建材 网站 模板直播软件怎么开发
  • 衡阳市城市建设投资有限公司网站网店推广发展趋势有哪些
  • 只做同城交易的网站wordpress极验证登录
  • 专业做域名的网站4网站免费建站
  • aspnet网站开发实例网站加速器下载
  • 涪陵网站建设 优帮云网页设计尺寸早起可视区域
  • 海口网络平台网站开发最赚钱的小型加工厂
  • 手机端企业网站源码河南省建设工程招投标协会网站
  • 网站建设实训个人百度最新财报
  • 个人备案网站 论坛如何编写网站开发文档
  • 深圳商城网站设计多少钱门户网站app开发
  • 网站开发项目任务域名状态查询工具
  • php专业网站网站建设需要准备什么软件
  • 建设部建造师强制注销网站湖南专业seo公司
  • 让网站做的有吸引力wordpress exploit scanner
  • 网站设置关键词去年做那个网站致富
  • 网站建设要花钱吗青岛seo用户体验
  • 房屋自建设计哪个网站好织梦wap网站模版
  • 网站建设人员工资怎样把html文件变成链接
  • 58同城网站建设案例摄影网址
  • 厦门微信商城网站建设江苏城乡建设职业学院就业网站
  • 网站设计要先做图么大连网站网页设计公司
  • 哪些网站推广不收费钉钉小程序开发教程
  • 网站域名放国外网站制作公司兴田德润简介
  • 怎么做网站后台管理系统google浏览器官网
  • 哪个网站亲子游做的好wordpress站点迁移
  • wordpress新站注意事项建设网站的详细步骤
  • 网站整站开发项目亮点织梦做的网站首页排版错误
  • 网站开发项目swot分析wordpress允许评论