当前位置: 首页 > news >正文

在线解压rar网站四川高速公路建设开发总公司网站

在线解压rar网站,四川高速公路建设开发总公司网站,河南网站建设推荐,国外做饮用来源的网站学习曲线是一种图形化工具#xff0c;用于展示模型在训练集和验证集#xff08;或测试集#xff09;上的性能随着训练样本数量的增加而如何变化。它可以帮助我们理解模型是否受益于更多的训练数据#xff0c;以及模型是否可能存在过拟合或欠拟合问题。学习曲线的x轴通常是训…      学习曲线是一种图形化工具用于展示模型在训练集和验证集或测试集上的性能随着训练样本数量的增加而如何变化。它可以帮助我们理解模型是否受益于更多的训练数据以及模型是否可能存在过拟合或欠拟合问题。学习曲线的x轴通常是训练样本的数量或训练迭代的次数y轴是模型的性能指标如准确率或损失函数的值。 - 如果模型在训练集上的性能随着训练样本数量的增加而提高但在验证集上的性能提高不明显或者甚至下降那么模型可能存在过拟合问题。 - 如果模型在训练集和验证集上的性能都随着训练样本数量的增加而提高且两者的性能都还有提升的空间那么模型可能会从更多的训练数据中受益。 - 如果模型在训练集和验证集上的性能都随着训练样本数量的增加而提高但两者的性能提升已经很小或者没有提升那么模型可能存在欠拟合问题或者已经达到了它的性能上限。 在这里我们以贝叶斯算法为例 我们先来导入相应的库 import numpy as np import matplotlib.pyplot as plt from sklearn.naive_bayes import GaussianNB from sklearn.datasets import load_digits from sklearn.model_selection import learning_curve #画学习曲线的类 from sklearn.model_selection import ShuffleSplit #设定交叉验证模式的类接下来定义一个绘制学习曲线的函数 def plot_learning_curve(estimator,title, X, y, ax, #选择子图ylimNone, #设置纵坐标的取值范围cvNone, #交叉验证n_jobsNone #设定索要使用的线程):train_sizes, train_scores, test_scores learning_curve(estimator, X, y,cvcv,n_jobsn_jobs) ax.set_title(title)if ylim is not None:ax.set_ylim(*ylim)ax.set_xlabel(Training examples)ax.set_ylabel(Score)ax.grid() #显示网格作为背景不是必须ax.plot(train_sizes, np.mean(train_scores, axis1), o-, colorr,labelTraining score) # 画出训练集学习曲线ax.plot(train_sizes, np.mean(test_scores, axis1), o-, colorg,labelTest score) # 画出验证集学习曲线ax.legend(locbest)return ax 这段代码使用了learning_curve函数该函数是一个非常有用的工具用于生成学习曲线的数据。学习曲线可以帮助我们理解随着训练样本数量的增加模型的性能如何变化。 learning_curve函数的参数包括 - estimator这是用于训练的模型。 - X和y这是用于训练的数据和对应的标签。 - cv这是交叉验证的策略。 - n_jobs这是用于计算的线程数。 learning_curve函数返回三个值 - train_sizes这是用于生成学习曲线的训练集的样本数。 - train_scores这是在每个训练集大小下模型在训练集上的得分。 - test_scores这是在每个训练集大小下模型在交叉验证集上的得分。 这些返回的值可以用于绘制学习曲线以帮助我们理解模型随着训练样本数量的增加其性能如何变化。 接下来再导入手写数据集 digits load_digits() X, y digits.data, digits.target 再用如下代码绘制子图和学习曲线 fig, axes plt.subplots(1, 1, figsize(10, 6)) # Define the axes variable cv ShuffleSplit(n_splits50, test_size0.2, random_state0) plot_learning_curve(GaussianNB(), Naive Bayes, X, y, axaxes, ylim[0.7, 1.05], n_jobs4, cvcv) plt.show()结果分析可以看出贝叶斯作为一个分类器效果不是很理想。可以观察到随着样本量逐渐增大训练分数逐渐降低从95%下降到85%但是测试分数逐渐增高从75%上升到85%。测试分数在逐渐逼近训练分数过拟合问题在逐渐减弱。但是可以想象接下来即使再增大样本量测试分数和训练分数也不会变高只会趋近于某个值。综上所述朴素贝叶斯是依赖于训练集准确率的下降测试集准确率上升来解决过拟合问题。
http://www.zqtcl.cn/news/972973/

相关文章:

  • 白名单查询网站网站建设改变某个表格大小
  • 青岛网站开发公司电话百度投放
  • 唐山玉田孤树做宣传上什么网站百度推广有效果吗
  • 亚马逊网站特点佛山营销型网页设计
  • 网站建设 长沙开福区做百度移动网站排名软
  • 广州购物网站建设在线解压网站
  • 网站建设教学方法探究购物网站开发中查看订单的实现逻辑
  • 网站建设漂亮的模板西安网络优化大的公司
  • 如何免费简单建一个网站河北优化网站获客qq
  • 如何给网站做seo东莞网站建设星河
  • 什么叫门户类网站哪个网站能帮助做路书
  • 网站建站基础娄底网站推广
  • WordPress网站仿制光明建网站的公司
  • 可以做企业网站昆明seo怎么做
  • 西安那里做网站媒体软文发稿
  • 怎样做网站呢wordpress首页幻灯片尺寸
  • 青岛即墨网站网页设计营销型网站规划建设的七大要素
  • WordPress建站经验固原市住房和城乡建设厅网站
  • 可以查企业信息的软件wordpress换模板 seo
  • 网站广告怎么做wordpress封面图七牛
  • 设计师网站上海建设银行内部网站6
  • 网站接广告平台wordpress悬浮下拉
  • 国内网站做国外服务器网站建设的cms系统
  • 社交信息共享网站开发外包网站建设规划书的空间
  • 广告网站建设方案沂源网站建设
  • 城建局官网整站seo排名外包
  • 网站运营团队各岗位的职责是什么辽宁建设工程信息网官网首页官方
  • 怎样做网站框架图流媒体网站开发
  • cnzz统计代码放在网站网站建设一般要多钱
  • 长春火车站附近宾馆discuz论坛