网站源码如何优化,系统之家一键重装,图片制作视频怎么制作,长沙网页设计培训班哪家好λ对Jcv和Jtrain的影响
假设该模型为四阶多项式当λ很大时#xff0c;在最小化J的过程中#xff0c;w会很小且接近0#xff0c;此时模型f(x)近似于一个常数#xff0c;所以此时模型欠拟合#xff0c;Jtrain和Jcv都很大当λ很小时#xff0c;表示模型几乎没有正则化在最小化J的过程中w会很小且接近0此时模型f(x)近似于一个常数所以此时模型欠拟合Jtrain和Jcv都很大当λ很小时表示模型几乎没有正则化而四阶多项式的模型十分弯曲所以此时模型过拟合Jtrain很小Jcv远大于Jtrain当λ取中间值模型刚好拟合良好、泛化良好此时Jtrain很小、Jcv也很小
如何选择一个合适的λ
第一次假设λ为0最小化成本函数J后得到一组w、b之后计算这组参数对应的Jcv第二次假设λ为0.01最小化成本函数J后得到一组w、b之后计算这组参数对应的Jcv…以此类推例如第十二次假设λ为10…通过这些不同λ对应的Jcv的值来选择一个最小的Jcv对应的λ值此时的λ为正则化参数的最佳值此例中如果第5次的Jcv最小则我们选择第5次的λ、w、b最后可以选择输出第5次的模型所对应的Jtest值即该模型的test泛化能力
λ如何影响Jtrain和Jcv
λ对Jtrain和Jcv的影响如上图所示此图近似看作d对Jtrain和Jcv的影响图的镜像通过最小Jcv可以帮助选择一个合适的λ、d从而帮助选择合适的模型泛化良好、拟合良好