可以通过哪些网站注册域名,wordpress分类id,网站开发费用属无形资产吗,上海网站科技一、归一化
Ⅰ什么是归一化#xff1f;
答#xff1a;其实就是把数据归一到0-1之间#xff0c;也就是缩放。 常用的归一化操作是最大最小值归一化#xff0c;公式如下#xff1a; 例如#xff1a;1#xff0c;3#xff0c;5#xff0c;7#xff0c;9#xff0c;10…一、归一化
Ⅰ什么是归一化
答其实就是把数据归一到0-1之间也就是缩放。 常用的归一化操作是最大最小值归一化公式如下 例如1357910其中max10min1把数据代入公式可得 0(1-1 / 10-1)2/9(3-1 / 10-1)4/9(5-1 / 10-1)2/3(7-1 / 10-1)8/9(9-1 / 10-1)1(10-1 / 10-1)这样就把1-10这些数给归一化到0-1之间了。
Ⅱ为什么要做归一化
答只要是基于梯度来进行下降求解最优解都需要归一化目的是各个维度梯度可以同时收敛
Ⅲ不做归一化产生的问题是什么
答如果X1X2那么W1W2那么我们W1初始化之后要到达最优解的位置走的距离就远大于W2初始化之后要到达最优解的位置走的距离 因为X1X2那么g1 (y_hat-y)*x1 g2 (y_hat-y) * x2那么g1g2 因为g1g2那么W调整的幅度等于W_t1 - W_t - alpha * g 所以g越小调整的幅度就越小 总结一下上面的推导 X1X2W1调整的幅度W2调整的幅度但是W1需要调整的距离W2需要调整的距离矛盾就产生了如果此时不做归一化去使用梯度下降求解最优解的话产生的效果即会是同样的迭代次数下W2已经调整好了W1还在慢慢的往前挪整体看起来就比先做归一化再做梯度下降需要的迭代次数要多了
二、最大最小值归一化操作
Ⅰ怎么让多个维度对应的W基本上在同一时刻收敛
答对多个维度X来进行统一的归一化比如说最大值最小值归一化的方法
Ⅱ何为最大值最小值归一化呢
答(X-Xmin)/(Xmax-Xmin)最大值最小值归一化的特点是一定可以把一列数据归到0到1之间
Ⅲ什么是过拟合
答拟合过度用算法生成的模型很好的拟合了你以有的数据训练集数据但是当来新的数据的时候比如测试集的数据预测的准确率反而降低了很多那这个时候就是发生了过拟合现象
Ⅳ如何防止过拟合呢
答防止过拟合等价于提高模型的泛化能力或者推广能力或者说白了就是举一反三的能力提高了模型的容错能力 学霸有监督的机器学习 学神有很强的学习能力能自己找到学习的方法无监督的机器学习 学渣你的算法压根就没选对数据预处理也没对学习方法不对 学痴做练习题都会考试稍微一变化就挂过拟合了没有泛化能力
Ⅴ如何在机器学习里面防止过拟合呢
答模型参数W个数越少越好无招胜有招 模型参数W的值越小越好这样如果X输入有误差也不会太影响y预测结果 通过正则化 到loss function里面去 L1 n个维度的w绝对值加和 L2 n个维度的w平方和 让我们的SGD在找最优解的过程中考虑惩罚项的影响
Ⅵ当使用惩罚项会产生什么影响
答使用惩罚项会提高模型的泛化能力但是因为人为的改变了损失函数所以在一定程度上牺牲了正确率即对训练集已有数据的拟合效果但是没关系因为我们的模型目的是对未来新的数据进行预测。 在惩罚项里面会有个alpha即惩罚项的权重我们可以通过调整alpha超参数根据需求来决定是更看重模型的正确率还是模型的泛化能力