建设银陕西省分行网站,百度优化排名软件,门户子网站建设申请,品牌茶业都在哪些网站做宣传先说一下一个小疑问#xff1a;
目前所了解的归一化概念有点模棱两可#xff0c;目前可能有三种理解
假设矩阵#xff21;大小#xff4e;#xff0a;#xff4d;#xff0c;#xff4e;代表样本数#xff0c;#xff4d;代表每一个样本的维度
①单独对每一列(全部…先说一下一个小疑问
目前所了解的归一化概念有点模棱两可目前可能有三种理解
假设矩阵大小代表样本数代表每一个样本的维度
①单独对每一列(全部样本的同一个属性)进行归一化
②单独对每一行(一个样本的所有的属性)进行归一化
③对整个矩阵进行归一化
这三个理解都能达到所有数据变换到[0,1]的效果。
然后正确的答案是归一化是针对相同维度进行的即①的理解。但是对于③我认为也是可取的也可以作为正确答案
举个例子比如人的属性是颜色身高年龄。如果你对每一个人进行归一化很可能把颜色归一化成一样的了毕竟每一个人自己的几个属性的方差是不相同的不排除存在这种可能使得某种属性在归一化以后几乎相等此时这种属性几乎就会失去作用了。但是对所有人的同一种属性进行归一化即使也可能与其它维度是值相等了但是这个属性并不会失去其作用
先来看自带函数zscore的使用 A[1 2 3;4 5 6];[B,A_mean,A_std]zscore(A)B -0.7071 -0.7071 -0.70710.7071 0.7071 0.7071A_mean 2.5000 3.5000 4.5000A_std 2.1213 2.1213 2.1213 其中A_mean代表A按列求均值A_std代表每一个列向量的标准差。 接下来看看如何逐步求 A[ 1 2 3;4 5 6];A_meanmean(A,1);A_stdstd(A);B(A-repmat(A_mean,size(A,1),1))./repmat(A_std,size(A,1),1);A_meanA_mean 2.5000 3.5000 4.5000 A_stdA_std 2.1213 2.1213 2.1213 BB -0.7071 -0.7071 -0.70710.7071 0.7071 0.7071反标准化用到的是前面求到的两个参数均值和标准差 B.*repmat(A_std,size(A,1),1)repmat(A_mean,size(A,1),1)ans 1 2 34 5 6
所以在进行标准化和反标准化的时候一定要记住均值和方差。