北京网站设计浩森宇特,网站建设 自助建站,商务网站建设一万字,网站打不开 域名做解析概述
提问#xff1a;在我们计算某些数据标准差#xff08;或者方差#xff09;的时候#xff0c;会发现有些公式分母是n#xff0c;而有些公式的分母却是#xff08;n-1#xff09;#xff0c;那么到底哪个公式才是正确的呢#xff1f;
答案#xff1a;
如果是算…概述
提问在我们计算某些数据标准差或者方差的时候会发现有些公式分母是n而有些公式的分母却是n-1那么到底哪个公式才是正确的呢
答案
如果是算总体的标准偏差分母就用n这就是真实的标准偏差属于描述统计。如果是算样本的标准偏差无偏估计是n-1有偏估计是n。毕竟样本只是用来估量总体的情况属于推论统计所以利用样本计算总体个体差异性时候通常会保守估计除以n-1得出来的标准偏差会比除以n的标准偏差来得大。当然当样本数量逐步逼近总体数量时标准偏差的有偏估计和无偏估计的差别就会越来越小这也符合统计学的本义。
软件计算
通过上面的介绍我们已经知道了二者的区别。那么我们用软件计算数据标准差的时候它默认使用的公式分母上是n还是n-1呢
EXCEL
Excel中STDEV函数默认用的是n-1
Python
Pandas默认用的是n-1设置axis参数
import pandas as pd
s pd.Series([-1387,1025,1100,533,-1759,686,1421,3637,3746,-1177,-3253,-1759,-1962])
s.std()
Out[14]: 2163.4817854323237
s.std(ddof0)
Out[15]: 2078.60606455327Numpy默认使用的是n若是二维数据设置axis参数
import numpy as np
a [-1387,1025,1100,533,-1759,686,1421,3637,3746,-1177,-3253,-1759,-1962]
np.std(a)
Out[8]: 2078.60606455327
np.std(a, ddof1)
Out[9]: 2163.4817854323237