网站创作,广州网站建设索王道下拉,济南免费网站建设,软件开发兼职平台▲概述#xff1a;一组测量数据中#xff0c;如果个别数据偏离平均值很远#xff0c;那么这个(这些)数据称作“可疑值”。如果用统计方法—例如格拉布斯(Grubbs)法判断#xff0c;能将“可疑值”从此组测量数据中剔除而不参与平均值的计算#xff0c;那么该“可疑值”就称…▲概述一组测量数据中如果个别数据偏离平均值很远那么这个(这些)数据称作“可疑值”。如果用统计方法—例如格拉布斯(Grubbs)法判断能将“可疑值”从此组测量数据中剔除而不参与平均值的计算那么该“可疑值”就称作“异常值(粗大误差)”。本文就是介绍如何用格拉布斯法判断“可疑值”是否为“异常值”。▲测量数据例如测量10次(n10)获得以下数据8.2、5.4、14.0、7.3、4.7、9.0、6.5、10.1、7.7、6.0。▲排列数据将上述测量数据按从小到大的顺序排列得到4.7、5.4、6.0、6.5、7.3、7.7、8.2、9.0、10.1、14.0。可以肯定可疑值不是最小值就是最大值。▲计算平均值x-和标准差sx-7.89标准差s2.704。计算时必须将所有10个数据全部包含在内。▲计算偏离值平均值与最小值之差为7.894.73.19最大值与平均值之差为14.07.896.11。▲确定一个可疑值比较起来最大值与平均值之差6.11大于平均值与最小值之差3.19因此认为最大值14.0是可疑值。▲计算Gi值Gi(xix-)/s其中i是可疑值的排列序号——10号因此G10( x10x-)/s(14.07.89)/2.7042.260。由于x10x-是残差而s是标准差因而可认为G10是残差与标准差的比值。下面要把计算值Gi与格拉布斯表给出的临界值GP(n)比较如果计算的Gi值大于表中的临界值GP(n)则能判断该测量数据是异常值可以剔除。但是要提醒临界值GP(n)与两个参数有关检出水平α (与置信概率P有关)和测量次数n (与自由度f有关)。▲定检出水平α如果要求严格检出水平α可以定得小一些例如定α0.01那么置信概率P1α0.99如果要求不严格α可以定得大一些例如定α0.10即P0.90通常定α0.05P0.95。▲查格拉布斯表获得临界值根据选定的P值(此处为0.95)和测量次数n(此处为10)查格拉布斯表横竖相交得临界值G95(10)2.176。▲比较计算值Gi和临界值G95(10)Gi2.260G95(10)2.176GiG95(10)。▲判断是否为异常值因为GiG95(10)可以判断测量值14.0为异常值将它从10个测量数据中剔除。▲余下数据考虑剩余的9个数据再按以上步骤计算如果计算的GiG95(9)仍然是异常值剔除如果GiG95(9)不是异常值则不剔除。本例余下的9个数据中没有异常值。格拉布斯表——临界值GP(n)Pn0.950.99Pn0.950.9931.1351.155172.4752.78541.4631.492182.5042.82151.6721.749192.5322.85461.8221.944202.5572.88471.9382.097212.5802.91282.0322.231222.6032.93992.1102.323232.6242.963102.1762.410242.6442.987112.2342.485252.6633.009122.2852.550302.7453.103132.3312.607352.8113.178142.3712.659402.8663.240152.4092.705452.9143.292162.4432.747502.9563.336对异常值及统计检验法的解释■测量过程是对一个无限大总体的抽样对固定条件下的一种测量理论上可以无限次测量下去可以得到无穷多的测量数据这些测量数据构成一个容量为无限大的总体或者换一个角度看本来就存在一个包含无穷多测量数据的总体。实际的测量只不过是从该无限大总体中随机抽取一个容量为n(例如n10)的样本。这种样本也可以有无数个每个样本相当于总体所含测量数据的不同随机组合。样本中的正常值应当来自该总体。通常的目的是用样本的统计量来估计总体参量。总体一般假设为正态分布。■异常值区分样本中的正常值应当属于同一总体而异常值有两种情况第一种情况异常值不属于该总体抽样抽错了从另外一个总体抽出一个(一些)数据其值与总体平均值相差较大第二种情况异常值虽属于该总体但可能是该总体固有随机变异性的极端表现比如说超过3σ的数据出现的概率很小。用统计判断方法就是将异常值找出来舍去。■犯错误1将本来不属于该总体的、第一种情况的异常值判断出来舍去不会犯错误将本来属于该总体的、出现的概率小的、第二种情况的异常值判断出来舍去就会犯错误。■犯错误2还有一种情况不属于该总体但数值又和该总体平均值接近的数据被抽样抽出来统计检验方法判断不出它是异常值就会犯另外一种错误。■异常值检验法判断异常值的统计检验法有很多种例如格拉布斯法、狄克逊法、偏度-峰度法、拉依达法、奈尔法等等。每种方法都有其适用范围和优缺点。■格拉布斯法最佳每种统计检验法都会犯犯错误1和错误2。但是有人做过统计在所有方法中格拉布斯法犯这两种错误的概率最小所以推荐使用格拉布斯法。■多种方法结合使用为了减少犯错误的概率可以将3种以上统计检验法结合使用根据多数方法的判断结果确定可疑值是否为异常值。■异常值来源测量仪器不正常测量环境偏离正常值较大计算机出错看错读错抄错算错转移错误。——