网站设计与程序专业,php可以做视频网站吗,救护车网站找谁做,营销型网站服务文章目录 统计检验选择正确的统计检验统计检验是做什么的#xff1f;何时进行统计检验选择参数化测试#xff1a;回归、比较或相关性选择非参数检验 假设检验的假设条件skewness什么是零偏度right skewleft skew计算skewnesswhat to do if your data is skewed kurtosis怎么计… 文章目录 统计检验选择正确的统计检验统计检验是做什么的何时进行统计检验选择参数化测试回归、比较或相关性选择非参数检验 假设检验的假设条件skewness什么是零偏度right skewleft skew计算skewnesswhat to do if your data is skewed kurtosis怎么计算kurtosis t TestsWhen to use a T testWhat type of t test should I use?执行T检验 统计检验
选择正确的统计检验
统计检验用于假设检验。它们可以用来
确定预测变量与结果变量是否有统计学上显著的关系。 估计两个或多个组之间的差异。 统计检验假设零假设为组间无关系或无差异。然后它们确定观察到的数据是否落在零假设预测的值范围之外。
如果你已经知道你正在处理的变量类型你可以使用流程图来为你的数据选择正确的统计检验。
统计检验是做什么的
统计检验的工作原理是通过计算一个检验统计量——一个数字描述你的测试中变量之间的关系与无关系的零假设相比有多大的不同。
然后它计算一个 p 值概率值。p 值估计如果零假设即变量之间无关系为真你看到由检验统计量描述的差异的可能性有多大。
如果检验统计量的值比从零假设计算出的统计量更极端那么你可以推断出预测变量和结果变量之间存在统计学上显著的关系。
如果检验统计量的值不如从零假设计算出的那个极端那么你可以推断预测变量和结果变量之间不存在统计学上显著的关系。
何时进行统计检验
你可以对以统计有效方式收集的数据进行统计检验——无论是通过实验还是通过使用概率抽样方法进行的观察。
为了使统计检验有效你的样本量需要足够大以近似所研究总体的真实分布。
要确定使用哪种统计检验你需要知道
你的数据是否满足某些假设。你正在处理的变量类型。
统计假设 统计测试对它们正在测试的数据做出一些常见假设
观察的独立性又称无自相关你在测试中包含的观察/变量是不相关的例如对单一测试主体的多次测量不是独立的而对多个不同测试主体的测量是独立的。方差的同质性被比较各组内的方差在所有组中是相似的。如果一个组的变异性比其他组大得多它会限制测试的有效性。数据的正态性数据遵循正态分布又称钟形曲线。这个假设只适用于定量数据。
如果你的数据不满足正态性或方差同质性的假设你可能能进行非参数统计测试这允许你在不对数据分布做任何假设的情况下进行比较。 如果你的数据不满足观察独立性的假设你可能能使用考虑到你数据结构的测试重复测量测试或包含阻塞变量的测试。
变量类型 你拥有的变量类型通常决定了你可以使用什么类型的统计测试。
定量变量代表事物的数量例如森林中的树木数量。定量变量的类型包括
连续变量又称比率变量代表测量值通常可以划分为小于一的单位例如0.75克。离散变量又称整数变量代表计数通常不能划分为小于一的单位例如1棵树。
分类变量代表事物的分组例如森林中不同的树种。分类变量的类型包括
序数变量代表有顺序的数据例如排名。名义变量代表组名称例如品牌或物种名称。二元变量代表有是/否或1/0结果的数据例如赢或输。
选择适合你收集的预测变量和结果变量类型的测试如果你正在做实验这些是独立变量和依赖变量。请参阅下面的表格以查看哪个测试最符合你的变量。
选择参数化测试回归、比较或相关性
参数化测试通常比非参数化测试有更严格的要求并且能够从数据中做出更强的推断。它们只能用于符合统计测试常见假设的数据。
最常见的参数化测试类型包括回归测试、比较测试和相关性测试。
回归测试 回归测试寻找因果关系。它们可以用来估计一个或多个连续变量对另一个变量的影响。
比较测试 比较测试寻找组间平均值的差异。它们可以用来测试分类变量对某些其他特征的平均值的影响。
T检验用于比较恰好两组的平均值例如男性和女性的平均身高。ANOVA方差分析和MANOVA多元方差分析测试用于比较两个以上组的平均值例如儿童、青少年和成人的平均身高。
相关性测试 相关性测试检查变量之间是否存在关系而不假设因果关系。
这些可以用来测试你想要在例如多元回归测试中使用的两个变量是否存在自相关。
选择非参数检验
非参数检验对数据的假设不那么多当一个或多个常见的统计假设被违反时它们是有用的。然而它们做出的推论不如参数检验那样强。
假设检验的假设条件
skewness
偏度是分布不对称性的度量。当分布的左右两侧不是镜像关系时该分布是不对称的。
分布可以有右偏或正偏、左偏或负偏或零偏度。右偏分布的右侧比峰值更长左偏分布的左侧比峰值更长 您可能想要计算分布的偏度以
描述变量的分布情况与其他描述性统计量一同使用确定一个变量是否呈正态分布。正态分布的偏度为零是许多统计程序的假设之一
什么是零偏度
当一个分布的偏度为零时它是对称的。它的左右两侧是镜像的。
正态分布具有零偏度但它们并不是唯一具有零偏度的分布。任何对称分布如均匀分布或一些双峰两个顶点分布也将具有零偏度。
检查一个变量是否有偏斜分布的最简单方法是将其绘制在直方图中。
该分布大致对称观测值在其峰值的左右两侧分布相似。因此该分布的偏度大约为零。
在偏度为零的分布中均值和中位数相等。
零偏度均值 中位数
right skew Right skew: mean median
left skew Left skew: mean median
计算skewness what to do if your data is skewed
如果您的数据偏斜您通常有三种选择如果您的统计程序要求正态分布而您的数据偏斜
什么都不做。许多统计测试包括t检验、方差分析ANOVA和线性回归并不非常敏感于偏斜数据。特别是如果偏斜轻微或中等最好忽略它。使用不同的模型。您可能想选择一个不假设正态分布的模型。非参数测试或广义线性模型可能更适合您的数据。转换变量。另一个选项是转换一个偏斜变量使其偏斜程度减小。“转换”意味着对变量的所有观察值应用相同的函数。
kurtosis
峰度是衡量分布尾部厚度的一个指标。尾部厚度是指异常值出现的频率。相对于正态分布的超额峰度是衡量分布尾部厚度的一个指标。
具有中等峰度中等尾部的分布是中峰的。具有低峰度薄尾部的分布是扁峰的。具有高峰度厚尾部的分布是尖峰的。
尾部是分布两侧逐渐变细的末端。它们代表与均值相比极高或极低的值的概率或频率。换句话说尾部代表异常值出现的频率。 怎么计算kurtosis 四阶标准矩 (Fourth order standardized moment)是峰度(Kurtosis)峰度是描述随机变量分布尖锐程度的统计量衡量分布曲线在均值附近平坦或者是尖峰的程度。当峰度值等于3时当前分布的峰态与正态分布一致当峰度值大于3时均值附近较尖锐尾部较厚高峰度分布当峰度值小于3时均值附近较平坦尾部较薄低峰度分布。
t Tests
T检验是一种用来比较两组均值的统计检验。它常用于假设检验中以确定某个过程或治疗是否真的对感兴趣的总体有影响或者两组之间是否存在差异。
t检验示例 您想知道根据其种类鸢尾花的花瓣长度均值是否有差异。您在一个花园中找到两种不同的鸢尾花种类并测量了每种种类的25朵花的花瓣。您可以使用t检验和零假设及备择假设来检验这两组之间的差异。 零假设H0是这两个组的均值之间的真实差异为零。 备择假设Ha是真实差异不为零。
When to use a T test
T检验仅在比较两组的均值时使用也称为成对比较。如果您想比较两个以上的组或者想进行多个成对比较请使用ANOVA检验或事后检验。
T检验是一种参数差异检验这意味着它对数据做出了与其他参数检验相同的假设。T检验假设您的数据
是独立的大致呈正态分布在每个被比较的组内有相似的方差量也称为方差齐性
如果您的数据不符合这些假设您可以尝试T检验的非参数替代方法如Wilcoxon符号秩检验用于方差不等的数据。
What type of t test should I use?
在选择T检验时您需要考虑两件事被比较的组是否来自单一群体或两个不同群体以及您是否想测试特定方向上的差异。
One-sample, two-sample, or paired t test?
如果组来自单一群体例如在实验处理前后进行测量进行配对T检验。这是一种被试内设计。如果组来自两个不同的群体例如两种不同的物种或来自两个不同城市的人进行两样本T检验也称为独立T检验。这是一种被试间设计。如果有一个组与标准值进行比较例如将液体的酸度与中性pH值7进行比较进行单样本T检验。
One-tailed or two-tailed t test?
如果你只关心两个群体是否不同进行双尾T检验。如果你想知道一个群体的平均值是大于还是小于另一个群体进行单尾T检验
t test example 在你测试花瓣长度是否因种类而异的实验中 你的观测来自两个不同的群体不同的种类因此你进行了两样本T检验。 你不关心差异的方向只关心是否存在差异所以你选择使用双尾T检验。
执行T检验
T检验通过使用两组均值之差与两组的合并标准误之比来估计两组均值之间的真实差异。你可以使用公式手动计算或使用统计分析软件。 较大的t值显示组均值之间的差异大于合并标准误表明组之间的差异更显著。