首页主机统计学t检验,t检验通俗理解

统计学t检验,t检验通俗理解

编程之家2024-03-12103次浏览

一、t检验方法的选用及其适用条件

1、已知一个总体均数;

统计学t检验,t检验通俗理解

2、可得到一个样本均数及该样本标准差;

3、样本来自正态或近似正态总体。

注意事项

1、选用的检验方法必须符合其适用条件(注意:t检验的前提:来自正态分布总体;随机样本;均数比较时,要求两样本总体方差相等,即具有方差齐性)。

理论上,即使样本量很小时,也可以进行t检验。(如样本量为10,一些学者声称甚至更小的样本也行),只要每组中变量呈正态分布,两组方差不会明显不同。如上所述,可以通过观察数据的分布或进行正态性检验估计数据的正态假设。

方差齐性的假设可进行F检验,或进行更有效的Levene's检验。如果不满足这些条件,可以采用校正的t检验,或者换用非参数检验代替t检验进行两组间均值的比较。

统计学t检验,t检验通俗理解

2、区分单侧检验和双侧检验。单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大。t检验中的p值是接受两均值存在差异这个假设可能犯错的概率。在统计学上,当两组观察对象总体中的确不存在差别时,这个概率与我们拒绝了该假设有关。

一些学者认为如果差异具有特定的方向性,我们只要考虑单侧概率分布,将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧t检验概率。

3、假设检验的结论不能绝对化。当一个统计量的值落在临界域内,这个统计量是统计上显著的,这时拒绝虚拟假设。当一个统计量的值落在接受域中,这个检验是统计上不显著的,这是不拒绝虚拟假设H0。因为,其不显著结果的原因有可能是样本数量不够拒绝H0,有可能犯第Ⅰ类错误。

4、正确理解P值与差别有无统计学意义。P越小,不是说明实际差别越大,而是说越有理由拒绝H0,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。

5、假设检验和可信区间的关系结论具有一致性差异:提供的信息不同区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。

6、涉及多组间比较时,慎用t检验。科研实践中,经常需要进行两组以上比较,或含有多个自变量并控制各个自变量单独效应后的各组间的比较,(如性别、药物类型与剂量),此时,需要用方差分析进行数据分析,方差分析被认为是t检验的推广。

统计学t检验,t检验通俗理解

在较为复杂的设计时,方差分析具有许多t-检验所不具备的优点。(进行多次的t检验进行比较设计中不同格子均值时)。

由来

学生t检验是威廉·戈塞为了观测酿酒品质于1908年所提出的,“学生(student)”则是他的笔名。

基于克劳德·健力士(ClaudeGuinness)聘用从牛津大学和剑桥大学出来的最好的毕业生,以将生物化学及统计学应用到健力士工业流程的创新政策,戈塞受雇于都柏林的健力士酿酒厂担任统计学家。戈塞提出了t检验以降低啤酒重量监控的成本。

戈塞于1908年在《Biometrika》期刊上公布t检验,但因其老板认为其为商业机密而被迫使用笔名,统计学论文内容也跟酿酒无关。实际上,其他统计学家是知道戈塞真实身份的。

应用

1、单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一群军校男生的身高的平均是否符合全国标准的170公分界线。

2、独立样本t检验(双样本):其零假设为两个正态分布的总体的均值之差为某实数,例如检验二群人之平均身高是否相等。若两总体的方差是相等的情况下(同质方差),自由度为两样本数相加再减二;若为异方差(总体方差不相等),自由度则为Welch自由度,此情况下有时被称为Welch检验。

3、配对样本t检验(成对样本t检验):检验自同一总体抽出的成对样本间差异是否为零。例如,检测一位病人接受治疗前和治疗后的肿瘤尺寸大小。若治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸将缩小。

4、检验一回归模型的偏回归系数是否显著不为零,即检验解释变量X是否存在对被解释变量Y的解释能力,其检验统计量称之为t-比例(t-ratio)。

二、统计学中的T检验,P值是什么意思

在回归分析中,t检验就是对回归参数的显著性进行检验;f检验是对回归方程的显著性进行检验。在一元回归中,二者是等价的;在多元回归中,t检验通过则f检验一定能够通过,而f检验通过t检验不一定通过。p值就是方便大家判断显著性的,一般软件运行结果中都有,例如在a=0.05时,P<0.05,就拒绝原假设,说明显著!

三、t检验判定规则

原理:T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。

意义:

T检验对数据的正态性有一定的耐受能力。如果数据只是稍微偏离正态,结果仍然是稳定的。如果数据偏离正态很远,则需要考虑数据转换或采用非参数方法分析。

两个独立样本T检验的原假设为两个总体均值之间不存在显著性差异,需分两步完成:①利用F检验进行两总体方差的同质性判断;②根据方差同质性的判断,决定T统计量和自由度计算公式,进而对T检验的结果给予恰当的判定。

如果待检验的两个样本均值差异较小,那么t值也就较小,说明两样本均值不存在显著差异;相反,t值越大,说明两样本均值之间差异越显著。

SPSS将计算的t值和T分布表给出相应的显著性概率值,如果显著性概率值P小于或等于显著性水平α,则拒绝原假设,认为两总体均值之间存在显著差异;相反,显著性概率值P大于显著性水平α,则不拒绝原假设,认为两总体均值之间不存在显著差异

STORAGEDEVICE(什么是storagedevicepolicies)图层,涂层