t检验_百度百科

t检验

样本量较小检测方法

0有用+1

t检验，亦称student t检验（Student's t test），主要用于样本含量较小（例如n < 30），总体标准差σ未知的正态分布。^[1]t检验是用t分布理论来推论差异发生的概率，从而比较两个平均数的差异是否显著。它与f检验、卡方检验并列。t检验是戈斯特为了观测酿酒质量而发明的,并于1908年在Biometrika上公布^[2]。

中文名: t检验
外文名: Student's t test
别名: student t检验
提出者: 戈斯特

学科领域: 统计学
应用对象: 样本量较小σ未知的正态分布资料
主要应用: 比较两个平均数的差异是否显著
见载刊物: 《数学名词》科学出版社
公布时间: 1993年^[7]

适用条件

播报

编辑

(1) 已知一个总体均数；

(2) 可得到一个样本均数及该样本标准差；

(3) 样本来自正态或近似正态总体^[3]。

主要分类

播报

编辑

t检验可分为单总体检验和双总体检验，以及配对样本检验^[1]。

单总体检验

单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布，如总体标准差未知且样本容量小于30，那么样本平均数与总体平均数的离差统计量呈t分布。

单总体t检验统计量为：

其中

为样本平均数，

为样本标准偏差，n为样本数。该统计量t在零假说：μ=μ0为真的条件下服从自由度为n的t分布。

双总体检验

双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况，一是独立样本t检验（各实验处理组之间毫无相关存在，即为独立样本），该检验用于检验两组非相关样本被试所获得的数据的差异性；一是配对样本t检验，用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性，这两种情况组成的样本即为相关样本。

（1）独立样本t检验统计量为：

S12和 S22为两样本方差；n1 和n2 为两样本容量。

（2）配对样本检验

配对样本t检验可视为单样本t检验的扩展，不过检验的对象由一群来自常态分配独立样本更改为二群配对样本之观测值之差。若二配对样本x1i与x2i之差为di=x1i−x2i独立，且来自常态分配，则di之母体期望值μ是否为μ0可利用以下统计量：

其中

为配对样本差值之平均数，

为配对样本差值之标准偏差，n为配对样本数。该统计量t在零假说：μ=μ0为真的条件下服从自由度为n−1的t分布。

检验步骤

播报

编辑

下面以一个实例的单总体t检验对t检验做一说明：^[4]

问题：难产儿出生数n = 35，体重均值

= 3.42，S = 0.40，一般婴儿出生体

图1t界值表

重 μ0= 3.30（大规模调查获得），问相同否？

解：

1.建立假设、确定检验水准α

H0：μ = μ0 （零假设null hypothesis）

H1：μ ≠ μ0（备择假设alternative hypothesis）

双侧检验，检验水准：α=0.05

2.计算检验统计量

3.查相应界值表，确定P值，下结论。

查附表（图1），t0.025 / 34 = 2.032, t < t0.025 / 34, P >0.05，按α=0.05水准，不拒绝H0，两者的差别无统计学意义。

注意事项

播报

编辑

1、选用的检验方法必须符合其适用条件(注意：t检验的前提：1.来自正态分布总体； 2.随机样本；3.均数比较时，要求两样本总体方差相等，即具有方差齐性) ^[3]。理论上，即使样本量很小时，也可以进行t检验。（如样本量为10，一些学者声称甚至更小的样本也行），只要每组中变量呈正态分布，两组方差不会明显不同。如上所述，可以通过观察数据的分布或进行正态性检验估计数据的正态假设。方差齐性的假设可进行F检验，或进行更有效的Levene's检验。如果不满足这些条件，可以采用校正的t检验，或者换用非参数检验代替t检验进行两组间均值的比较。

2、区分单侧检验和双侧检验。单侧检验的界值小于双侧检验的界值，因此更容易拒绝，犯第Ⅰ错误的可能性大^[3]。t检验中的p值是接受两均值存在差异这个假设可能犯错的概率。在统计学上，当两组观察对象总体中的确不存在差别时，这个概率与我们拒绝了该假设有关。一些学者认为如果差异具有特定的方向性，我们只要考虑单侧概率分布，将所得到t-检验的P值分为两半。另一些学者则认为无论何种情况下都要报告标准的双侧t检验概率。

3、假设检验的结论不能绝对化^[3]。当一个统计量的值落在临界域内，这个统计量是统计上显著的，这时拒绝虚拟假设。当一个统计量的值落在接受域中，这个检验是统计上不显著的，这是不拒绝虚拟假设H0。因为，其不显著结果的原因有可能是样本数量不够拒绝H0 ，有可能犯第Ⅰ类错误。

4、正确理解P值与差别有无统计学意义^[3]。P越小，不是说明实际差别越大，而是说越有理由拒绝H0 ，越有理由说明两者有差异，差别有无统计学意义和有无专业上的实际意义并不完全相同。

5、假设检验和可信区间的关系结论具有一致性差异：提供的信息不同区间估计给出总体均值可能取值范围，但不给出确切的概率值，假设检验可以给出H0成立与否的概率^[3]。

6、涉及多组间比较时，慎用t检验^[3]。科研实践中，经常需要进行两组以上比较，或含有多个自变量并控制各个自变量单独效应后的各组间的比较，（如性别、药物类型与剂量），此时，需要用方差分析进行数据分析，方差分析被认为是t检验的推广。在较为复杂的设计时，方差分析具有许多t-检验所不具备的优点。（进行多次的t检验进行比较设计中不同格子均值时）。

实现平台

播报

编辑

大多数的试算表软件及统计软件都可以进行t检验之运算，诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python、PSPP、Minitab等^[5]。

实用场景

播报

编辑

单样本检验：检验一个正态分布的总体的均值是否在满足零假设的值之内^[6]。
双样本检验：其零假设为两个正态分布的总体的均值是相同的。这一检验通常被称为学生t检验。但更为严格地说，只有两个总体的方差是相等的情况下，才称为学生t检验；否则，有时被称为Welch检验。以上谈到的检验一般被称作“未配对”或“独立样本”t检验，我们特别是在两个被检验的样本没有重叠部分时用到这种检验方式^[6]。
检验同一统计量的两次测量值之间的差异是否为零。举例来说，我们测量一位病人接受治疗前和治疗后的肿瘤尺寸大小。如果治疗是有效的，我们可以推定多数病人接受治疗后，肿瘤尺寸变小了。这种检验一般被称作“配对”或者“重复测量”t检验。
检验一条回归线的斜率是否显著不为零。

实用举例

播报

编辑

t检验可用于比较男女身高是否存在差别

为了进行独立样本t检验，需要一个自（分组）变量（如性别：男、女）与一个因变量（如身高测量值）。根据自变量的特定值，比较各组中因变量的均值。用t检验比较下列男、女儿童身高的均值^[5]。

1、假设

H0：男平均身高 = 女平均身高

H1：男平均身高 ≠ 女平均身高

选用双侧检验：选用α=0.05的统计显著水平^[5]。

2、SPSS中的数据的排列

被试者	性别	身高
对象1 对象2 对象3 对象4 对象5	男性男性男性女性女性	111 110 109 102 104
男性身高均数 = 110 ；女性身高均数 = 103