在统计分析中,方差分析(ANOVA)是评估多组均值差异的重要方法,而不同形式的平方和(Sums of Squares)决定了假设检验的具体方式。本文详细阐述了五种常见的平方和类型:I型、II型、III型、IV型及V型,并分析了它们的适用场景与局限性,帮助研究人员选择正确的统计方法。
I型平方和(Type I Sums of Squares)
I型平方和也称为序贯平方和或层级平方和,其核心在于模型中效应按指定顺序依次进入。具体计算时,首先将截距纳入模型,然后逐步添加效应,每个效应的平方和等于包含该效应后的模型预测平方和减去前一模型(不含该效应)的预测平方和。因此,I型平方和依赖于效应进入模型的顺序。
I型平方和适用于平衡设计(各组样本量相等)且效应按自然顺序进入的情况(例如主效应优先于交互效应)。此外,在多项式回归中,低阶项优先于高阶项;在嵌套设计中,内层效应先于外层效应。其突出优点是各效应平方和之和等于整个模型的预测平方和,即能完全分解模型变异。然而,其最大局限是平方和对顺序敏感,这限制了它在某些设计(如部分析因设计)中的应用。
II型平方和(Type II Sums of Squares)
II型平方和又称部分序贯平方和,它通过控制其他同级或低级效应来计算某一效应的平方和。例如,主效应的平方和在控制所有其他主效应后计算;两因素交互效应的平方和则控制所有主效应和其他两因素交互效应。与I型不同,II型平方和不受效应进入顺序的影响,因此适用于多元回归、主效应方差分析、等样本量全因子设计以及层级嵌套设计。
然而,在不等样本量的因子设计中,II型平方和检验的假设变得复杂且通常无实际意义。因此,对于非平衡设计,需谨慎使用II型平方和。
III型平方和(Type III Sums of Squares)
III型平方和旨在解决非平衡因子设计中假设检验的问题,其检验的假设与样本量相等时的假设相同(前提是每个单元格至少有一个观测值)。在无缺失单元格的设计中,III型平方和检验的是子总体均值(即最小二乘均值)的差异,这些均值是边际均值的最佳线性无偏估计。最小二乘均值差异的检验具有一个重要特性:不受分类预测变量编码方式(如sigma约束模型或过度参数化模型)以及X'X的广义逆选择的影响,即不依赖于设计参数化。
III型平方和适用于I型或II型适用的所有设计,以及无缺失单元格的非平衡设计。但在存在缺失单元格的方差分析设计中,III型平方和通常检验的假设是缺失模式与高阶交互作用的复杂函数,一般无实际意义。此时,应优先考虑V型平方和或有效假设检验(VI型平方和)。
IV型平方和(Type IV Sums of Squares)
IV型平方和旨在对具有缺失单元格的方差分析设计中的低阶效应检验所谓的“平衡”假设。其计算方式是将低阶效应的单元格对比系数公平地分布到包含这些效应的高阶交互效应对应水平上。然而,统计学家普遍认为IV型平方和未能完成其设计使命:它对分类预测变量顺序的依赖导致假设非唯一,且检验的假设通常不具有普遍意义。因此,一般不推荐使用IV型平方和;在无缺失单元格的设计中,它等价于III型平方和,因而不必要;在缺失单元格设计中,则可能不恰当。
V型平方和(Type V Sums of Squares)
V型平方和是IV型平方和的替代方法,广泛应用于工业实验(如部分析因设计)中处理缺失单元格问题。其原理结合了I型和III型方法:首先使用I型程序判断某个效应是否可从模型删除(即其自由度是否低于理论值),然后对未被删除的效应使用III型程序计算平方和,但显著性检验仍使用原全模型的误差项。V型平方和等价于找到一个无缺失单元格的子设计,使得该子设计中所有效应的III型平方和反映最小二乘均值差异。
使用V型平方和时需注意:删除效应等同于假设该效应与结果无关,这一假设未必成立。此外,评估删除顺序会影响结果,不同顺序可能产生不同简化模型。尽管如此,对于简化模型,V型平方和具有与III型平方和在无缺失设计中的相同属性,在部分析因设计等复杂情形下能提供其他方法无法获得的检验。
综上所述,选择何种平方和取决于设计类型、样本平衡性及缺失情况。在实际应用中,应充分理解各种平方和的性质与局限,避免误用导致无效推论。