社会及行为科学研究法(3?资料分析)
上QQ阅读APP看书,第一时间看更新

六 其他类型变项的因素分析

(一)非连续变项的因素分析

因素分析对于潜在变项的估计,是透过测量变项之间的相关来进行推估,如果潜在变项的负荷量所重制得到的相关系数非常接近观察到的相关,那么研究者即可宣称得到的一个能够反映观察数据关系的有效因素模式。此种建立在线性假设下的因素分析技术,其基本前提是测量变项必须是能够计算积差相关的连续变项;如果研究者所使用的测量工具是类别变项,除非是二分变项或顺序变项,否则无法适用因素分析。

虽然文献中经常看到研究者将顺序变项或二分变项作为因素分析的测量指标来进行因素分析,但这类变项进行因素分析存在几个基本问题:第一,非常态分布的数据(例如数据偏向高分的天花板效应或偏向低分的地板效应)会造成相关系数的错估,进而导致后续因素估计的失效;第二,题目平均数(或难度)极端化会萃取出拟似因素(pseudofactors);第三,标准误的错估导致统计检定失效;第四,对于仰赖统计假设的估计法(例如最大概似估计法)所得到的参数估计会因为资料分配的不相符而导致严重偏误(因此非连续变项的因素分析多不采用最大概似估计法)。

为了使因素分析能够应用于非连续变项,研究者可以选择使用其他一些非线性分析技术,例如试题反应理论(item response theory)或试题因素分析(item factor analysis, IFA)(McDonald, 1999; Wirth & Edwards, 2007;Forero&Maydeu-Olivares, 2009)。如果要将二分变项直接应用于传统因素分析,必须要有配合条件。例如Bernstein与Teng(1989)即曾指出应用于连续性测量变项下的因素数目判断法则并不适用于类别资料,比较值得应用的策略是平行分析法,例如Weng与Cheng(2005)的模拟研究指出,平行分析策略可以有效地找出正确的因素个数,但是如果当二分变项的分配趋向极端化(远离p=0.05的标准二项分配)与题目的质量不佳(因素负荷量偏低)时,平行分析的正确性则会下降。此外,在进行分析时,采取phi系数会比多项相关(tetrachoric correlation)来得更有利。

(二)潜在变项的连续性与类别化

除了测量变项可能为类别变项,潜在变项也可能是类别变项。Steinly与McDonald(2007)指出,潜在变项模型的一个基本问题,是研究者无法确知潜在变项的分配形态。如果只是想当然尔地将潜在变项假设为常态分配,是一个过于大胆的做法。学者提出以潜在剖面分析(latent profile analysis, LPA)来确认潜在变项是连续或分立的K个丛集,但是其操作不仅繁复,对于到底潜在变项是类别丛集或连续强度的判断因仍需仰赖主观判断、缺乏客观检证程序而饱受批评(Molenaar & von Eye, 1994; Cudeck & Henly, 2003),最后还是得回到研究议题的理论与文献层次来协助模型的假定(Muthén, 2003)。

为了了解潜在变项数据空间的连续性与类别性,McDonald(1967, 1986)建议采用基本的潜在类别分析(latent class analysis, LCA)来检验潜在变项的特性。过去学者所使用的潜在剖面分析(Lazarsfeld & Henry, 1968),其原理仍是以线性关系来架构测量变项与潜在分类丛集(或连续特质)的关系,因为在潜在剖面分析中,测量变项是以连续变项来处理;相对之下,潜在类别分析则是将测量变项也以类别变项来处理,因此不受线性关系的假设所约束。LCA以几率比值来进行运算,无须对于测量变项与潜在变项进行分配的假设,因此在估计上远较线性模型来得更具弹性(邱皓政,2008)。更重要的是,如果潜在变项的本质是连续强度,以LCA来估计得到的K组潜在丛集也会具有特定的顺序与距离关系,并不造成结果解释的错误(Steinly & McDonald, 2007);反之,如果潜在变项的数值空间是类别化时,只有LCA能够侦测出其分类属性,但因素分析就无法正确侦测,因此,LCA在潜在变项的形式的判断上,也具有实务上的弹性。因此Steinly与McDonald(2007)主张未来关于潜在变项的估计,不能忽略LCA的价值。