第一章
因素分析
一 前言
因素分析(factor analysis)是一套用来简化变项、分析变项间的群组与结构关系,或寻找变项背后共同影响因素的多变数统计技术。一组庞杂的测量数据经由因素分析可以迅速有效地简化成几个比较简单的分数来加以应用,因此广受实务领域的欢迎。又因为因素分析可用来检验测量工具、探讨抽象概念或潜在特质的内涵,因此更为学术研究者所重视。在某些社会与行为科学领域(例如心理学、社会学、教育学),研究者经常必须去估计诸如智力、创造力、忧郁、工作动机、组织认同、学习满意度等抽象构念,进而探究这些构念之间的关系。此时首要工作即需证实研究者所设计的测验工具的确能够用以测量抽象构念,将一组具有共同特性或有特殊结构关系的测量指标,抽离出背后构念并进行因素关系的探究的统计分析技术,最有效的工具便是因素分析。
举例来说,如果今天某位研究者手中拥有某年度中学应届毕业生参加大学入学考试的国文、英文、社会、数学、物理、化学等六科成绩分数,若他计算这六科分数之间的相关系数之后,发现国文、英文、社会三科之间相关比较高,数学、物理与化学另三科的相关也比较高,那么他就非常可能会主张前三科是比较类似的学科,后三科是另外一组比较类似的学科。如果他进行了因素分析,得到支持他的想法的结果,于是他可以将前三科高度相关的科目取名为“文科能力”,后三科则取名为“理科能力”;最后,他以“某种方式”将这六科成绩重新组合成一个“文科能力”与一个“理科能力”分数。此时,“文科能力”与“理科能力”这两个用来代表这六科考试成绩的新概念就是因素(factor),经过整合后的两个新分数就是因素分数,可用来取代原来的六科成绩。原来的六科成绩称为外显变项或测量变项,所形成的因素分数则是潜在变项。在本章中,构念、因素与潜在变项三个名词被视为相似的概念而可相互替代。此一因素分析程序所得到的结果若与理论文献的观点一致,或具有逻辑或实务上的合理性,研究者即可宣称建立了一个双因素模型,并将资料加以整合简化来进行实务上的应用。
(一)因素分析的功能
具体言之,因素分析的主要功能有三:第一,因素分析可以协助研究者简化测量的内容。因素分析法最重要的概念,即是将一组变项之间的共变关系予以简化,使得许多有相似概念的变项,透过数学关系的转换,简化成几个特定的同质性类别,来加以应用。例如前述的范例中,研究者计算得出学生入学考试的“文科能力”与“理科能力”分数来进行分发的依据。
第二,因素分析能够协助研究者进行测量效度的验证。利用一组题目与抽象构念间关系的检验,研究者得以提出计量的证据,探讨潜在变项的因素结构与存在的形式,确立潜在变项的因素效度(factorial validity)。例如国文、英文与社会三科会具有高相关,使得在因素分析中被视为同一类型的数据,如果从学理来看,这三个分数会有高相关是因为同时受到人类认知功能当中的语文能力所影响,相对的,数学、物理、化学三科会具有高相关,也正是因为受到人类认知功能当中的逻辑或数字能力所影响。此时,研究者透过因素分析这套统计程序所得到的双因素结构,也获得理论上的支持,在测验领域中,可作为这六科成绩可以测得两种潜在认知能力的构念效度证据。
最后,因素分析可以用来协助测验编制,进行项目分析,检验试题的优劣。同时可以针对每一个题目的独特性进行精密的测量,比较相对的重要性。如果是在问卷编制过程中,因素分析可以提供给研究者这些测量题项的群组关系,使研究者得以选用具有代表性的题目来测量研究者所关心的概念或特质,因而得以最少的题项,进行最适切的评估测量,减少受测者作答时间,减少疲劳效果与填答抗拒。
(二)探索性与验证性因素分析
传统上,因素分析被用来简化资料,寻找一组变项背后潜藏的因素结构与关系,事前研究者多未预设任何特定的因素结构,而由数据本身来决定最适切的因素模型,因此称为探索性因素分析(exploratory factor analysis, EFA),亦即一种资料推导的分析。相对的,如果研究者的目的是在检验他人所提出的模型是否适切,或是在发展测量题目时依据某些理论文献来编制特定结构的量表,称为验证性因素分析(confirmatory factor analysis, CFA)(Jöreskog, 1969; Long, 1983),它具有理论检验与确认的功能,因此被视为是一种理论推导的分析。从发展的先后来看,EFA的原始构想早在二十世纪初就被提出,百年来广为研究者运用在构念的估计与检验。CFA则随着结构方程模式(Jöreskog & Sörbom, 1993)的成熟而逐渐流行。CFA是SEM当中的一种次模型,用以定义并估计模型中的潜在变项,因此又称为测量模型,与其他测量模型整合之后,即可建立一个完整的结构方程模型来探讨潜在变项的影响机制。
从技术层次来看,EFA与CFA的实质任务都是在定义并估计潜在变项,验证结果均可作为构念是否具有信效度的证据,两者最大的不同在于潜在变项发生的时点:对EFA而言,潜在变项的内容与结构为何,事前无法确知,经过反复估计后才能萃取得出,因此是一种事后(post-hoc)的结果。相对而言,CFA当中的潜在变项其结构与组成必须事先决定,因此是一种先验(priori)的分析架构。如果说EFA的价值在于理论的发现,那么CFA的价值则在于理论的验证,两者在学术研究中均扮演重要的角色。
在此要强调一点的是,不论以EFA或CFA所得到的构念估计或效度证据,都是一种统计现象,对于构念的实质或本体并没有直接进行检证。因此,CFA与EFA的结果虽可作为构念估计的证据,研究者仍须尽可能以其他的构念效度检验程序(例如实验方法与其他统计策略)来提出更充分的构念效度证据,才能确保一个测验所测得的分数确实能够真实反应研究者所欲测量的构念。
更基本的一个思考方向,是研究者必须清楚知道自己的研究目的与需要,因为EFA与CFA两者的目的不同,适用时机也不一样。EFA与CFA各有所长也各有缺点,后起之秀的CFA欠缺EFA具有寻觅、探询复杂现象的弹性,EFA则没有强而有力的理论作为后盾。两者皆无法取代对方,但对两种技术的熟稔对于研究者探究科学命题具有相辅相成的功效,因此两者均要熟悉。
(三)主成分分析与因素分析
除了EFA与CFA的对比,人们往往会把因素分析与主成分分析(principle component analysis, PCA)两者混为一谈。在现象上,PCA与EFA都是资料缩减技术,可将一组变项计算出一组新的分数,但在测量理论的位阶上两者却有不同,PCA试图以数目较少的一组线性整合分数(称为主成分)来解释最大程度的测量变项的变异数,EFA则在寻找一组最能解释测量变项之间共变关系的共同因素,并且能够估计每一个测量变项受到测量误差影响的程度。相对之下,PCA仅在建立线性整合分数,而不考虑测量变项背后是否具有测量误差的影响。
基本上,会使用因素分析来进行研究的人,所关注的是为何测量数据之间具有相关。是否因为测量变项受到背后潜藏的抽象现象或特质所影响而产生关联,研究者的责任并非仅在进行资料缩减,而是如何排除测量误差的干扰,估计测量变项背后所存在的因素结构,因此EFA所得到的萃取分数较符合潜在变项之所以称为“潜在”的真意。相对之下,PCA所得到的组合分数仅是一种变项变换后的结果,而不宜称之为“潜在”变项。更具体来说,虽然两种方法都是应用类似的线性转换的统计程序来进行资料缩减,但PCA的资料缩减所关心的是测量变项的变异数如何被组合分数有效解释,而EFA则是进行因素萃取,排除测量误差以有效解释测量变项间的共变项。关于这两种方法的统计原理差异将在下一节说明。
从方法学角度来看,PCA与EFA的一个重要差异在于未定性(indeter-minacy)的威胁(Fabrigar, Wegener, MacCallum & Stranhan, 1999;黄财尉,2003)。PCA中的共同成分估计并非一种萃取而是一种变项变换,因此对于新变项的数值与相对应的测量变项的组成模式是一种明确的数学模式,换言之,最终得到的矩阵估计是一种明确的数学解。相对之下,EFA在估计潜在变项时,反复进行迭代估计以求取最佳结构关系时,对于潜在变项(包括共同因素与独特因素两者)的估计解是一种统计解。当研究者改变萃取方式、估计算则、对分配的假设,乃至于样本的变换、变项的增减改变,都会改变因素结构与因素分数的估计,这种未定性的问题是因素分析法最大的威胁。
从统计分析的角度来看,PCA的一个特点是不需要进行转轴(反倒是转轴会改变各个组合变项的解释变异以及与测量变项的关系,造成主成分分数的改变与扭曲),同时对于资料也不需假设其分配特征。因为不论测量变项的数值呈现何种分配,主成分分析的变项变换都可以得到估计解(除非是研究者欲对PCA的参数进行显著性考验才需要对资料分配设定常态假设)。相对之下,EFA必须进行因素转轴,重新计算因素与测量变项间的对应权数的数值,才能获得对于因素的正确解释,并能够进行恰当的命名。此外,由于FA假设观察变项的共变项受到真分数的影响,为能进行最大概似法求解,FA中的资料分配必须符合常态分配假设,因此对于因素分析的进行,在统计处理上有较高的限制与要求。有关PCA与EFA的各种差异比较详列于表1-1。
表1-1 主成分分析与因素分析的比较
然而尽管主成分分析与因素分析有诸多不同,但是仍有学者主张两者不必过度区分而可通用,例如Velicer与Jackson(1990)即点出在一般情形下以PCA所得到的估计结果与EFA相近,当因素数目偏高时,两者的差异才会趋于明显。Snock与Gorsuch(1989)也发现当测量变项增加时,两者的差异也会降低。重要的是,因素分析受到未定性的威胁甚大,发生不寻常解(例如共同性大于1的Heywood case)的机会较大,在研究实务上PCA未必居于下风。如果研究者所从事的是试探性研究或先导研究时,兼采这两种技术并加以比较,或许可以得到更多的参考资讯。
参考方块 1-1:社经地位是潜在变项吗?
社经地位是社会科学研究者最早提到的研究变项之一,因为SES与许多重要的社会、心理、教育现象有密切关系。一般而言,SES与教育、收入以及职业声望三者有关,但是如何从这三个指标产生一个SES变项呢?却是一个棘手的问题。
基本上,从现象的逻辑关系来推理,我们很难相信某一个人是因为其社经地位变高,所以他的教育程度、收入或者职业声望才会变高。反过来说,当一个人的教育水准、收入或者职业声望变高时,他的社经地位才会变高;也就是说,三个指标是“因”, SES是“果”。但是从另一个角度来看,通常一个人能受到良好教育时,他们的收入也高,职业的声望也高,三者具有中高度的相关,从因素分析的角度来看,这三个指标会有相关,是因为受到同一个影响因素的影响,那就是SES,所以,SES应该是三个指标的“因”。
前述的争议焦点其实很明显,亦即到底是SES决定了教育、收入、职业声望,还是这三者决定了SES?很明显,正因为SES难以界定与观察,同时并没有一个“实体”称为SES,因此SES毋庸置疑是一个无法直接测量的潜在变项。但是,如果指标先于SES存在,亦即SES这个潜在变项是被观察变项所影响,此时被称为形成性测量模型(formative measurement model),三个指标被称为形成性指标(formative indicators),在技术上应使用主成分分析,将三者合成一个分数,并使之最能解释这三个指标的变异。相反的,如果SES先于指标存在,亦即三个指标是SES这个潜在变项的反映或投射,此时被称为反映性测量模型(reflective measurement model),三个指标被称为反映性指标(reflective indicators),在技术上应使用因素分析,萃取出能够解释三者相关最大程度的潜在变项,定义成SES。
学者们对于SES这个潜在变项到底是反映性还是形成性各拥其主。在实证研究中,这两种策略都可以看到许多实际应用的例子。其他类似的概念还包括满意度测量、绩效指标等。在心理计量领域,形成性与反映性争议从探索性因素分析延烧到验证性因素分析,有兴趣的读者可以参看Howell, Breivik与Wilcox(2007)与其他学者的精彩辩论。另外,Petter, Straub与Rai(2007)的文章则详细列举这两种模型的差异与操作程序。不过,如果再问一个问题:SES的三个指标,究竟是应该问受测者他自己的状况呢,还是问他所身处的家庭呢?对大人要怎么问?对青少年要怎么问?看来,SES这个概念,似乎真的是一个令人难以捉摸的变项!