社会及行为科学研究法(3?资料分析)
上QQ阅读APP看书,第一时间看更新

七 总结

回归分析是社会科学研究中最常见的分析方法,其优点是简单易懂,可以用于归纳、验证以及预测上,而回归系数的诠释,直观上可视为控制其他变因之下特定自变项和依变项的共变关系,更提供了研究者在缺乏实验室环境下,找出因果推论的分析工具。这个优点在大多数无法进行实验法研究的社会科学中,显得特别重要。

然而回归分析毕竟是事后归纳的一种分析工具,变项选取和模型关系的设定都需要理论的依据,因此回归分析并没有办法取代理论层次上的讨论,而是作为辅助的角色,从经验上检证理论假设的有效性。换言之,除非研究者的目的是纯粹地探索变量间的相关性,否则回归分析都应该受到理论的指导,并且变量间的关联性假设都要有充分的理由。

回归分析在因果推论上的基础,就是透过排除自变项间共变关系与依变项的相关性,探求单一自变项变化时所伴随依变项变化的效果,逻辑上应用了共变法,概念上称为“统计控制”。然而许多现象本身,其因果关系的连结相当复杂,且主要影响依变项的变因,是来自许多自变项共变后的结果,抑或具有先后顺序的路径关系,此时统计控制的优点反倒成为分析上的缺点,无法将自变项与依变项间复杂的因果关系呈现出来,而必须寻求其他的统计方法来达成其分析目的,如径路分析。

此外,在资料呈现不同特性时,如群组性、地域性、时序性或配对性,简单回归分析在数理上就不足以妥适地进行参数推估的工作,必须针对资料特定采取进阶的统计方法来处理。然而这也正是回归分析未来发展的趋势,也就是结合资料特性以及多变量方法,根据分析目的之需要,发展出针对性强且更为细致的回归方法。

近年来回归分析发展的另一个重要趋势,就是强调参数推估的稳健性(robustness)。许多学者认为传统的最小平方法所得到的参数估计,其数理基础建筑在限定性很高的资料条件下,因此所得到的结果其稳健性是有待质疑的。针对这样的缺点,社会科学家从不同的角度发展出许多方法,大致可分成三类。第一类是以其他参数推估法,如最小绝对离差法(least absolute deviation)或贝氏因子(Bayes factor)等,来取代最小平方法的估计。第二类舍弃采用“中央极限定理”的假设检定法,改以模拟法的方式来估算出参数估计显著性p值。第三类则含括了各种统计诊断的方法,试图找出影响参数估计的稳定性之原因。

然而归根究底,社会科学强调理解和诠释的本质依然没有改变。因此尽管回归分析的方法推陈出新,同时对于数理技巧的要求也日渐增高,这些技术上的精进,若是没有具有洞察力的理论指引,恐怕在解释人类社会的各种行为和现象时,都无法避免理解上的贫乏及诠释上的空洞,反倒背离了采用回归分析的初衷,为了量化而量化,这是社会科学研究者必须谨记在心的。