1 绪论
1.1 选题背景与问题提出
1.1.1 选题背景
资产收益率分布具有尖峰厚尾、非对称等高阶矩特征,以及投资者效用函数的非二次性,已经被大量研究证实。这导致了马克维茨的均值-方差分析和期望效用原则具有一致性的充分条件不再成立(Markowitz,1952;Liu,2004;Hong,Tu和Zhou,2007;Markowitz,2014)。在一个对效用函数形状相对较弱的假设条件下,Scott和Horvath(1980)以及Kimball(1993)发现除了均值和方差外,投资者对单个资产或投资组合的高阶矩同样存在显著的偏好。Ang等(2006)以及Harvey和Sidddique(2000)基于上述问题通过实证研究发现,在不存在估计误差的条件下,大部分投资者愿意放弃均值-方差投资组合,以低收益、高风险为代价来获得偏度为正、峰度较低的投资组合方式。为了突破均值-方差投资组合模型的局限性,基于高阶矩的投资组合研究逐渐得到了学者们的关注(Kendall和Hill,1953;Mandelbrot,1963a和1963b;Samuelson,1970;Liu,Wang和Qiu,2010;Cvitanic,Polimenis和Zapatero,2008;Boudt,Lu和Peeters,2015;Lu,Yang和Boudt,2019)。
如何将高阶矩与投资组合关联起来,主流文献中通常采用如下两种方式:一种是在均值-方差模型框架下直接加入高阶矩(偏度和峰度),从而形成均值-方差-偏度或均值-方差-偏度-峰度投资组合模型(Lai,1991;Sun和Yan,2003;Briec,Kerstens和Woestyne,2013);另一种是以投资者期望效用函数最大化为目标,通过泰勒级数展开将投资组合问题近似转化为基于高阶矩的投资组合优化来进行间接求解(Harvey和Siddique,2000a;蒋翠侠、许启发、张世英,2007,2009)。
以上两种研究方法各有利弊,但不可避免地均需要估计协方差矩阵、协偏度矩阵以及协峰度矩阵。随着资产个数的增加,估计协偏度矩阵和协峰度矩阵中的维数会以指数形式快速增加进而涉及高维问题,这一问题在估计协方差矩阵时同样存在。同时大量研究已经表明,使用历史收益率数据估计的样本协方差矩阵存在较大的估计误差,从而无法良好地分散风险以达到最优的投资组合效果(Michaud,1998)。因此,大量参数需要估计,使得“维数灾难”成为研究此类问题亟待解决的难题。例如,在包含20个资产的投资组合中,协方差矩阵、协偏度矩阵以及协峰度矩阵需要估计的参数分别达到了210、1 540和8 855个。为了保证样本观测数量超过待估参数的个数,我们至少需要45年的月度数据。考虑中国金融市场起步较晚,没有足够的低频时间序列数据可供使用,因此将“均值-方差”分析的传统方法直接推广到高阶矩中存在着现实意义上的困难(Brandt,Santa-Clara和Valkanov,2009)。
1.1.2 问题提出
目前,国内外已有部分学者对高阶矩建模及其投资组合理论和应用进行了研究。尽管部分研究在某些方面已经较为深入,但仍存在以下几点不足之处,具体来看:
(1)在因子模型最优因子个数识别方面,几乎所有研究均是基于均值-方差理论展开的,而基于高阶矩最优因子个数识别的理论和识别方法尚未被进行深入的研究。目前来看,尽管已有大量文献在投资组合框架下研究了如何减少协方差矩阵中元素的估计误差,但基于高阶矩投资组合方面如何提高高阶矩估计质量的研究并不多见。在高阶矩方面,之前大部分研究聚焦于如何利用高阶矩信息进行资产定价(Kraus和Litzenberger,1976;Harvery和Siddique,2000),且大量学者通过实证研究发现风险溢价的存在同样与投资组合收益率分布的高阶矩有关(Dittmar,2002;Ang,Chen和Xing,2006)。但很少有研究关注如何提高高阶矩矩阵的估计质量。相比之下,Martellini和Ziemann(2010)较早地拓展了多种在协方差矩阵估计中被证明有用的统计技术并应用到高阶矩条件中。比较直观的解决“维数灾难”的方式是对各阶矩矩阵中元素施加某种约束,使其结构化以降低参数空间的维度。其中,单因子模型(Sharpe,1963)或多因子模型(Chan,Karceski和Lakonishok,1999;Fama和French,1993,2015)可以作为一个有意义的拓展手段解决“维数灾难”问题。这两种方法均以增加模型设定误差为代价来减少估计误差。目前,根据因子选择方法的不同,主流文献中存在三种类型的多因子模型:宏观经济因子模型、基本面因子模型和统计因子模型(Zivot,2011;Goyal,2012)。对于该三种因子模型的优劣,Connor(1995)较早地采用美国证券市场数据基于解释能力对该三种方法进行了比较,研究发现统计因子模型和基本面因子模型显著优于宏观经济因子模型,同时基本面因子模型略优于统计因子模型。Chan,Karceski和Lakonishok(1999)基于样本外预测角度认为Fama和French(1993)三因子模型在选择最小方差投资组合时已经足够,更多的因子无益于提高预测精度。Martellini和Ziemann(2010)较早地将因子模型拓展到了高阶矩的估计,但在因子个数选择方面并没有过多讨论,而仅仅是采用了Sharpe(1963)的单因子模型,对于一些简单的投资组合问题,如在同一市场中的组合或资产个数较低时,用单因子模型来描述资产收益率有可能是可以接受的,但面对不同市场的组合或高维投资组合时,仅仅使用单一因子估计就可能会导致较大的偏差。在对多因子模型高阶矩估计方面,仅有Boudt、Lu和Peeters(2015)基于多因子模型讨论了协偏度和协峰度的估计,不仅在一定程度上缓解了“维数灾难”的问题,同时也证明了样本外预测的优良性质。Boudt、Cornilly和Verdonck(2016)对Martellini和Ziemann(2010)的研究做了进一步推广,获得了多因子模型下协偏度矩阵的最优压缩估计量,并发现其在均方误差下具有令人满意的效果。
采用因子模型方法估计协方差矩阵已经被广泛使用,然而采用同样方法估计三阶矩和四阶矩等高阶矩矩阵直到近些年才引起部分学者的重视(Harvey和Siddique,2000a和2000b;Christie-David和Chaudhry,2001;Martellini和Ziemann,2010),这在一定程度上得益于投资者对极值风险的关注、对冲基金等非正态资产的使用、决策理论的提出以及统计方法和计量经济学模型的发展。传统的非限制性估计方法虽然可以保证参数估计的无偏性,但面对高阶矩时无法解决“维数灾难”这一问题。而通过因子模型对高阶矩矩阵施加结构化约束虽然可以大大减少待估参数的个数,但也增加了模型设定错误的可能性,因此在对矩阵施加结构化约束的过程中,因子个数选取的合理性这一问题也不可避免地需要考虑。综合以上原因,有必要提出一套完整的统计方法用以检验使用因子模型估计高阶矩矩阵时的最优因子个数。
(2)为了降低高阶矩中元素的估计误差在投资组合优化中带来的影响,受到研究方法以及数据频率的限制,目前大部分研究采用同频数据,而忽略了非同频因素的影响。Fan、Li和Yu(2012),马丹和刘丽萍(2012)和Hautsch,Kyj和Malec(2013)等基于高频数据获得协方差矩阵研究均值-方差投资组合问题时,发现相对于低频数据的投资组合,使用高频数据投资组合风险更小,经济价值更高。但考虑到我国金融市场中资产收益率历史数据往往较少,而可供使用的因子历史数据往往较多,因此可充分利用频率较高的因子数据构建具有较高R2的混频模型,从而进一步降低各阶矩矩阵中元素的估计误差。可以将基于混合频率多因子模型的高阶矩投资组合建模作为一种十分具有研究价值的手段以解决“维数灾难”问题。在关于混合频率回归模型的相关文献中,Ghysels等(2004,2007)提出了一种可行性较强的混频数据抽样(MIDAS)模型方法,Clements和Galvao(2008,2009)研究了混合频率回归模型的预测表现。Bai等(2013)通过使用混频动态因子模型研究了混频模型和卡尔曼滤波的关系,并且发现对于平稳序列,两种方法可以获得同等的预测效果。Fuleky和Bonham(2013)已经证明了混合频率因子模型在预测方面的优良性质,但基于混频高阶矩建模的研究鲜有。
综上所述,尽管国内外已有众多学者对高阶矩建模及其投资组合理论进行了较为广泛的研究,但在基于因子模型高阶矩建模最优因子个数识别以及混频高阶矩投资组合理论与建模这一研究方向上,仍然存在诸多问题有待解决。