wow联盟bgm:金融资产收益分布的混合高斯分析

来源:百度文库 编辑:偶看新闻 时间:2024/05/05 03:19:41

金融资产收益分布的混合高斯分析 2005-6-27  

作者:张明恒,  程乾生 来源:北京大学

摘要:  本文研究了金融资产收益的混合高斯分布模型, 给出了混合高斯分布的Ko lmogo rov2Sm irnov 检验的方法, 分析了金融资产收益的非高斯性及市场价格运动的有效性. 此外, 用成分数目K 3 、拟合误差D K 3 n 和主成分系数p 3 k 描述金融资产收益的性质, 对外汇银行同业拆借市场和中国股票市场实证分析.

关键词: 金融资产收益分布; 混合高斯分布模型; Ko lmogo rov2Sm irnov 检验; 中国证券市场

1 引言

  金融资产收益规律研究可追朔到20 世纪初法国数学家Bachelier、20 世纪中叶美国经济学家Fam a 及B lack 和Scho les[ 2, 3, 7, 20 ]. 由此产生了“有效市场假说(EMH) ”理论, 它断言价格运动不遵循任何模式或趋势且过去的价格运动不能用于预测未来的价格走向[ 7, 15 ]. 然而, 无论是学术理论家还是金融实践者都对金融资产价格的有效性越来越争议并且有大量的实证分析揭示金融资产收益不遵循随机游动模型(Random W alk ) 及有效市场假说(EMH) 并不总是存在的. Lo 和. M acKin lay 通过基于方差估计的简单规范检验进一步验证股票价格及周收益序列不遵循随机游动假说模型[ 11 ]. Peters 运用动力系统方法发现了在金融市场存在混沌、序和非线性[ 13 ].

混合分布模型是金融信息统计分析的重要方法. 1973 年Clark 首次应用混合分布的概念分析股票的交易价格[ 4 ]. 此后, 1983 年Tauchen 和P it t s 应用混合变量和混合分布揭示股票市场的交易价格和交易量的关系[ 18 ]. 1984 年J. Kon 对股票收益模型进行实证比较分析[ 10 ]. 1994 年Kim 和Kon 在对收益条件异方差分析[ 9 ]. 1994 年Rchardson 和Sm ith 应用混合分布方法检测日交易的信息流[ 14 ]. 然而, 他们仅仅对模型进行似然比或V2 检验且没有解释模型参数的意义. 1985 年A itk in 和Rub in 提出基于Bayes 分析的似然比方法[ 1 ]; 2000 年Stephen s 应用BayesianMCMC 分析给出了确定混合成分数目的方法[ 17 ]. 二者都有一定的局限性.

本文对金融资产收益分布进行混合高斯分析, 用Ko lmogo rov2Sm irnov 统计量确定成分数目和检验模型并对外汇市场和证券市场进行实证分析. 第2 节给出混合高斯分布的数学模型及Ko lmogo rov2Sm irnov 统计量确定分布成分数目的计算方法并对成分数目K 3 、拟合误差D K 3 n 和主成分系数p 3 k 进行经济解释. 第3 节对外汇市场银行同业拆借利率和中国股票市场指数进行实证分析. 最后给出混合高斯分析的主要结论.

2 模型描述

记S t∈R 为金融资产价格时间序列(股票价格、指数、汇率或利率) 的独立同分布随机变. 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved. 量, 收益序列或价格对数收益序列由公式(1) 给出.

rt = log (S t .S t- 1) ,  t = 1, ., n - 1 (1)   传统上, 认为Ft = ∑t i= 1 ri = ∑t i= 1 log (S t .S t- 1) 为对数B row n ian 运动; 随机变量rt 为高斯分布; 市场价格S t= S 0e F= = S 0e RW t+ (L- R2.2 ) t表现有随机游动性质并由此导出了著名的B lack2 Scho les 期权定价公式[ 2, 3, 15, 20 ]. 但是, 近来越来越多的实证分析表明此假设并不总是成立的, 如R.S 统计量[ 13 ]、GARCH 条件异方差模型和SVM 随机波动模型[ 9, 10, 16 ]. 金融资产收益序列rt 明显地具有尖峰厚尾及波动群集特性, 收益直方图不是一个纯粹的高斯分布[ 19 ]. 因而, 可以假设金融资产收益序列遵循混合高斯分布, 即, 由一系列高斯分布的超和[ 6, 9 ]. 假设高斯分布f k ( r; Hk ) = f ( r; L k , R2 k ) = N (L k , R2 k ) , 参数Hk = (p k , L k , R2 k ) 是待估计的. p k 是第k 个成分系数, K 为成分数目. 因此, 混合高斯分布模型可由公式(2) 表示, 记F K m x ( r). f ( rt; ( ) = ∑K k= 1 p k f k ( rt; Hk ) , K E 1 (2) 其中, 0 F p k F 1, ∑K k= 1 p k = 1, ( = {H0 , ., H K - 1}.   显然仅当成分数目K 为1 时分布为高斯的. 金融资产收益序列由公式(3) 表示. rt = log (S t .S t- 1) ~ ∑K k= 1 p kN (L k; R2 k ) (3)   在混合高斯分布模型中, 待估参数集为( = {p 0, L 0, R20 , ., p K - 1, L K - 1, R2K - 1}, 可以用EM 算法估计参数[ 5, 6 ]. 尽管似然函数比(L FR) 和一些信息准则可以用于评价或选择模型. 但是由于混合模型中成分数目未知、EM 算法收敛甚慢或似然比不满足规范条件,A itk in 和Rub in 的Bayes 似然比方法局限性在于似然比不满足规范条件[ 1 ]; Stephen s 的Bayesian MCMC 分析局限性在于MCMC 计算复杂[ 17 ]. 由于Ko lmogo rov2Sm irnov 统计量是经验分布与假设分布的拟合误差, 与分布无关且有着许多良好的性质[ 12, 21 ] , 所以本文应用Ko lmogo rov2Sm irnov 统计量作为确定成分数目和检验模型的准则.

混合高斯分布模型的检验表示为:

H 0∶F ( r) = F 0 ( r) 对所有的r∈R ; H 1∶F ( r) ≠F 0 ( r) 存在着一些r∈R 这里, F 0 ( r) 是假设的分布函数, 即混合高斯分布F K m x ( r) , 参数由EM 算法估计; F ( r) 是样本总体的分布函数F n ( r) , 由观察样本计算. 记样本总体的经验分布F n ( r) 与假设分布F K m x ( r) 的拟合误差为D Kn , 由Ko lmogo rov2Sm irnov 定理知它依概率收敛于0. 设A为置信水平, LA 和D n (A) 为临界值, 检验表述为公式(4). D Kn = sup r∈R .F n ( r) - F K m x ( r) . lim n→+ ∞P D Kn > LA. n = A D n (A) = LA. n (4)   混合高斯分布模型的Ko lmogo rov2Sm irnov 检验的计算方法如下.

1) 经验分布函数: 根据观测样本计算经验分布函数F n ( r) , 如公式(5) 所示. 注意的是当样本ri 与r 比较时由于计算机表示和计算的有限位精度应对样本进行归整处理. 7 1 4 3 期张明恒等: 金融资产收益分布的混合高斯分析

. 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved. ED F ( r) = F n ( r) = # {ri∶1 Fi F n, ri F r, ri ∈R }.n (5)   2) 累积分布函数: 在EM 算法参数估计值的基础上, 应用Mon tel Carlo 模拟方法计算累积分布函数F K m x ( r) , 如公式(6) 所示, 积分区间可以用3R 法则简化. CD F ( r) = F K m x ( r) =∫r - ∞f ( r; ( ) dr = ∑K k= 1 p k∫r - ∞f ( r; Hk ) dr (6)   3) K2S 统计量: 根据计算Ko lmogo rov2Sm irnov 定理, 计算拟合误差D Kn , 如公式(7) 所示. D Kn = max 0F iF (n- 1) {.ED F ( ri) - CD F ( ri) . , .ED F ( ri+ 1) - CD F ( ri) .} (7)   4) 统计推断: 对于给定置信水平A, 计算临界值LA 和D n (A). 如果拟合误差D Kn 小于临界值D n (A) , 那么我们以(1- A)% 的置信水平接受假设H 0. 否则, 拒绝假设H 0 成立. 对于给定先验成分数目K p rior, 如果存在一个确定的整数K 3 使得D K 3 n < D n (A) 且对于所有的K ≠K 3 , 都有D K 3 n < D Kn , 那么我们称模型F K 3 m x 为最佳混合高斯分布. 否则, 在整数K p rior内无法用有限的高斯分布的超和来拟合. 最佳混合高斯分布模型的成分数目K 3 、拟合误差D K 3 n 和主成分系数p 3 k 分别如公式(8) 所示. K 3 = m in 1F K < + ∞{K ∶D K 3 n F D Kn < D n (A) } D K 3 n = m in 1F K < + ∞{D Kn ∶D Kn < D n (A) } p 3 k = max 1F kF K 3 {p k} (8)   从成分数目的角度看, K 3 m 1 意味着金融资产收益偏离于高斯分布. K 3 值越大, 偏离

高斯分布的程度越大, 金融资产的市场价格运动越无效. 仅当K 3 为1 时金融资产收益是高斯分布. 因此, 可以把混合分布数目K 3 值作为市场价格的有效性指标. 从拟合误差的角度看, D K 3 n n D n (A) 意味着混合高斯分布模型假设检验成立, 成分数目是最佳的, 从而可以用K 3 个高斯分布来拟合金融资产收益的分布且以(1- A)% 的置信水平接受混合高斯分布假设. D K 3 n 值越小且K 3 越大, 偏离高斯分布的程度越大, 拟合程度越好, 金融资产的市场价格运动越无效. 从主成份系数的角度看, p 3 k →1 意味着混合分布模型中的主成分的比例越大, 从而金融资产收益分布趋于高斯分布; p 3 k →0 意味混合分布模型中的主成分的比例越小, 从而金融资产的市场价格运动越无效. 仅仅p 3 k ≈1 和K 3≈1 我们可以认为金融资产的市场价格运动是有效的. 因此, 可以把主成分概率p 3 k 值作为市场价格的有效性指标. 因此, 可以把成分数目K 3 、拟合误差D K 3 n 和主成份系数p 3 k 作为金融资产收益的混合高斯分析和市场价格有效性的度量指标. 3 实证分析在混合高斯分布模型实证分析中, 混合数目K 的先验最大值K p rior= 8; EM 算法的最大迭代次数为4096; 采用双精度浮点数运算;Mon te Carlo 积分产生10, 000 个随机数. 实证分析结果如下. 外汇交易市场银行同业拆借利率( In terbank Rate) 的交易区间为1996 年4 月3 日到2001 年4 月1 日, 观察样本数目为n 为1826. 给定显著水平A为0105, 临界值D n (A) = 010318. 对于美圆与马克的银行同业拆借利率资产收益, 当混合成分数目K 为1, 即收益分8 1 4 数 学 的 实 践 与 认 识32 卷. 1995-2004 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved. 布为纯高斯分布, 拟合误差D Kn 为010918, 大于临界值D n (A) = 010318. 最佳混合成分数目K 3 为4, 即收益分布由4 个高斯分布混合而成, 拟合误差D K 3 n 为010208, 小于临界值D n (A) = 010318; 最佳混合模型的主成份量p 3 k 为01494. 对于美圆与港圆的银行同业拆借利率资产收益, 当混合成分数目K 为1, 即收益分布为纯高斯分布, 拟合误差D Kn 为011877, 大于临界值D n (A) = 010318. 在一定的整数范围内, 不存在一个最佳混合成分数目K 使得其拟合误差D Kn 小于临界值D n (A). 由此, 我们可以推断: 美圆与马克的银行同业拆借利率资产收益分布不是一个纯粹的高斯分布, 但可以由4 个高斯分布的超和来拟合; 美圆与港圆的银行同业拆借利率资产收益分布不仅不是一个纯粹的高斯分布, 而且还不可以由有限个(K p rior= 8) 高斯分布的超和来拟合. 上海证券交易所(SHSE) 的证券指数的区间为1996 年4 月4 日到2001 年3 月30 日, 观察样本数目为n= 1, 214. 给定显著水平A= 0105; 临界值D n (A) = 010390. 对于上证指数, 代码为1A0001, 当混合成分数目K 为1, 即收益分布为纯高斯分布, 拟合误差D Kn 为010985, 大于临界值D n (A) = 010390. 最佳混合成分数目K 3 为5, 即收益分布由5 个高斯分布混合而成, 拟合误差D K 3 n 为010179, 小于临界值D n (A) = 010390; 最佳混合模型的主成份量p 3 k 为01727. 对于上证A 股指数, 代码为1A0002, 当混合成分数目K 为1, 即收益分布为纯高斯分布, 拟合误差为010998, 大于临界值D n (A) = 010390. 最佳混合成分数目K 3 为7, 即收益分布由7 个高斯分布混合而成, 拟合误差统计量D K 3 n 为010155, 小于临界值D n (A) = 010390; 最佳混合模型的主成份量p 3 k 为01303. 对于上证B 股指数, 代码为1A0003, 当混合成分数目K 为1, 即收益分布为纯高斯分布, 拟合误差D Kn 为011065, 大于临界值D n (A) = 010390. 最佳混合成分数目K 3 为4, 即收益分布由4 个高斯分布混合而成, 拟合误差D K 3 n 为010154, 小于临界值D n (A) = 010390; 最佳混合模型的主成份量p 3 k 为01533. 深圳证券交易所(SZSE) 的证券指数的区间为1996 年4 月3 日到2001 年3 月30 日, 观察样本数目为n= 1, 214. 给定显著水平A= 0105, 临界值D n (A) = 010390. 对于深证指数, 代码为2A0001, 当混合成分数目K 为1, 即收益分布为纯高斯分布, 拟合误差D Kn 为010844, 大于临界值D n (A) = 010390. 最佳混合成分数目K 3 为6, 即收益分布由6 个高斯分布混合而成, 拟合误差D K 3 n 为010152, 小于临界值D n (A) = 010390; 最佳混合模型的主成份量p 3 k 为01406. 对于深证A 股指数, 代码为2A0002, 当混合成分数目K 为1, 即收益分布为纯高斯分布, 拟合误差D Kn 为010846, 大于临界值D n (A) = 010390. 最佳混合成分数目K 3 为6, 即收益分布由6 个高斯分布混合而成, 拟合误差D K 3 n 为010157, 小于临界值D n (A) = 010390; 最佳混合模型的主成份量p 3 k 为01311. 对于深证B 股指数, 代码为2A0003, 当混合成分数目K 为1, 即收益分布为纯高斯分布, 拟合误差D Kn 为011253, 大于临界值D n (A) = 010390. 最佳混合成分数目K 3 为5, 即收益分布由5 个高斯分布混合而成, 拟合误差D K 3 n 为010242, 小于临界值D n (A) = 010390; 最佳混合模型的主成份量p 3 k 为01590. 由此可以看到: 上海股票交易市场的指数收益分布不是一个纯粹高斯分布, 是由许多个高斯分布组成的; 深圳股票交易市场的指数收益分布不是一个纯粹高斯分布, 是由许多个高斯分布组成的; 深圳证券市场较上海市场的收益波动性更大, 结果与实际证券交易市场是一致的[ 19 ].

4 结  论

其一, 混合高斯分布模型的成分数目可以通过Ko lmogo rov2Sm irnov 统计量检验确定; K 3 、D K 3 n 和p 3 k 可以描述金融资产收益的性质. 其二, 中国证券市场的股票价格指数收益的混合高斯分布远复杂于外汇市场银行同业拆借利率资产收益, 其源于中国证券市场是一个新生的金融市场, 表现为监管机制、投资行为、交易制度等的不成熟, 其证券市场潜在风险较大. 此外, 对于美圆与港圆银行同业拆借利率收益的混合高斯分布不存在相应的最佳混合成分数目K 使得其统计量D Kn 小于临界值D n (A) , 其原因是香港金融市场在此期间受东南亚金融危机的冲击, 具体有待进一步分析验证. 其三, 混合高斯分布模型可以很好地拟合金融资产的收益分布且根据Ko lmogo rov2 Sm irnov 统计量可以推断金融资产收益分布不是一个纯粹的高斯分布(K 3 m 1) , 市场价格

运动不遵循对数B row n ian 运动, 不是简单的随机游动. 因而市场有效假说(EMH ) 并不总是成立的.