CAPM、Fama-French三因⼦、Barra模型
⼀、CAPM模型
1.1 模型
CAPM(Capital Asset Pricing Model),资本资产定价模型。模型形式为
其中  代表股票 n 的收益率;  代表市场组合的收益率,在实践中可以⽤⼤盘收益率代替;  代表⽆风险收益率,实践中可以⽤国债收益率代替; 代表随机因素
1.2 模型求解
显然,估计式中的  需要回归,那么是在时序上回归还是在截⾯上回归呢?
考虑截⾯回归,也就是等式左边是⽤某⼀天所有股票的  ,右边是某⼀天的⼤盘收益率。但是某⼀天的⼤盘收益率是⼀个常数!这意味着拿⼀个变量与⼀个常量作回归,没有意义,因此应当是在时序上回归
时序回归,也就是等式左边是⽤某⼀⽀股票在过去⼀段时间内(⽐如⼀年)每⼀天的  ,等式右边是⼤盘
在同⼀时期每⼀天的  ,这样就避免了与常量回归的问题
究其本质,只能在时序上回归的原因是  对截⾯上的所有股票是⼀样的,因此只能在时序上回归
1.3 模型意义
翻译⼀下模型:股票收益率只与⼤盘收益率相关,这种关系是线性的
很显然,如果 CAPM 模型是正确的,那么意味着选股是没有意义的——因为股票收益率只与⼤盘收益率相关,在截⾯上⼤盘收益率对所有股票是相同的,股票在截⾯上的收益率差异完全是由随机因素决定的。这显然与实践中观察到的情况不符
国产最好看紧凑suv1.4 误区
⾸先,模型中是没有截距项(alpha)的!
其次,CAPM 模型在实践上并不正确!更不能作为炒股的指导!
再次,CAPM 模型的伟⼤之处在于其理论意义,也就是在满⾜⼀系列严苛的模型假设后,CAPM 模型是正确的。或者说,CAPM 模型是理想市场环境下股市应有的样⼦
⼆、Fama-French 三因⼦模型
1.1 模型高尔夫 r20
Fama-French 三因⼦模型,模型形式为
其中  代表股票 n 的收益率;  代表市场组合的收益率,在实践中可以⽤⼤盘收益率代替;  代表⽆风险收益率,实践中可以⽤国债收益率代替; 代表随机因素;SMB(small minus big) 代表规模风险溢价(size premium),HML(high minus low)代表价值风险溢价(value premium);截距  代表定价错误(pricing error),如果模型正确这项应与 0 ⽆显著差异
SMB 跟 HML 的计算⽅式:
先根据流通市值将股票分为 1:1的⼤市值(B)和⼩市值(S)股票;根据账⾯市值⽐数据将股票分为3:4:3的⾼中低(H/M/L)三组;这样我们就有了2×3共计6种投资组合(SL/SM/SH/BL/BM/BH)。然后我们通过市值加权平均的⽅式求得各组的收益率,最后就是求SMB和HML了:
其本质是,SMB :流通市值占后 50% 的⼩市值股票加权平均收益率 - 流通市值占前 50% 的⼤市值股票加权平均收益率
HML:流通市值占前 30% 的⾼价值股票加权平均收益率 - 流通市值占后 30% 的⾼价值股票加权平均收益率
1.2 模型求解
像 CAPM 模型⼀样,Fama-French 三因⼦模型是在时序上回归
1.3 模型意义
翻译⼀下模型:股票收益率只与⼤盘收益率、市值、市净率相关
相对于 CAPM 模型,Fama-French 三因⼦模型加⼊了市值、市净率两个新的因⼦,分别代表规模跟价值,这是在实践中⼴泛认同的两个因⼦,因此在实践中⽐ CAPM 模型的效果要好
但是其因⼦的构造过程(强⾏构造两个资产组合)在理论上缺乏依据
1.4 误区
⾸先,对于价值因⼦,有些资料上写的是账⾯市值⽐,有些资料上写的是市净率。其实账⾯市值⽐与市净率互为倒数
其次,划分股票时是以流通市值为依据的!不是以公司个数为依据的!
再次,计算平均收益率时是以流通市值为权重的!不是简单平均!
三、Barra 模型
1.1 模型
Barra 模型,模型形式为
其中  代表股票 n 的收益率;  代表⽆风险收益率,实践中可以⽤国债收益率代替; 代表特异性收益率(specific return); 代表国家因⼦收益率; 到  代表 P 个⾏业因⼦收益率; 到 代表 Q 个风格因⼦收益率;对应的 X 代表因⼦暴露
所有股票在国家因⼦上的暴露均为1;如果股票属于⾏业  ,则  ,其余⾏业因⼦暴露为 0
1.2 模型求解
Barra 模型的求解是在截⾯上进⾏的,也就是已知因⼦暴露求因⼦收益率
高速公路救援电话那么因⼦暴露是什么呢?Barra 模型与 Fama-French 模型不同,它没有⼈为构造⼀个资产组合,⽽是直接把标准化后的变量值作为因⼦暴露。⽐如风格因⼦ S1 是市盈率,那么股票在市盈率上的暴露就是股票本⾝的市盈率的标准化
将上述模型写成矩阵形式:
注意到,国家因⼦与⾏业因⼦之间存在完全共线性,即 ,所以需要对矩阵 X 加⼀个约束,即:
,其中  代表⾏业 i 的流通市值。这个约束的意义是:⾏业因⼦收益率的市值加权为 0
将此式代⼊后可以消掉 ,解决完全共线性的问题
在这个回归求解中,还涉及到异⽅差的问题,即  的⽅差互不相同。实践中认为  的⽅差与  成正⽐,
因此最终进⾏的是加权最⼩⼆乘,权重是
速腾1.4对上述带约束的⽅程求取加权最⼩⼆乘,可以解得因⼦收益率向量
1.3 模型意义
Barra 模型是⼀个典型的多因⼦模型。其创新点有四
⼀是引⼊了国家因⼦,并解决了国家因⼦与⾏业因⼦的多重共线性问题。宏观经济因⼦全部被国家因⼦所代表,经济周期则被⾏业因⼦所代表哈雷摩托车
⼆是使⽤的是加权最⼩⼆乘,解决了回归中的异⽅差问题
三是直接使⽤标准化后的变量值作为因⼦暴露,⽽⾮⼈为构造资产组合,这种模型更加⾃然
四是标准化可以使得因⼦暴露的⽅差为 1,所以求出的因⼦收益率是可以⽐较的
四轮驱动1.4 误区
⾸先,风格因⼦中不应该有  这种在截⾯上对于所有股票都相同的因⼦——这些因⼦都被涵盖在国家因⼦中了
其次,前⼆个模型均是当期与当期数据的回归,barra 模型中的 X 是上⼀期的,⽽ r是当期的,也就是因变量与⾃变量之间隔了⼀期
再次,barra 模型不是⽤于预测股票收益率的!虽然 barra 模型中的 X 是上⼀期的,⽽ r是当期的,看似可以⽤来预测股票收益率,但是求出的因⼦收益率向量f也是上⼀期的,预测股票收益率必须假设因⼦收益率向量 f在时序上平稳,⽽这与实践不符
那么 barra 模型是⽤来作什么的呢?答案是⽤来探究因⼦的性质的。在每个截⾯上都可以求得⼀个因⼦收益率 f,这样就有了每个因⼦的收益率序列,可以从中筛选出稳定的因⼦,也可以探究因⼦之间的相关性,进⽽探究股票之间的相关性,起到降维的作⽤