从单因子模型到多因子模型 -- 潘登同学的Quant笔记

从单因子模型到多因子模型 -- 潘登同学的Quant笔记

拓展到多因子的依据是什么？
- C-CAPM框架下的单因子
- C-CAPM框架下的多因子

推导多因子模型
- 单因子两资产
- 多因子多资产

$\alpha,\beta$分离
因子选股
统计套利

单因子模型、多因子模型

根据CAPM： $$ E[\tilde{r_j}] = r_f + \beta_{M,j}(E[\tilde{r_M}]-r_f) $$ 将其写成计量模型，很容易就得出了单因子模型 $$ \tilde{r_j} - r_f = \alpha_i + \beta_{i,M}(\tilde{r_M}]-r_f) + \tilde{\epsilon_i} $$ Fama和French 1993年指出可以建立一个三因子模型来解释股票回报率 $$ \tilde{r_j} - r_f = \alpha_i + \beta_{i,M}(\tilde{r_M}]-r_f) + \beta_{i,s}\tilde{SMB_i} + \beta_{i,h}\tilde{HML_i} + \tilde{\epsilon_i} $$ 其中，$\tilde{SMB_i}$表示市值因素，$\tilde{HML_i}$表示账面价值与股票市值之比；

拓展到多因子的依据是什么？

C-CAPM框架下的单因子

回到C-CAPM，代表性消费者的优化问题

$$ \begin{aligned} \max_{c_0} \quad & u(c_0) + \delta E[u(\tilde{c_1})] \ s.t. \quad & \tilde{c_1} = (1+\tilde{r_w})(w_0-c_0) \ FOC: & 1 = E[\delta\frac{u'(\tilde{c_1})}{u'(c_0)}(1+\tilde{r_w})] \end{aligned} $$ 其中$\tilde{r_w}$为市场组合的回报率，$w_0$为消费者0时期的财富；

假设消费者的效用函数是二次型$u(c)=-\frac{1}{2}(a-c)^2$,则$u'(c) = a-c$，则随机折现因子可以表示为 $$ \tilde{m} = \delta\frac{u'(\tilde{c_1})}{u'(c_0)} = \delta\frac{a- (1+\tilde{r_w})(w_0-c_0)}{a-c_0} = A - B\tilde{r_w} \ A=\delta\frac{a}{a-c_0} - \delta\frac{w_0-c_0}{a-c_0},B=\delta \frac{w_0-c_0}{a-c_0} $$ 之前在C-CAPM推出来的结论(对所有资产成立，自然对无风险资产成立) $$ 1 = E[\tilde{m}(1+\tilde{r_f})] \ \Rightarrow 1 = E\tilde{m}+cov(\tilde{m},{r}_f) \Rightarrow \frac{1}{E[\tilde{m}]} -1 = r_f $$ 对于任意资产$i$: $$ \begin{aligned} 1 &= E[\tilde{m}(1+\tilde{r_j})]\ \Rightarrow 1 &=E\tilde{m}+cov(\tilde{m},\tilde{r}_j) \ \Rightarrow E[\tilde{r_j}] &= \frac{1}{E[\tilde{m}]} - 1 - \frac{cov(\tilde{m},\tilde{r}_j)}{E[\tilde{m}]} \ &=r_f - \frac{cov(\tilde{m},\tilde{r}_j)}{E[\tilde{m}]} \ &=r_f - \frac{cov(A - B\tilde{r_w},\tilde{r}_j)}{E[\tilde{m}]} \ &=r_f + \frac{cov(\tilde{r_w},\tilde{r}_j)}{var(\tilde{r_w})} \frac{B var(\tilde{r_w})}{E[\tilde{m}]} \ \end{aligned} $$ 定义$\beta$: $$ \beta_{j,w} \triangleq \frac{cov(\tilde{r_w},\tilde{r}_j)}{var(\tilde{r_w})} $$ 定义常数$\lambda$ $$ \lambda_w \triangleq \frac{B var(\tilde{r_w})}{E[\tilde{m}]} $$ 所以资产j的期望回报率可以写成 $$ E[\tilde{r_j}] = r_f + \beta_{j,w}\lambda_w $$

C-CAPM框架下的多因子

现在我们假设消费者除了拥有初始财富 $w_0$ 外，还在 0 期与 1 期分别拥有工资性收入 $y_0$ 与 $\tilde{y_1}$,则最优化问题为 $$ \begin{aligned} \max_{c_0} \quad & u(c_0) + \delta E[u(\tilde{c_1})] \ s.t. \quad & \tilde{c_1} = (1+\tilde{r_w})(w_0+y_0-c_0) + \tilde{y_1} \ FOC: & 1 = E[\delta\frac{u'(\tilde{c_1})}{u'(c_0)}(1+\tilde{r_w})] \end{aligned} $$ 则随机折现因子表示为 $$ \tilde{m} = A - B\tilde{r_w} - C\tilde{y_1} \ A=\delta\frac{a}{a-c_0} - \delta\frac{w_0+y_0-c_0}{a-c_0},B=\delta \frac{w_0+y_0-c_0}{a-c_0},C = \delta \frac{a}{a-c_0} $$ 那么最终会得到 $$ E[\tilde{r_j}] = r_f + \beta_{j,w}'\lambda_w' + \beta_{j,y}'\lambda_y' $$ 这样，我们就把资产的期望回报率用一个两因子的模型给表示了出来。现在，决定资产期望回报率的，既有资产回报率与市场总回报率之间的相关性，也有资产回报率与工资收入之间的相关性。

从以上的推演，我们可以看到多因子模型背后的直觉。所谓因子，实际上是会影响随机折现因子的不确定性来源。

因子一定会贡献系统性风险(否则可以通过diversification来消除)

APT

在实践中，以资产定价为目标的投资者往往并不是很关心因子有何经济含义，而只是在乎能否找到对资产回报率有解释力的解释变量来提升自己定价的精度。所以，多因子模型的理论根基其实是 Ross 提出的套利资产定价理论（APT）。

APT的核心思想：所有资产的期望回报率都由一组共同的因子所决定时，基于无套利的思想，不同资产的期望回报率之间会有某种线性关系；

推导多因子模型

符号记法：

factor risk: 因子的系统性风险
loading: 因子前的系数
idiosyncratic risk：与因子风险无关的剩余风险,$\tilde{\epsilon_i}$

单因子两资产

单因子:$f$,将其标准化$E[\tilde{f}]=0$,构造两个资产 $$ \begin{cases} \tilde{r_i} = \bar{r_i} + \beta_i \tilde{f} \ \tilde{r_j} = \bar{r_j} + \beta_j \tilde{f} \ \end{cases} $$

构造资产组合p: $$ \begin{aligned} \tilde{r_p} &= w \tilde{r_i} + (1-w) \tilde{r_j} \ &= w(\bar{r_i} + \beta_i \tilde{f}) + (1-w) (\bar{r_j} + \beta_j \tilde{f}) \ &= [w\bar{r_i} + (1-w) \bar{r_j}] + [w\beta_i + (1-w) \beta_j] \tilde{f} \ \end{aligned} $$ 接下来分两步

找到$w_0$使得$w\beta_i + (1-w) \beta_j=0\Rightarrow w_0=\frac{\beta_j}{\beta_j-\beta_i}$ $$ \tilde{r}_{p0} = \frac{\beta_j \bar{r_i} - \beta_i \bar{r_j}}{\beta_j - \beta_i} = r_f\ \Rightarrow \frac{\bar{r_i}-r_f}{\beta_i} = \frac{\bar{r_j}-r_f}{\beta_j} \ $$ 则对任意一个资产, $$ \lambda \triangleq \frac{\bar{r_i}-r_f}{\beta_i} \qquad \forall i \ \bar{r_i} = r_f + \beta_i \lambda $$ 对于任意一个资产$i,j$, $$ \lambda = \frac{\bar{r_i} - \bar{r_j}}{\beta_i - \beta_j} \qquad (\frac{a}{b} = \frac{c}{d} = \frac{a+c}{b+d}) $$
找到$w_1$，使得$w_1\beta_i + (1-w_1)\beta_j = 1\Rightarrow w_1=\frac{1-\beta_j}{\beta_i-\beta_j}$ $$ \begin{aligned} \tilde{r}_{p1} &= [\frac{1-\beta_j}{\beta_i-\beta_j}\bar{r_i}+(1-\frac{1-\beta_j}{\beta_i-\beta_j})\bar{r_j}] + \tilde{f}\ &= \frac{\beta_i\bar{r_j}-\beta_j\bar{r_i}}{\beta_i-\beta_j} + \frac{\bar{r_i}-\bar{r_j}}{\beta_i-\beta_j} + \tilde{f}\ &=r_f + \lambda + \tilde{f}\ \end{aligned} $$ 两边同时取期望 $$ \begin{aligned} \bar{r}_{p1} &= r_f + \lambda \ \Rightarrow \lambda &= \bar{r}_{p1} - r_f \quad (表示factor \quad premium) \ \lambda &= \frac{\bar{r_i}-r_f}{\beta_i} = \bar{r}_{p1} - r_f \ \Rightarrow \bar{r_i}-r_f &=\beta_i(\bar{r}_{p1} - r_f) \end{aligned} $$

多因子多资产

假设有K个因子，N个资产 $$ r_i = \bar{r_i} + \sum_{k=1}^K \beta_{i,k} \tilde{f_k} + \tilde{\epsilon}_i,i=1,\dots,N, N>K $$ 假设$E[\tilde{f_k}]=0,E[\tilde{\epsilon}_i]=0,E[\tilde{f_k}^2]=1,E[\tilde{\epsilon}_i^2]=\sigma_{\epsilon}^2<\infty,E[\tilde{f}_k\tilde{f}_{k'}]=E[\tilde{\epsilon}_k\tilde{\epsilon}_{k'}]=E[\tilde{f}_k\tilde{\epsilon}_{k}]=0$, $$ \tilde{r_p} = \sum_{i=1}^N w_i\tilde{r_i} = \sum_{i=1}^N w_i\bar{r_i} + \sum_{k=1}^K (\sum_{i=1}^Nw_i\beta_{i,k})\tilde{f_k} + \sum_{i=1}^N w_i \tilde{\epsilon}_i $$

所有loading=0 $$ (\sum_{i=1}^Nw_i\beta_{i,k}) = 0 \quad \forall k,k=1,\dots,K $$ $$ \begin{bmatrix} \beta_{1,1} & \dots & \beta_{N,1} \ \vdots & \ddots & \vdots \ \beta_{1,K} & \dots & \beta_{N,K} \ \end{bmatrix}_{K\times N } \begin{bmatrix} w_1\ \vdots\ w_N
\end{bmatrix}_{N\times 1} = \begin{bmatrix} 0\ \vdots\ 0
\end{bmatrix}_{K\times 1} $$ 因为$N>K$，且$E[\tilde{f}_k\tilde{f}_{k'}]=0$,因子间相互独立，所以系数矩阵满秩，所以方程组有解; 接下来继续分析$\tilde{r_{p0}}$ $$ \tilde{r_{p0}} = \sum_{i=1}^N w_i\bar{r_i} + \sum_{i=1}^N w_i \tilde{\epsilon}_i \quad (w_i是各个\beta的函数) $$ 两边同时取方差 $$ \sigma^2(\tilde{r_{p0}}) = (\sum_{i=1}^N w_i^2)\sigma_{\epsilon}^2 $$ 当资产的数量N很大的时候，每个权重就大概为$\frac{1}{N}$,因此，$\sigma^2(\tilde{r_p})$的数量级就为 $$ (\frac{1}{N})^2 \times N \times \sigma_{\epsilon}^2 = \frac{\sigma_{\epsilon}^2}{N} $$ 当$N\to \infty,\sigma^2(\tilde{r_{p0}}) \to 0,r_{p0}$就是无风险组合 $$ \tilde{r_{p0}} \approx \sum_{i=1}^N w_i\bar{r_i} = r_f $$
对K个因子，各个因子的loading=1进行构建,就能得到$\lambda_k$(表示第k个因子的因子溢价)

进而得到一般情况下的APT $$ \bar{r_i} = r_f + \sum_{k=1}^K \beta_{i,k}\lambda_k $$

APT的应用

$\alpha,\beta$分离

构造如下APT模型 $$ \tilde{r}_0 - r_f = \alpha_0 + \sum_{n=1}^N \beta_{0,n}\tilde{r}_n + \hat{\epsilon}_0 $$ $\tilde{r}_0$表示0这个资产组合，可以用另一个资产组合的收益$\sum_{n=1}^N \beta_{0,n}\tilde{r}_n$来表示;

那么只需要买入0，卖出$\sum_{n=1}^N \beta_{0,n}\tilde{r}_n$这个资产组合就能对冲掉因子所形成的系统性风险，得到了一个$\alpha_0 + \hat{\epsilon}_0$

因子选股

在实践中，多因子模型经常被用来筛选投资标的，最常见的是用来选股。一个因子代表了一个对股票期望回报率有解释力的因素。如果这种解释力很强，那么用因子来给所有股票从好到坏排个序，买入排在前面的股票（卖出排在后面的股票），就应该能获得不错的回报。

统计套利

统计套利不等于无风险套利，统计套利，则是利用统计分析工具来找出相互联系的资产价格之间长期稳定的数量关系。当观测到现实价格数据大幅偏离这种长期稳定关系时，进行相应的操作来赌这种偏离会消失。所以统计套利不是无风险的。因为我们无法保证过去稳定的数量关系在未来不会破裂。一旦这种数量关系破裂了，那么下注来赌偏离会消失就会亏掉不少钱。

可以计算各只股票过去一段时间的实际回报率。如果有股票实际回报率超过期望回报率，就说明它前段时间股价涨得太快了，有理由预期它接下来一段时间的股价涨幅会慢一些。