Expectation disarray: Analysts’ growth forecast anomaly in China 论文阅读

Abstract

在中国，分析师对增长的预测与股票回报呈现正相关，这与在美国发现的情况相反。买入增长预测高的股票并卖出预测低的股票的策略，每年可以获得高达20%的超额回报（统计显著性水平超过三）。
1. 这种正相关关系在长期预测及事先更具信息含量的预测中表现得尤为明显。
此外，分析师预测与基于统计模型的无偏预测之间的差异也预示着更高的超额回报。
尽管中国分析师预测与股票回报的关系与美国相反，但这些预测同样能够较好地反映实际的增长情况，并且预测值常常过于乐观，这一点与美国相似。

我们的研究结果显示，中国的投资者往往忽略了分析师预测中所包含的重要信息。

中美市场的差异

大量的研究表明，在美国股市中，分析师的增长预测倾向于负向预测股票收益。研究人员将这一现象主要归因于分析师和投资者预期中的偏差（例如，Bordalo 等人，2019；Da 和 Warachka，2011；De Bondt 和 Thaler，1990；La Porta，1996）。然而，我们使用中国股市的数据发现了完全相反的模式：分析师的增长预测正向预测异常股票收益。

解释这两个市场之间差异的两个潜在原因可能是：

分析师的差异
投资者的差异

在美国，分析师的预测已被证明对未来的收益具有高度信息性并且可预测地存在偏差，如过度乐观（Richardson 等人，2004）我们在同样条件下对中国进行了回归分析，得到类似的结果：对于当前财年，分析师的收益增长预测与实际增长的相关系数为0.9，对于随后两年的相关系数为0.3。

因此，虽然那些有乐观预测的公司确实经历了更快的增长，但它们系统性地未能达到这些预测并经历了向下修正预测。

排除了分析师差异的解释后，我们将重点放在理解投资者的行为上。即使这些公司在财报发布期间更有可能未达到分析师的增长预测并经历向下修正预测，但具有乐观增长预测的股票仍然带来了显著的正向异常收益。

重要的是，增长预测与随后股票收益之间的正向关联在更长的预测期限内以及预测事前更加准确（通过过往准确性、机构持股和分析师覆盖来代理）的情况下表现得更为明显。
这一证据与解释相符，即中国的投资者往往忽视了分析师增长预测中所包含的基本信息。

如何调和中美市场的相似性和差异

在这两个市场中，分析师的主要职责都是制作研究报告，提供诸如收益预测、建议和目标价格等关键投资决策信息。因此，两个市场的预测应该具有相似的信息含量。

另一方面，中国股市环境在市场参与者构成方面与美国市场有实质性差异。在中国股市中，散户投资者占主导地位，而在美国市场中，机构投资者具有更大的影响力。这种差异可以使分析师的预测在这两个市场中具有截然不同的资产定价含义。特别是，由于类似的业务培训，机构投资者更有可能定期消费分析师报告或采取类似于分析师的心态。相比之下，散户投资者通常无法很好地获取分析师报告，即使能够获取，他们也可能不如机构投资者那样充分地利用其中的信息。

为什么美国分析师预测导致负向收益

我们测量了分析师预测与基于统计模型的无偏预测之间的偏差。这些偏差捕捉到了分析师的私人信息及其偏差（de Silva 和 Thesmar，2021）。

如果分析师的私人信息已完全反映在价格中，则这些偏差不应该预测随后的股票收益。如果分析师的偏差也被嵌入价格中，则这些偏差应该负向预测股票收益。
- 举个例子：如果当前股价60，未来事后股价65，统计模型预测股价60，而分析师的预测为70，其与统计模型的偏差为10，将这个10分解为两部分，一部分是分析师的私人信息（5），另一部分是分析师的偏差（5）。如果分析师的私人信息完全反映在价格中（当前股价变成65），则剩下的分析师的偏差无法预测随后的股价收益。如果分析师的偏差也被嵌入价格中，价格会过于乐观（当前股价变成70），但事后股价仍然会下跌（65），所以些偏差应该负向预测股票收益。
来自美国的证据表明，这种偏差强烈且负向地预测随后的股票收益，这表明分析师预测中的私人信息连同这些预测中的偏差一起很好地反映在了价格中。（Bordalo 等人，2019；Da 和 Warachka，2011；La Porta，1996）
然而，在中国，我们再次发现了相反的模式：分析师预测与统计基准之间的偏差正向预测异常收益。这一发现进一步支持了以下论点，即在中国，分析师的增长预测包含了尚未在股市中反映的私人信息。

现有文献表明，分析师的预测是可预测地带有偏差的，而这些偏差在美国市场中扭曲了股价，导致了显著的市场异常，如短期反应不足和长期反应过度（例如，Bordalo 等人，2019；Bouchaud 等人，2019；Da 和 Warachka，2011；De Bondt 和 Thaler，1990；Engelberg 等人，2020；Guo 等人，2020；Jegadeesh 等人，2004；La Porta，1996）

Methodology

Data

来自中国股市与会计研究（CSMAR）数据库的月度股票层面市场数据和公司层面财务数据；
来自万得资讯（WIND）的每日分析师共识预测数据。分析师通常对未来一年（当前财年，FY1）、两年（FY2）和三年（FY3）的收益进行预测。

我们的样本期间从2010年1月至2020年12月。选取包含所有在上海证券交易所和深圳证券交易所主板上市以及创业板上市的A股股票的样本。然后，我们应用标准筛选方法排除掉银行和金融行业、具有ST或*ST状态（通常是规模较小且流动性差的股票）或者上市不足12个月的观测值。

最终，我们的样本由193,394个股票月度观测值组成。

核心变量是分析师的短期和长期增长预测

短期增长预测(SFG): 分析师对当前财年（FE^{(1)_i,t）的一致收益预测与最近的实际收益（AE}(0)）之差，该差值按公司最新的总资产（TA_i,t）进行调整。
$SFG_{i,t} = \frac{FE_{i,t}^1 - AE_{i,t}^0}{TA_{i,t}}$
长期增长预测(LFG):中国的分析师不会像在美国那样提供相当于长期增长预测（LTG）的数据，但他们会对未来三年的收益进行预测。三年期的一致收益预测减去一年期的预测，然后按总资产进行调整，并通过乘以二分之一来进行年化处理。
$LFG_{i,t} = \frac{FE_{i,t}^3 - FE_{i,t}^1}{TA_{i,t}} * \frac{1}{2}$

通过使用美国的数据来验证我们的LFG指标，并展示LFG与LTG之间的等级相关性约为57%,我们使用LFG和LTG复制了La Porta（1996）和Bordalo等人（2019）报告的资产定价结果，LFG和LTG的最高（最低）十分位投资组合均获得了约0.4%（0.2%）的月度CAPM阿尔法值，而大约0.6%的多空差异在5%水平上具有统计显著性。

在这里插入图片描述

这些结果表明，我们的LFG指标在很大程度上捕捉了美国市场中LTG的经济内涵。因此，在中国发现的差异并不是由我们不同的长期增长预测指标驱动的。

其他与分析师相关的变量如下

标准化意外收益（SUE）, 前年份的实际收益（AE）减去分析师的一致预测收益 $FE_{i,t}^1$ ,然后按总资产（TA）进行调整。
分析师覆盖度（ANUM）是在过去180天内发布每股收益预测的机构数量的对数。
分析师预测离散度（FDP）是在过去180天内发布的预测的标准差，按总资产（Diether 等人，2002）进行调整。
分析师预测修正（FREV）定义为过去六个月内的月度一致收益预测修正的总和（Hawkins 等人，1984；Zhang 等人，2017）。

关于公司的其他特征

公司的短期实际收益增长（SAG）是未来一年的实际收益（ $AE^{(1)}$ ）与最近的实际收益（ $AE^{(0)}$ ）之间的差额，按总资产（TA）进行调整。
长期实际收益增长（LAG）计算为未来三年的实际收益（ $AE^{(3)}$ ）与未来一年的实际收益（ $AE^{(1)}$ ）之间的差额，按公司最新的总资产（TA）调整后乘以二分之一。
我们采用过去12个月的日回报率估计单个股票的CAPM贝塔值（BETA）（Fama 和 MacBeth，1973）
公司规模（SIZE）是股票市值的对数值。
市净率（BM）是账面权益（总股东权益减去优先股的账面价值）与市值的比率（Fama 和 French，2015）
盈利能力（ROE）是公司的收益除以账面权益。
反转效应（REV）是股票滞后一个月的回报率，计算为过去20个交易日的累计回报率（Jegadeesh 和 Titman，1993）。
换手率（TO）是交易的股份数量除以流通股份数量。
流动性不足（ILLIQ）是股票的Amihud（2002）流动性不足度量。
特殊波动率（IVOL）是前一个月每日回报率回归中Fama-French三因子模型残差的标准差（Ang 等人，2006）。

为了减轻异常值的影响，我们在第1和99个百分位对所有连续变量进行了缩尾处理。

描述性统计

在这里插入图片描述

上表展示了基于短期增长预测（SFG）和长期增长预测（LFG）形成的五分位投资组合中股票的汇总统计数据（A部分为SFG，B部分为LFG）。

两面板的第一和第二列显示了SFG和LFG之间存在正相关性，这表明分析师认为公司的收益增长是正自相关的。
这两种预测都与公司的当前盈利能力（ROE）、分析师覆盖度（ANUM）和预测修正（FREV）呈正相关。
第三和第四列表明，分析师的增长预测对实际未来的收益是有信息性的，因为SFG和LFG与事后实际收益增长（SAG和LAG）呈正相关。
同时，增长预测与收益意外（SUE）呈负相关，这表明乐观的预测往往过于乐观。

Results

投资组合的收益

根据SFG和LFG构建价值加权的五分位投资组合，并在下个月持有这些头寸（long-short）

在这里插入图片描述

第一行显示，从最低五分位到最高五分位，平均每月超额收益单调增加，从0.10%增加到1.07%。
接下来的三行显示，在控制了对常见资产定价因子的暴露后，结果相似。
- 资本资产定价模型（CAPM）
- 中国四因子模型（CH4）（Liu 等人，2019）
- Fama-French-Carhart六因子模型（FF-C-6）（Fama 和 French，2015的五因子加上动量因子（Carhart，1997））

下图绘制了基于SFG或LFG构建的多空组合在投资组合构建后的12个月内每月的FF-C-6阿尔法值及其95%的置信区间。图示显示，两个投资组合的阿尔法值都相当持久，尤其是LFG组合（B部分）。LFG多空组合的阿尔法值在投资组合构建后七个月内保持在0.5%以上，并且在统计上显著。

在这里插入图片描述

结果表明，分析师的收益增长预测显著且正向地预测异常收益。这种预测能力在更长期限的预测中更强。

超额收益的回归分析

我们进一步使用Fama 和 MacBeth（1973）回归来检验SFG和LFG的资产定价含义。具体而言，每个月我们都会估计超额股票收益的横截面回归，其中的自变量包括滞后的SFG、LFG值以及控制变量：

$Ret_{i,t} = \alpha_{t-1} + \gamma_{t-1}FG_{i,t-1} + \phi_{t-1}X_{i,t-1} + \epsilon_{i,t}$

其中 $Ret_{i,t}$ 是股票 i 在月份 t 的月度超额回报； $FG_{i,t-1}$ 是分析师的增长预测（即，SFG 或 LFG）； $X_{i,t-1}$ 是一系列滞后的企业层面控制变量和分析师预测相关的变量。

在这里插入图片描述

在A面板的第一和第二列，我们报告了SFG和LFG的单变量回归结果。两个变量的系数均为正且显著：SFG的系数为8.92，LFG的系数为18.31。
在第三列中，我们在右侧同时包含SFG和LFG。两个变量的系数依然为正且显著，但是SFG的系数大小减少了一半。这个结果表明，尽管SFG和LFG包含独立的信息，但其预测能力主要来源于投资者忽视了关于长期增长的信息。
在第四列中，我们包含了已知的股票回报预测因子、分析师预测相关的变量，但仍没有影响SFG和LFG的系数。

Liu等人（2019）表明，在中国最小的30%的公司的估值受到它们“壳价值”的污染。这可能是一个问题，因为公司的壳价值可能与其收益无关，从而导致收益预测与市场估值之间的错配。

我们测试了在剔除微型市值股票之后，结果仍然成立

稳健性检验

我们使用了四种稳健性检验方法：

结果是否随着时间是稳定
- SFG策略的盈利能力在2016年后有所下降，LFG策略在这两个样本期内仍然保持高盈利。这一结果表明，即使投资者随着时间推移可能更加关注分析师的短期预测，但长期预测仍然没有引起投资者的注意。
结果是否由低价股驱动的
- 去掉了股价低于5元的股票后，SFG和LFG的回归结果仍然显著。
对在测量预测时选择的标量不敏感
- 用过去实际收益的绝对值、Equity的市值作为Y的分母，结果仍然显著。
行业调整后的预测中仍然有效
- 将SFG和LFG的预测结果减去行业均值（行业平均的SFG和LFG），结果仍然显著。

在这里插入图片描述

分析师预测中的信息与偏差

在这里插入图片描述

上图报告了

按照分析师的长期收益增长预测（LFG）的五分位绘制了市场调整后的平均回报（A面板）
相对于分析师一致预测的平均收益意外（B面板）
以及平均一致预测修正（C面板）

为了可比，所有值都是再公司年度收益公告月份前后测量了回报、收益意外和预测修正。

收益意外：实际收益与预测收益之间的差异，根据总资产进行标准化
预测修正：分析师再公告日前后的预测变化，根据总资产进行标准化

A面板显示，随着LFG的增加，平均异常股票回报单调增加。
B面板显示了收益意外与LFG之间的强负相关性。
1. 也就是说，拥有更高增长预测的公司在收益方面遭受了更大的负面意外。
C面板显示了增长预测与分析师预测修正之间的同样负相关性。

A面板与B和C面板之间的模式形成了鲜明对比，强调了我们的主要观点，即市场和分析师有着不同的视角——对于高LFG公司的投资者来说似乎是令人愉快的惊喜，但对于跟踪它们的分析师来说却是一个巨大的失望。

我们对这些结果的解释是，投资者未能将分析师预测中的有价值信息纳入定价，但同时，这些预测又表现出可预测的偏差。

简化的偏差结构

如果分析师的预测既有信息性又有偏差，理性投资者在将这些预测纳入其信念时需要过滤出偏差。最优过滤规则取决于偏差的结构。我们估计了一个可能的且简化的偏差结构，其中偏差与客观预期增长（由事后实现的增长代理）成比例。（这个模型受到了La Porta（1996）和Bordalo等人（2019）发现的支持，他们表明分析师的高增长预测往往过高，反之亦然。）

$AG_{i,t} = \alpha + \beta FG_{i,t} + Year_t + Industry_i + \epsilon_{i,t}$

其中， $AG_{i,t} \in \{SAG,LAG\}$ 是实际收益增长率, $FG_{i,t} \in \{SFG,LFG\}$ 是增长预测， $Year_t$ $Industry_i$ 为年份行业固定效应。如果我们预期分析师的增长预测包含有关未来收益增长的信息，我们预计
$\beta$ 应该为正。如果极端预测平均而言也是过于极端的，我们预期 $0 < \beta < 1$ 。

下表报告了回归的结果

在这里插入图片描述

面板A的（1）-（3）

如预期的那样，SFG和LFG上的系数显著为正，但小于1。第一列显示SFG的系数非常高，这意味着增长预测每增加一个单位，平均而言，实际增长会增加0.9个单位。
第二列显示长期增长预测（LFG）也能预测短期增长，系数为0.41。然而，这种关联似乎完全来自于SFG和LFG之间的相关性，正如第三列中小且为负的LFG系数所暗示的那样。

面板A的（4）-（6）

第四列接近零的系数表明，短期预测并不能提供有关更长期限增长的信息。
长期增长预测（LFG）对于LAG是有信息性的，如第五和第六列中显著的0.29和0.37的系数所示。
然而，这些系数也远低于1——增长预测增加一个单位只与期间实际增长增加约三分之一的一个单位相关。这一结果与美国市场的现有发现（Bordalo等，2019）一致，并表明中国的分析师预测也受到类似的可预测失真。

面板B的（1）-（3）后续的收益意外对滞后的分析师预测进行回归

结果显示，具有乐观预测的公司在分析师眼中更有可能出现令人失望的收益，如第一到第三列中的显著负系数所示。这些公司也更有可能收到向下的预测修正

面板B的（4）-（6）预测修正对滞后的分析师预测进行回归

与（1）-（3）列的结果类似，即极端预测平均而言过于极端。

机制分析

事后收益增长

进一步调查分析师预测所带来的回报可预测性的来源。

收益公告提供了一个强大的环境来识别潜在的市场意外驱动因素，因为在这一期间，围绕收益结果的信念变化可以强烈影响价格。我们专注于收益公告前后的11天窗口期，由于中国在收益公告前存在信息泄露的证据，这个窗口期比通常的要宽（Xu，2021）。我们将累积异常回报（CAR）定义为从t=-5到t=5相对于收益公告的股票回报超过市场回报的部分。

我们将CAR对SFG和LFG进行回归，并随后加入额外变量来识别潜在机制。

在这里插入图片描述

在第一和第二列中，SFG和LFG的系数正且显著，证实了前面章节中的资产定价结果。
第三列中，我们再次观察到SFG的预测能力主要被LFG所涵盖
在第四列中，我们将同期相对于分析师一致预测的收益意外（SUE）作为控制变量包含进来。我们发现SUE无法解释LFG的预测能力，这与LFG捕获的信息超越了当前时期的收益相一致。

在第五到第七列中，我们通过在右侧包含事后实现的收益增长SAG和LAG来测试我们的主要假设机制。SAG与SUE一样，在收益公告期间是已知的。另一方面，在公告期间LAG是未知的，因为它是从当前新的财政年度开始到两年后的平均实际收益增长。如果预测的预测能力源于投资者忽视了预测中的信息信号，那么在控制了事后收益增长的实现后，应该会大大“解释掉”预测的能力。在这里，我们依赖于事后收益增长LAG是LFG中事前信息信号的良好代理的假设。

在包含实际增长作为解释变量后，SFG的系数变为负数（第五列），而LFG的系数变得不显著（第七列）。第六列显示SAG仅解释了LFG预测能力的一小部分，这与LFG中包含的信息有关更长的时间段相一致。

上表的结果与我们提出的机制一致，即投资者忽视了分析师预测中的信号

预测的信息性

我们探讨一种异质性来源——预测信息性。如果投资者忽视分析师预测是驱动我们研究结果的机制，我们预期分析师预测与随后的股票回报之间的关联在这些预测（事前）更具信息性时会更强。

考虑一个极端情况，即分析师的预测完全是随机噪声；即使投资者忽略这样的预测，也不会对股票回报产生影响。相反，如果分析师的预测完美地预测了实际收益增长，而投资者忽略了这些预测，那么这些预测将预示着未来会有较大的异常回报。

使用三个不同的代理变量来衡量预测信息性

过去预测准确性（FACC），定义为上次收益预测误差的百分比绝对值的负数
$FACC_{i,t} = - \frac{|FE_{i,t-1}^{(1)} - AE_{i,t}^{(0)}|}{AE_{i,t}^{(0)}}$
分析师覆盖度（ANUM）定义为在过去180天内覆盖该股票的分析师数量的对数值。
机构持股比例（INST）是从公司最近的季度财务报表和机构持仓数据中计算得出的。我们直接从CSMAR下载此变量。

预期结果：分析师的一致性预测将更具信息性，当

分析师在过去更加准确
有更多的分析师在制作预测
股票的机构持有比例更高

在每个月底，我们根据信息性指标的第30和70个百分位将股票分为三组，并根据SFG或LFG将其分为五分位。下表报告了long-short组合的收益。

在这里插入图片描述

对于预测信息性较低的股票，SFG和LFG策略的阿尔法值不显著。这些阿尔法值的幅度很小
当应用于预测信息性高的股票时，两种策略都证明非常有利可图。
在所有三个指标的高信息性和低信息性组之间的阿尔法值差异（范围在0.86到1.51之间）很大并且高度显著。

结果进一步支持了我们的假设机制，即投资者在很大程度上忽视了分析师的信息性预测。

私人信息还是固有偏差？

理论上，分析师的预测包含四个部分：(1)公共信息，(2)私人信息，(3)偏差，以及(4)噪声。我们使用统计基准来捕捉公共信息成分，并计算分析师偏离这些基准的情况。这些偏差反映了分析师的私人信号和偏差之和。

遵循So（2013）和van Binsbergen等人（2023）的方法构建了两个统计基准。我们递归训练一个OLS模型和一个随机森林模型来使用公司特征预测公司的实际收益。OLS模型如下：
$E_{i,t} = \beta_{0,n} + \beta_{1,n}E_{i,t-n}^{+} + \beta_{2,n}NEGE_{i,t-n} + \beta_{3,n}ACC_{i,t-n}^{+} + \beta_{4,n}ACC_{i,t-n}^{-} +\\ \beta_{5,n}AG_{i,t-n} + \beta_{6,n}Dividend_{i,t-n} + \beta_{7,n}DD_{i,t-n} + \beta_{8,n}BM_{i,t-n} + \epsilon_{i,t} , \text{for n} \in \{1,2,3\}$

其中，因变量是公司收益除以总资产 $E_{i}$ 。 $t-n$ 时的滞后公司特征: 当收益为正时收益除以总资产，否则为零（ $E_{i}^{+}$ ）；如果收益为负则等于一的虚拟变量（ $NEGE_{i,t-n}$ ）；正负应计项目额除以总资产（ $ACC_{i,t-n}^{+},ACC_{i,t-n}^{-}$ 应计项目等于营业收入减去经营现金流）；总资产的百分比变化（ $AG_{i,t-n}$ ）；分红除以总资产（ $Dividend_{i,t-n}$ ）；如果公司不分红则等于一的虚拟变量（ $DD_{i,t-n}$ ）；市净率（ $BM_{i,t-n}$ ）。获得系数后，我们使用模型预测一年期、两年期和三年期的收益，使用公司最新的财务数据。

我们使用类似的过程训练随机森林模型，但是变量的数量扩展到了28个,以及月份、行业的虚拟变量。具体变量如下

在这里插入图片描述

下表报告了预测的结果

第一列显示了收益预测（基于模型的预测和分析师预测）与实际收益之间的平均Pearson相关系数。
1. 一年期OLS收益预测与实际收益之间的平均Pearson相关性相当高，为0.74。随机森林模型的表现更好，相关性为0.80。分析师预测与实际收益之间的相关性为0.75。
2. 更远期的结果不太可预测，这些相关性随着预测期限的增加而降低。
第二列显示了基于模型的预测（FE_OLS或FE_RF）与分析师预测（FE_ana）之间的平均Pearson相关系数。
1. 基于模型的预测与分析师预测高度相关
最后三列则呈现了平均预测值、平均预测误差（预测值减去实际收益）的时间序列平均值
1. 分析师预测显示出显著的乐观偏差

在这里插入图片描述

与模型相比，计算分析师的短期预测偏差（SFD）和长期偏差（LFD）
$SFD_{i,t} = FE_{ana,i,t}^{(1)} - FE_{bm,i,t}^{(1)} \\ LFD_{i,t} = (FE_{ana,i,t}^{(3)} - FE_{ana,i,t}^{(1)}) - (FE_{bm,i,t}^{(3)} - FE_{bm,i,t}^{(1)})$
其中， $FE_{ana,i,t}^{(n)}$ 表示分析师的n年期预测， $FE_{bm,i,t}^{(n)}$ 表示模型（OLS或随机森林模型）的n年期预测。

继续使用Fama和MacBeth（1973）回归来检验这些偏差与股票回报之间的横截面关系。

在这里插入图片描述

上表显示分析师的预测偏差正向预测回报，尤其是对于长期预测。这些结果再次与美国市场的结果形成对比，但与中国市场的分析师预测包含有价值的私人信息相一致，而这些信息似乎被投资者忽视了。

模型化分析

有两个潜在渠道可以解释为什么分析师的信息没有被完全纳入价格中：

投资者可能由于信息摩擦而对分析师的预测不够关注；
即使投资者观察到了分析师的预测，由于不信任，他们也可能过度缩减这些预测。

这两个渠道有不同的政策含义

如果投资者对分析师预测的低估是由于注意力不足，那么提高分析师预测的显著性措施将改善市场效率。
如果投资者由于对分析师动机的怀疑而不信任分析师的预测，那么通过激励改革来恢复金融机构的声誉可以提高效率。

在本节中，我们引入了一个模型来考虑这两个渠道，并讨论其含义。

基础模型

该模型有无限期，N家公司，一名投资者，和一名分析师。收益遵循部分可预测的随机游走。公司在时间 $t+1$ 的预期收益 $\pi_{i,t+1}$ 由以下公式给出：
$E[\pi_{i,t+1}] = \pi_{i,t} + v_{i,t+1} + \epsilon_{i,t+1}$
其中， $\pi_{i,t}$ 是公司 $i$ 在时间 $t$ 的实际收益， $v_{i,t+1}$ 是公司 $i$ 在时间 $t+1$ 的随机收益创新，服从 $(0，\sigma_v^2)$ 正态分布， $\epsilon_{i,t+1}$ 是不可预测的噪声，也服从正态分布。分析师生成一个预测 $\hat{v}_{A,i,t+1}$ ，投资者生成一个预测 $\hat{v}_{I,i,t+1}$ 。在观察到分析师的预测之后，投资者通过加权形成自己的最终预测
$F[v_{i,t+1}] = \beta_I \hat{v}_{I,i,t+1} + \beta_A \hat{v}_{A,i,t+1}$
投资者通过解决一个优化问题来选择这些值。例如，如果投资者旨在最小化预测的均方误差，那么问题就变成了估计一个多元回归模型。具体来说，投资者通过选择权重 $\beta_I$ 和 $\beta_A$ 来最小化 $E[(\pi_{i,t+1} - F[v_{i,t+1}])^2]$ 。

在现实中，由于注意力不足、信息摩擦以及各种形式的认知限制或行为偏差等因素，投资者可能无法获得最优权重 $\beta_I^*$ 和 $\beta_A^*$ 。我们将投资者赋予两个预测的主观权重记作 $\beta_I^S$ 和 $\beta_A^S$ 。最优权重与主观权重之间的差异，即 $\beta_I^* - \beta_I^S$ 和 $\beta_A^* - \beta_A^S$ 反映了投资者对两个预测的低估或高估程度。取两个方程之间的差值，我们得到预期的市场收益意外（earnings surprise）为：
$E[v_{i,t+1} - F[v_{i,t+1}]] = (\beta_I^* - \beta_I^S) \hat{v}_{I,i,t+1} + (\beta_A^* - \beta_A^S) \hat{v}_{A,i,t+1}$

这个方程表明，如果主观权重偏离最优权重，那么市场意外是可以由预测来预测的。

例如，如果投资者低估了分析师的预测，即 $\beta_A^* - \beta_A^S>0$ ,那么分析师的预测应该预测正向意外收益。

到底是不关注还是不信任？

在现实中，分析师的预测通常是可预测地带有偏差的。因此，投资者可能需要在将这些预测纳入最终预测之前对其进行去偏处理。由于对建议的过度信任或不信任，仍然可能会发生次优的信息整合。因此，注意力和信任是两个独立的因素，我们在模型中共同考虑它们。

在模型中，我们假设一个简单的线性去偏规则：
$v_A^* = \alpha^* + \zeta^*\hat{v}_A \\ v_A^S = \alpha^S + \zeta^S\hat{v}_A$
其中， $v_A^*$ 和 $v_A^S$ 分别是最优去偏和主观去偏的分析师预测。参数 $\alpha^*$ 最优地校正了分析师的无条件偏差。 $\zeta^*$ 和 $\zeta^S$ 分别是最优和主观校正了与 $\hat{v}_A$ 成比例的偏差。现有的研究表明 $\alpha^*<0$ 并且 $0<\zeta^*<1$ 这意味着投资者应该向下调整预测并将它们向零收缩。
$E[v_{i,t+1}] = \beta_I^* \hat{v}_{I,i,t+1} + \beta_A^* v_{A,i,t+1}^* \\ F[v_{i,t+1}] = \beta_I^S \hat{v}_{I,i,t+1} + \beta_A^S v_{A,i,t+1}^S$
现在，市场收益意外可以写作：
$E[v_{i,t+1} - F[v_{i,t+1}]] = (\beta_A^* \alpha^* - \beta_A^S \alpha^S) + (\beta_I^* - \beta_I^S)\hat{v}_{I,i,t+1} + (\beta_A^* \zeta^* - \beta_A^S \zeta^S)\hat{v}_{A,i,t+1}$
从这个方程可以看出，投资者的收益意外取决于主观注意力权重 $\beta_A^S$ 和 $\beta_I^S$ ，以及去偏规则 $\alpha^S$ 和 $\zeta^S$ 。

模型与实证结果的比较

由于我们无法观察到投资者内部的预测 $\hat{v}_I$ 及他们的最终预测 $F[v_{i}]$ ，因此要区分注意力不足和不信任这两个渠道是非常具有挑战性的。

我们首先从理论上分析一下两种情况：

投资者对分析师的预测不够关注（即 $\beta_A^S$ 太小）：我们预期当这些预测更具信息性时，分析师的预测将更强有力地正向预测随后的股票回报。分析师预测的最优权重 $\beta_A^*$ 随着分析师预测的信噪比增加而增加。
如果投资者完全意识到分析师的预测，但在最初至少是过度折价的话，我们预期更“值得信赖”的预测在未来样本期内预测后续回报的能力会减弱。
1. 这是因为，在完美注意力的假设下，投资者可以从分析师预测的信息性中学到东西。因此，过去更准确的预测在未来应该会受到较少的折价，从而随着时间推移减少其预测能力。
2. 我们没有发现适应性学习故事的支持证据。具体而言，在按时间进行划分的稳健性实验中，在样本的后半段，分析师预测的预测能力依然存在。
3. 那些事前更具信息性的预测（分析师在过去更加准确、有更多的分析师在制作预测、股票的机构持有比例更高），在横截面上应该是更值得信赖的，它们更强烈地预测了随后的回报，并且更重要的是，这一模式也在样本的后半段持续存在（如下表所示）。

在这里插入图片描述

Discussion&Conclusion

为什么中国的投资者忽视分析师的信息？
- 这种现象在很大程度上可以归因于中国股市投资者基础的构成。截至2015年底，散户投资者持有所有自由流通股的88%（见Liu等，2019）。这些散户投资者可能难以接触到分析师报告，并且根据调查证据显示，他们的金融知识有限。
- 此外，统计数据表明，中国的散户投资者倾向于频繁交易，表明他们更关注投机而非价值投资，并且不愿意处理来自分析师报告的信息（Han和Shi，2022；Han和Li，2017）。
- 另外，机构投资者可能会遇到诸如卖空限制这样的市场摩擦，这限制了他们充分利用有价值信息的能力。
长期增长异常的可复制性
- 长期增长（LTG）与随后股票回报之间的负相关关系因其脆弱性、模型特异性或仅限于美国的小盘股而受到批评（Bordalo等，2019；Hou等，2020）。
- Da和Warachka（2011）表明，经过行业调整后的LTG与短期增长之间的差异是回报的一个更为稳健的负向预测因子。Bordalo等（2019）也提供了关于LTG异常稳健性的讨论。
- 我们的框架为复制LTG异常的困难提供了一个新的解释。特别是，投资者的信念需要与分析师的预测过度一致，才能在数据中出现LTG与股票回报之间的负关联。这种过度一致性可能不会自然地发生在某些市场环境中，比如投资者与分析师的想法不同或是分析师的信息难以获取的情况下，这限制了LTG异常的稳健性。

在本研究中，我们考察了分析师收益增长预测对中国资产定价的影响。我们的发现与之前在美国市场进行的研究有所不同。具体来说，我们发现分析师的增长预测在中国对股票回报具有正面的预测能力。我们的结果表明，在中国，投资者的预期并没有与分析师的预测保持一致。因此，分析师预测中的偏差似乎并没有扭曲价格。这并不是因为投资者有效地过滤了这些偏差，而是因为这些预测从一开始就基本上被忽视了。