总览方法论
本文研究了古代科举制度对当代人力资本的持续性影响。
本文最值得关注的是工具变量的选取,选取了各县到最近的竹子和松柏产地的最短河流距离作为科举强弱的工具变量。
本文还探讨了古代科举制度对当代人力资本影响的可能路径。
模型
$$ y_i = \beta keju_i + \gamma_1 X_i^c + \gamma_2 X_i^h + \alpha_p + \epsilon_i $$
其中,$i$表示县,$y_i$则表示各个县的对数平均教育年限,$keju_i$表示各个县在明清时期(1371-1905)获得进士的密度的对数(密度=获得进士的总人数除以各个县的总人数来做标准化,以10,000为单位), 即ln(1 + jinshi/population),$\alpha_p$表示省级固定效应;
控制变量$X_i^c$: 夜间照明时间(经济繁荣),县中心到海岸的距离(西方技术传播),地形崎岖度(关键历史事件);
控制变量$X_i^h$:人口密度、城市化率和潜在农业产量(历史经济繁荣的代理变量),将考取进士但出生地与考试地不同的人排除(为了控制区域迁移,因为会倾向于到好考的地方去考);
Baseline结果
- 列(1):只控制省固定效应,结果显著
- 列(2):进一步控制$X_i^c$,结果显著
- 列(3):进一步控制$X_i^h$,结果显著(主要结果) 每10,000个人中,明清时期进士的人数翻倍会使得当代平均教育年限增加6.9%。
- 列(4):排除了地区迁移的样本,结果仍然显著;
列(5)-(8)换了不同的被解释变量未受教育的比例、受过小学和初中教育的比例、受过高中教育的比例和受过大学教育的比例。对于前两个,结果为负且显著,但与预期不符。对于后两个,结果为正且显著,且大学的系数大于高中的系数。
残差的空间自相关(spatial autocorrelation in the residuals)
作者认为相邻县之间的误差项可能是相关的,于是科举的长期影响可能有偏误。
标准做法是: Conley (1999) standard errors adjusted for two-dimensional spatial autocorrelation(reported in brackets),in addition to clustering the standard errors at the province level (in parentheses);
额外的检验: Kelly (2019),Moran test for spatial autocorrelation 对列(1)和列(4)的残差进行检验,限制只有5个邻近的县,结果(z-score of the Moran test)分别为-0.659(列(1))和 -0.486(列(4)),在5%的显著性水平上拒绝原假设,认为不存在空间自相关。
人工空间噪声的检验:Kelly (2019),假设一个正态分布的空间插值噪声( assume a spatial interpolation that is normally distributed with the covariance matrix...)协方差矩阵的元素与县之间的距离有关。用县的人均GDP数据来估计这些噪声的参数。 随后用这些噪声分别代替解释变量和被解释变量。
Panel A:
- 列(1)表示了当一个噪声变量的解释能力优于原始持久性变量时的比例。
- 列(2)表示在5%的显著性水平上,噪声变量对当代教育年限有5.4%的解释力;
- 列(6)表示在5%的显著性水平上,科举密度对噪声变量有4.8%的解释力;
Panel B则是添加了控制变量的结果。
综上所述,在残差中,由空间自相关驱动的进士密度持续效应的可能性较低。也就是排除了空间自相关的影响。
稳健性检验
- 长江三角洲沿岸的县盛产进士,回归结果可能被这些县主导,排除长江三角洲沿岸的30个县,结果仍然稳健。
- 因为用的是整个明清时期的数据,可能不同时期的影响大小会不一样,于是将所有数据以50年的间隔分为一组,分别做回归,看系数的大小。(在17世纪前影响较小,但是在清朝前中期达到高峰,在后期因内忧外患而降低)
- 换解释变量,除了进士密度,还有类似的举人密度、生员密度。将举人密度作为解释变量结论也保持一致,但效果不如进士(当同时加入举人与进士时,进士显著而举人不显著); 作者认为,因为生员是每个县都有名额配给,故每个县的生员名额保持相对稳定,所以不能体现出该县的科举水平,故而不显著。列(4)将三个解释变量放到一起,‘horse race’ 最后只有进士显著,说明进士密度是衡量科举文化的最适合变量。
(从分布图来看,进士与举人的分布很类似,而生员的分布多是在西南落后地区的,为了地区平衡考虑....)
内生性检验
对于可能导致内生性的原因来说,显然不可能是互为因果,因为解释变量是很久之前的进士密度,而被解释变量是当代(2010)的平均受教育年限。所以可能导致内生性问题的原因是遗漏变量问题。本文使用工具变量法来解决该问题。
- 工具变量选取:各县到最近的竹子和松柏产地的最短河流距离
- 理由: 科举考试考四书五经太难了,需要很多参考书和解释来理解其中微妙的差异,需要学习如何写八股文,这些书的生产与印刷厂有密切关系;主要印刷中心靠近松树和竹子栖息地,印刷所需的成分运输通过主要通航河流支流。(下图显示了竹子和松柏与印刷中心的分布情况)
随后作者做了一些相关的回归来表示工具变量与各个变量的相关关系(印刷的书与进士密度、工具变量与印刷中心、工具变量与印刷的书和工具变量与进士密度) 说明工具变量不是弱工具变量。
作者认为竹子与松柏的栖息地是根据地理特征形成的,是严格外生的(只有少量证据表明,是因为商业印刷而种植的)。因此与经济繁荣与否无关,且与那些影响现代平均教育年限的遗漏变量不相关。为了验证这一说法,作者又做了一些回归(工具变量与商业中心、茶中心、丝绸中心、人口密度、城市化率、农产品的适合性、地形、干旱、到商业中心的距离、到省会的距离等等)
随后作者又将时间划分为50年一个间隔,考察工具变量对进士密度在不同时期的影响,在15世纪-19世纪中叶,工具变量对进士密度影响显著,而之后越来越不显著(主要原因是新的印刷技术在20世纪被我们采用)。
工具变量回归的结果如下,报告了简单形式与两阶段最小二乘形式,其中重点关注列(6),系数为0.085,比之前使用进士密度衡量稍微高出一些(之前是0.069)
科举影响当代人力资本的可能渠道
科举文化的传播(Transmission of Keju Culture)
作者使用6个采访问题作为被解释变量:
- 是否认为教育是“决定社会地位的最重要的决定因素”
- 是否“更希望其政府优先考虑教育支出”
- 他们的孩子(理想情况下)应该接受多少年的教育
- 他们是否经常为了陪伴孩子们而放弃看电视
- 他们每周用来辅导孩子们的家庭工作的总时间
- 父母是否能有效地与(他们的)孩子进行沟通
使用父系或母系的祖先的进士密度作为解释变量(衡量方法是根据姓氏与县进行匹配),同时控制遗传能力(使用记忆、逻辑测试得分作为控制变量)控制教育水平、家庭收入、年龄、性别、农村或城市等。结果如下
除此之外,作者还用儿童的样本做了对数学和识字能力测试成绩、缺勤率、每周用在学习上的时间的回归,结果均与预期一致。
教育基础设施健全(Educational Infrastructure)
作者使用古代关键的教育机构--孔子学院作为被解释变量,还选取了现代中小学、大学的数量作为解释变量。可以看到进士密度对学院has a marginally significant effect(OLS),而IV估计量不显著。对1900年的中小学数量显著而对2010不显著(主要是因为1986义务教育的普及)对大学无论是1947还是2010均显著。
社会资本(Social Capital)
作者认为考中进士的官员很可能通过提供公共产品和组织慈善活动,共同创造了大量的社会资本。氏族和血缘形成的家族纽带其首要目标是为其成员提供公共产品和社会保障网。于是作者使用编制家谱的数量来代表一个家族的强大(足智多谋的家族倾向于更频繁地修改他们的家谱,以加强归属感和荣誉感),慈善组织(救助饥荒、孤儿院)个数、非盈利组织作为被解释变量。结果与预期一致。
社会精英(Political Elites)
政治精英也可以通过影响家乡教育资源(例如学院的规模)的分配来影响县的考试结果。作者使用省长以上的官职的人数作为被解释变量(当代则是membership of the Central Committee—the party’s highest level of political organisation)。进士密度对清朝官职人数具有显著影响,即使在1911年帝国政权垮台后,这种影响仍然存在。而在后续时期,这种影响均不显著,这时候的政治精英与(survived the deadly Long March or fought in various patriotic guerilla warfare)有关,而在(1949–77),during the initial land reform and agricultural collectivisation or the Cultural Revolution that targeted the traditional elites.
科举与代际流动(Social Mobility)
随着时间的推移,积累的较高人力资本可能仅仅通过提高各种社会群体的平均教育水平,从而促进了代际流动。但是遗产会抑制代际流动(对于富有的人,科举将加强这些社会群体之间存在的不平等,从而导致社会流动性的下降),为了探究科举对代际流动的影响,作者使用2005人口普查数据对教育、收入的流动进行分析。无论是进士密度还是家庭背景,都对平均教育年限有显著正向影响。列(2)-(3)在科举影响较强的县,父母的教育背景对个人的教育结果的影响较小。(其实作者想表达的是教育有利于阶层跨越)