Artificial intelligence, firm growth, and product innovation

作者: pdnbplus | 发布时间: 2024/12/23 | 阅读量: 250

Artificial intelligence, firm growth, and product innovation -- 论文阅读

Abstract

  1. 我们研究了人工智能技术的使用及其经济影响。本文提出了一种基于员工简历来衡量企业层面的人工智能投资的新方法。我们的衡量标准揭示了各行业在人工智能投资上的显著增长。
  2. 进行人工智能投资的企业在销售额、就业和市场估值方面经历了更高的增长率。这种增长主要通过增加的产品创新实现。(我们的结果在使用企业对大学人工智能毕业生供给的暴露程度作为工具变量时依然稳健。)
  3. 由人工智能驱动的增长集中在较大的企业中,并且与更高的行业集中度相关联。我们的研究结果强调,像人工智能这样的新技术可以通过产品创新促进增长并造就超级明星企业。

Introduction

过去十年见证了一种新的技术转变:人工智能(AI)技术的重大发展及其广泛的商业应用(Furman 和 Seamans, 2019)。作为一种预测技术,人工智能使企业能够从海量数据中更快、更好地学习,从而有可能显著改善商业决策。因此,人工智能可以作为通用目的技术,在广泛的行业中通过提高生产力和产品创新来创造增长(Aghion 等,2017;Agrawal 等,2019)。

Question

  • 然而,人工智能是否能转化经济并刺激经济增长仍然是一个开放的问题,因为过去十年总体生产力增长的乏力引发了对于人工智能的好处可能被夸大或需要更长时间才能实现的担忧(Mihet 和 Philippon, 2019;Brynjolfsson 等,2019)。
  • 迄今为止,缺乏关于企业层面采用人工智能的全面数据一直是理解人工智能技术采用模式及其经济影响的主要挑战(Seamans 和 Raj, 2018)。

Main Findings and contributions

  • Findings

    • 在本文中,我们基于企业的AI专业人力资本提出了一种衡量对人工智能技术投资的新方法。
    • 我们利用了独特的数据集组合,这些数据集既捕捉到了美国企业中AI技能员工的数量,也反映了对其的需求:Cognism Inc. 提供的简历数据涵盖了全球5.35亿个人的工作历史,以及来自Burning Glass的工作岗位数据,该数据记录了1.8亿个职位空缺。
    • 我们的主要结论是,更多投资于AI的企业通过增加的产品创新体验到更高的增长,这可以从增加的商标、产品专利和企业产品组合的更新中看出。
    • 我们的结果表明,到目前为止,人工智能的第一个直接影响是通过产品创新赋能增长,这与人工智能降低产品开发成本相一致。
  • Contributions

    • 我们的详细数据和衡量方法使我们能够研究人工智能技术对企业的影响,我们提供了新的证据表明人工智能投资与企业增长相关联,并探索了这种增长是如何累积的机制。
      • 而其他研究则侧重于人工智能对劳动力市场的影响(Acemoglu 等, 2022b)
      • 并且倾向于关注职业或总体水平(例如,Felten 等, 2019)。
    • 其次,我们能够测量跨多个行业的广泛样本中使用AI的企业,广泛的行业覆盖范围使我们能够考察人工智能投资对于如行业增长和集中度等总体趋势的影响。
      • 这补充了最近专注于发明AI技术企业的研究工作(Alderucci 等, 2020)
    • 第三,在没有美国企业-员工匹配的行政数据以及个体员工职业信息的情况下,我们的Cognism简历数据为美国的工作岗位提供了独特的覆盖,包括详细的职位描述,并代表了截至2018年超过64%的美国全职就业情况。这使我们能够比较从职位发布识别出的AI劳动力需求与从简历中识别出的AI工人存量。
    • 最后,我们关于企业人力资本的丰富数据使我们能够测量并控制混淆因素,例如非AI信息技术的使用,并捕捉外部AI解决方案和软件(如IPSoft Amelia)的使用情况。
  • 排除了哪些影响因素?

    • 首先,我们确认我们的AI衡量不会捕捉到一般的与数据相关的技能,而是仅限于那些具体与AI实施相关的技能。
    • 其次,我们手动检查了大量的被分类为AI的职位,确认我们的分类确实识别了高度AI技能的职位。
    • 第三,鉴于我们主要依靠所需技能来识别与AI相关的术语,我们通过确认具有最高AI关联性的职位发布明显偏向高度AI特定的职位名称来验证我们的衡量。
    • 第四,我们提供了几个企业在内部应用AI的具体案例的详细研究。
    • 第五,我们确认进行AI投资的企业也增加了研究与发展(R&D)支出,这与增加实验应用新AI技术相一致。
    • 最后,我们通过纳入外部AI解决方案和软件的使用来丰富我们的基础衡量,确认这个增强后的衡量产生了非常相似的结果。

How to conduct research

  1. 我们通过描述AI投资的关键模式开始了我们的分析。在员工简历和职位发布两个数据集中,AI职位的比例随时间显著增加,从2010年到2018年增长了七倍以上。AI职位的比例在科技行业中最高,但随着时间推移,各行业中AI投资的增长率是相似的。在企业层面,AI投资的增长在事前较大的企业和现金持有量较高的企业中更为显著。观察本地劳动力市场条件时,我们注意到高工资和教育程度更高的地区经历了更快的AI技能招聘增长。
  2. 接下来,我们探讨了一个根本性的问题:即人工智能投资是否与更高的企业增长相关联。如同在技术变革等缓慢进程的情境中(例如,Acemoglu 和 Restrepo, 2020),我们的主要规范是长期差异回归,它衡量了从2010年到2018年间企业成果的变化相对于企业层面AI技能人力资本变化的影响,通过AI工作者的比例来衡量。这种策略特别适用于我们的情境,因为人工智能投资是逐渐积累的,并且可能不会立即产生效果。我们在模型中加入了一组丰富的控制变量:行业固定效应以及截至2010年的企业、行业和通勤区级别的特征。我们记录了那些更多投资于AI的企业呈现出强烈且一致的增长模式:8年内基于简历的人工智能投资衡量标准增加一个标准差,对应着销售额增加了19.5%,就业人数增加了18.1%,市场估值增加了22.3%。这些结果普遍存在于主要行业部门(如制造业、金融业和零售业),支持了AI作为通用目的技术的观点。
  3. 虽然长期差异规范控制了时间不变的企业特性,但我们进行了几项测试以解决关于遗漏变量或因果倒置的担忧。首先,我们利用企业层面的面板数据,使用标准的分布式前导滞后模型(Aghion 等, 2020)动态地考察围绕AI投资的企业每年的增长情况。我们发现,在AI投资之前企业的增长没有预趋势,这证实了进行AI投资的企业并非处于不同的增长轨迹上,并且在两到三年后出现了增长,表明AI的效果不是即时的。其次,结果在控制过去的公司和行业增长以及未来增长机会(用Tobin's q代理)的情况下仍然稳健。第三,我们确认我们的结果确实反映了对AI的投资,而不是其他技术:当控制同期企业在机器人、非AI信息技术和非AI数据分析方面的投资时,AI投资的效果保持不变。
  4. 为进一步解决未观察到的冲击同时驱动企业和AI投资的担忧,我们采用了一种新颖的工具变量(IV)策略:我们利用企业在AI人才供给上的先验暴露程度作为企业层面AI投资的工具变量,这些AI人才来自历史上在AI研究方面较强的大学。核心思想是,训练有素的AI劳动力的稀缺性是企业采用AI的一个最重要限制(例如,CorrelationOne, 2019),而历史上在AI研究方面强劲的大学近年来能够培训出更多的AI技能毕业生,使那些历史上从这些大学招聘的企业更容易招募到AI人才。为了构建这个工具变量,我们编制了两个新的数据集:(i) 每所大学在AI研究方面的先验实力,以及(ii) 2010年前的企业-大学雇佣网络,以衡量企业对强AI大学的暴露程度。与商业界对AI的兴趣自2012年起才广泛流行相一致,我们展示了企业在2010年与强AI大学的联系并不是由雇佣AI技能工人需求驱动的,并且与2010年前的企业增长无关。该工具变量具有强大的第一阶段效果,我们显示,工具变量化的公司层面AI投资增加在2010年至2018年间稳健预测了企业增长。我们验证了这些结果不是由强AI大学的其他特性(如一般计算机科学的实力或整体大学排名)驱动的。
  5. 接下来,我们探讨了AI如何促进企业增长的机制。我们提供了一个理论框架,在其中AI可以通过两种非互斥渠道带来企业增长:(i) 产品创新和(ii) 流程创新及运营成本降低。
    • 根据第一个渠道,AI可以降低产品创新的成本,从而改善现有产品的质量并允许企业创造新产品(Klette 和 Kortum, 2004a; Hottman 等, 2016)。理论上,AI可以通过几种方式潜在地降低产品创新的成本。首先,由于产品开发涉及长时间的实验且收益不确定(Braguinsky 等, 2021),AI算法快速从大型数据集中学习的能力可以减少产品开发过程中实验的不确定性,并使学习有前景项目的流程更高效。例如,在Moderna,AI算法被用于在短短65天内开发出首个COVID-19疫苗,这一过程以前需要数年时间。第二,AI算法本身可以构成改进的产品(例如,AI驱动的交易平台)。第三,AI可以通过提升企业了解客户需求并定制产品提供的能力,来贡献于产品范围的扩大(Mihet 和 Philippon, 2019)。实证上,我们发现,更大规模的AI投资使得企业在产品创新方面有所增加,表现在更多专注于产品创新的专利(参见Ganglmair 等, 2021)和商标(Hsu 等, 2021)。
    • 人工智能促进增长的第二个渠道是通过增加流程创新,这将降低运营成本并提高现有产品的生产力——例如,通过替代某些任务中的人工劳动(Agrawal 等, 2019;Acemoglu 和 Restrepo, 2019),或者通过更高效的流程和对生产过程输入要素更好的预测来提升运营效率(Basu 等, 2001;Farboodi 和 Veldkamp, 2021)。实证上,我们并未找到支持这一第二渠道的证据。AI投资与每位员工销售额、全要素生产率或流程专利(即专注于流程创新的专利)的变化无关。一些先前的技术显示了与基于任务的自动化模型一致的劳动力效应(例如,Acemoglu 和 Restrepo, 2018)。对于AI而言,对企业使用AI的详细案例研究表明了AI应用的广泛性,而从实证上看,劳动力替代效应并不是我们分析中的主要驱动因素。相反,AI投资与企业增长之间的关系似乎是由产品创新驱动的,这使得企业可以通过创造更多的产品来扩大规模。AI投资可以帮助克服产能限制,使企业能够部署更多资本来生产额外的产品,但这伴随着相应的成本增加。
  6. 我们的最后一组结果涉及AI对行业动态可能产生的总体影响。首先,我们估计了初始规模不同的企业群体中企业AI投资与企业增长之间的关系,发现AI投资与企业增长之间的正向关系在事前较大的企业中更为强烈,这与AI可以通过偏向拥有更多数据的大企业来增加不平等的理论相一致(Mihet 和 Philippon, 2019;Farboodi 等, 2019)。然后,我们测试了由AI驱动的企业层面的增长是否转化为行业层面的增长。尽管行业内竞争对手之间可能存在负面溢出效应,可能会抵消甚至主导对进行AI投资企业的正面效应,并且Basu 等 (2006) 显示如果技术使用下降,技术的应用在总体水平上可能是收缩性的。然而,我们发现在Compustat企业样本中,那些更多投资于AI的行业经历了整体销售和就业的增长。最后,AI投资与行业集中度的增加相关联,这与我们发现AI偏向于事前较大且拥有更多数据的企业相一致。这表明AI投资可以通过强化赢家通吃的动态来影响行业动态。

综上所述,我们记录了AI与更高企业增长之间的强关联,这种增长主要来源于企业使用AI技术进行产品创新。这一机制反映了AI作为预测技术的本质。

  • 预测对于企业在运营的所有方面(Farboodi 和 Veldkamp, 2022)的决策至关重要,特别是在产品开发过程中(Cockburn 等, 2018),这需要对有前景的项目和客户偏好进行实验和学习(Braguinsky 等, 2021)。

Literature Review

近期的研究在考察AI技术对企业活动的影响方面取得了进展,涵盖了各种具体情境:

  • 机器人顾问(D’Acunto 等, 2019)
  • 金融科技创新(Chen 等, 2019)
  • 贷款审批(Jansen 等, 2020; Fuster 等, 2020)
  • 金融分析师(Grennan 和 Michaely, 2019; Abis 和 Veldkamp, 2023; Cao 等, 2021)
  • 创业活动(Gofman 和 Jin, 2022)

AI技术对经济影响的相关研究

  • Acemoglu 等 (2022b) 使用Burning Glass职位发布数据研究了企业职业结构对AI技术的暴露程度对劳动力需求的影响。
  • AI作为一种通用目的技术如何刺激经济增长(Goldfarb 等, 2023)。
  • AI促进增长的机制是通过增强产品创新实现的,这被认为是增长的关键驱动力(例如,Hottman 等, 2016; Argente 等, 2021)。我们的结果指向了AI的主要用途是产品创新,这是技术采用文献中较少探索的机制。作为预测技术(Agrawal 等, 2019),AI通过使企业能够从大数据中更好地、更快地学习来创造新的商业机会。
  • Cockburn 等 (2018) 认为AI技术可以通过加快知识积累的速度来刺激创新。
  • Rock (2019) 表明Google的TensorFlow推出加速了企业因接触AI而获得的市场估值增长,但对生产力没有影响。
  • Hirvonen 等 (2022) 的最新工作显示芬兰制造业机器人的采用主要通过增加产品创新来促进企业增长。

衡量无形资产的相关研究

  • 美国国家层面上衡量无形资产的努力正在进行中(Corrado 等, 2016),大多数企业层面的无形资产衡量仍然依赖如研发和销售、一般及行政费用(SG&A)等成本项目(例如,Eisfeldt 和 Papanikolaou, 2013; Peters 和 Taylor, 2017; Crouzet 和 Eberly, 2019; Eisfeldt 等, 2020)。
  • Hoberg 和 Phillips (2016) 分析10-K文件的文本以创建企业的产品组合衡量
  • Kogan 等 (2019) 使用专利文本构建特定职业的技术变革指标
  • Fedyk 和 Hodson (2023) 利用文本分析衡量企业的技术技能焦点
  • Argente 等 (2020) 将专利文本映射到产品
  • Babina 等 (2023a) 使用专利文本衡量技术创新
  • Bloom 等 (2021) 通过专利、职位发布和财报电话会议的文本分析识别技术

最后,我们为有关行业集中度和超级明星企业的最近文献(例如,Gutiérrez 和 Philippon, 2017; Covarrubias 等, 2019; Grullon 等, 2019; Autor 等, 2020)做出了贡献。

  • 先前的文献记录了较大规模的企业采用了更多的IT和互联网技术并从中受益更多(Forman, 2005; Brynjolfsson 等, 2008, 2023; Bessen, 2020)。
  • 无形资产推动最大企业增长并促进行业集中的假设(例如,Crouzet 和 Eberly, 2019)
  • AI似乎降低了对于大型企业尤为高昂的产品开发成本(Akcigit 和 Kerr, 2018),使这些企业更容易扩大规模。
  • 最后,我们的证据也与Gutiérrez 和 Philippon (2019) 记录的超级明星企业中缺乏生产力增长的现象一致。

Artificial intelligence: background and mechanisms

过去十年间,商业应用和对AI的投资呈指数级增长。尽管没有关于企业AI投资的系统性数据,最近的估计显示全球每年约有1400亿美元投入到AI中。AI投资也在各行业部门中扩展。虽然科技行业是AI的早期采用者,但高管调查表明所有行业的企业都广泛采用了AI技术(例如麦肯锡的一项调查)。

  • 自John McCarthy在1955年创造这个术语以来,AI领域的学术研究已经蓬勃发展了数十年。
  • 私营部门近年来对AI商业兴趣的爆发式增长是由供给侧因素驱动的:数据的快速积累、计算成本的下降以及方法论的进步,包括深度学习(Hodson, 2016)。
  • 就商业应用而言,三个主要领域——机器学习、自然语言处理和计算机视觉——占据了私营部门投资的大部分。
  • 这些核心技术的特点在于它们能够执行高技能的非例行任务,如预测、检测和分类(Agrawal 等, 2019)。
  • 它们与传统数据分析方法的主要区别在于这些技术能够从大量的高维数据(包括文本、语音和图像数据;Hauptmann 等, 2015)中学习,并显著提高预测的准确性。

AI具有几个关键的经济特性:

  1. 预测技术:AI是一种预测技术,而预测是不确定条件下决策的核心——这是所有运营方面的企业都会遇到的问题。因此,利用AI进行更好的预测的能力可以创造出新的商业机会。
  2. 通用目的技术(general purpose technology, GPT):经济学家认为AI是一种通用目的技术,可以在不同的业务细分市场和行业中被利用来解决广泛的问题。GPT的例子包括蒸汽机、电力和互联网。
  3. 围绕人力资本的投资:AI投资集中在人力专长上,辅之以计算技术和数据基础设施的投资。这不同于工业机器人等主要需要资本投资的技术(Benmelech 和 Zator, 2022)。因此,AI是一种无形资产,反映了向无形资本更广泛的转变(Mihet 和 Philippon, 2019)。
  4. 信息商品与非竞争性使用:AI技术是信息商品,具有非竞争性的用途:新算法通常公开发布,可以同时被许多企业使用。然而,AI能给企业带来的好处程度取决于谁拥有大数据——AI技术的关键输入(Fedyk, 2016; Jones 和 Tonetti, 2020)。

Artificial intelligence and firm growth: mechanisms

这两种机制具有不同的实证预测。产品创新预测会带来新产品、产品质量的改进和产品组合的扩展,而流程创新则不会影响企业的产品组合。就生产力而言,流程创新会带来较低的运营成本和更高的生产力,但产品创新对生产力的影响则是模糊的。关于之前通用目的技术的研究大多发现对生产力有正面影响(例如Fizsbein 等, 2020; Acemoglu 等, 2020),有些也显示了对产品创新的正面效应(例如Bartel 等, 2007)。

AI作为产品创新的驱动力

  1. AI可以通过降低产品创新的成本来促进企业增长。产品创新和产品种类的扩展是企业增长的重要机制(Klette 和 Kortum, 2004a; Hottman 等, 2016)。产品创新可以增加现有产品的吸引力和需求,或使企业能够扩大其产品线。
  2. Braguinsky 等 (2021) 指出,产品种类和产品吸引力是通过企业的实验内生决定的,而AI有可能通过实验加速知识积累并减少产品创新成本(Bustamante 等, 2020)。根据高管调查,增强现有产品和服务以及创建新产品是迄今为止AI的主要用途之一(例如德勤的一项调查)。

作为预测技术,AI可能通过几种方式影响产品创新:

  1. 快速分析大数据:AI算法能够快速分析大型数据集并从数据中学习底层关系的能力,可以减少实验的不确定性,使学习过程更加高效,从而导致更多的实验和新产品的创造(Cockburn 等, 2018)。实践中,近年来出现了多种AI加速产品创新过程的方式。例如,AI可以缩短药物开发周期。Moderna利用AI算法,在仅仅65天内就完成了第一剂COVID-19疫苗的开发和生产,这一过程以前需要数年时间。
  2. 提升现有产品和服务的质量:AI算法可以通过直接将AI模型构建到产品中来帮助改进现有产品和服务的质量。例如,在在线附录A2中,我们提供了AI应用的详细案例研究,包括如摩根大通的AI驱动交易平台DeepX(允许更快更便宜地执行交易)和Caterpillar“智能”机械(提高机器安全性和灵活性)的例子。
  3. 改善产品吸引力:AI还可以帮助企业更有效地了解顾客偏好,因此更好地定制产品和服务以满足顾客的口味和需求。当企业推出新产品或扩展其产品种类时,他们面临顾客想要什么以及顾客偏好可能如何变化的不确定性。使用AI分析顾客数据可以潜在地帮助企业克服这个障碍,提供“超级个性化基础上的正确产品”(Hodson, 2016),并克服企业在需求累积过程中遇到的摩擦(Foster 等, 2016; Argente 等, 2021)。例如,有关个人行为的数据,如网页浏览、位置历史和其他数字足迹,可以比纯人口统计信息更好地近似进入个体需求函数的参数,从而为不同口味的顾客量身定制更多样化的产品(Mihet 和 Philippon, 2019)。

AI作为流程创新和降低运营成本的驱动力

AI还可能通过降低流程创新的成本来促进企业增长。流程创新提高了企业在生产现有产品方面的生产力,许多先前的技术创新都旨在降低运营成本和提高生产力(例如Basu 等, 2001;Cardona 等, 2013;Acemoglu 等, 2020)。

理论上,AI技术可以通过至少两种方式刺激流程创新和生产力改进。

  1. 首先,AI有可能替代某些任务中的人工劳动(Agrawal 等, 2019),削减每单位的劳动力成本。具体来说,AI辅助决策过程和解决复杂认知问题的能力已经引发了对于AI可能扰乱高技能和高薪职业的担忧,这与之前的科技采纳浪潮形成对比(Webb, 2020)。
  2. 其次,AI可以通过更好的预测来提高运营和生产的效率(Mihet 和 Philippon, 2019)。Tanaka 等 (2020) 提出了一个在不确定性和成本调整的情况下企业的输入选择模型,其中预测错误会导致投资不足或过度投资。AI可以潜在地帮助企业减少预测错误,并优化企业的输入决策。

Data

在关于AI经济影响的文献中,一个核心挑战是缺乏企业层面的AI投资数据。我们通过利用丰富的企业员工个人资料和职位发布数据集克服了这一挑战,这些数据同时衡量了企业的AI工人存量和对AI工人的需求。接下来我们将详细描述每个数据集并说明样本构建过程。

来自Cognism的就业档案

我们使用员工简历来衡量每个企业的实际AI工人存量。

  • 我们利用了一个由Cognism提供的大约5.35亿个个体档案组成的新型数据集,Cognism是一家为潜在客户生成和客户关系管理服务聚合就业档案的公司。Cognism从多种来源获取简历,包括公开的在线档案、与招聘机构的合作、第三方简历聚合器、合作伙伴组织的人力资源数据库以及用户直接贡献的数据。这些数据在Fedyk 和 Hodson (2023) 中被引入并详细描述。
  • 尽管这些数据略微过度代表了高技能员工,但它们覆盖了截至2018年美国全部劳动力的大约64%,并在各行业中提供了代表性分解。
  • 对于个人列出的每条就业记录,我们可以看到开始和结束日期、职位名称、公司名称和工作描述。个人还可能列出他们的专利、奖项和出版物。Cognism的AI研究部门利用机器学习和自然语言处理技术,包括命名实体消歧和基于图的建模方法,进一步丰富简历数据,通过规范化职位名称和职业,将员工与每个企业内的职能分部和团队关联起来,并从教育记录中识别机构、学位和专业。

我们将Cognism数据中的雇主名称与Compustat数据中的公司名称进行匹配。

  • 个人简历与企业实体的匹配是动态进行的,以考虑收购和剥离的情况。在2007年至2018年间基于美国的6.57亿个人-企业-年就业记录中,有1.2亿(占18%)与美国上市公司(而非私营企业或非商业部门)相匹配。这与大约26%的美国整体就业由上市企业所占的比例一致(Davis 等, 2006)
  • 与美国上市公司相匹配的1.2亿个人-企业-年的样本由1900万不同的个体雇员组成。

来自Burning Glass的职位发布

我们使用的第二个数据集涵盖了2007年及2010年至2018年间美国超过1.8亿个职位发布。

  • 该数据集由Burning Glass Technologies(简称BG)提供,来源非常丰富。BG检查了超过4万个在线职位板和公司网站,汇总职位发布数据,并将它们解析成系统化、机器可读的形式,进而创建劳动力市场分析产品。该公司使用复杂的去重算法以避免在多个职位板上发布的空缺职位被重复计算。BG数据为每个职位发布提供了详细信息,包括职位名称、工作地点、职业类别和雇主名称。
  • 重要的是,职位发布被标记了从每个职位开放文本中标准化的数千种特定技能。BG数据集的主要优势在于其覆盖面广和个体职位发布的细节丰富。该数据集几乎捕捉到了所有在线发布的职位,涵盖了大约60-70%在美国发布的所有职位,无论是在线还是离线。
  • Hershbein 和 Kahn (2018) 提供了BG数据的详细描述,并展示了其在职业层面上的代表性随时间保持稳定。

Burning Glass的职位发布数据在两个方面补充了我们的主要Cognism简历数据集。

  • 首先,我们利用职位发布数据中的详细技能分类法来实证识别高度与AI相关的技能
  • 其次,Burning Glass职位发布数据对学术界广泛可用;通过将它们与Cognism简历数据进行验证,我们表明,在没有匹配的雇主-员工数据的情况下,职位发布可以作为企业技术投资的有效代理。

我们专注于那些雇主名称非缺失且至少要求一项技能的工作。

  • 大约65%的职位发布包含雇主信息,93%的职位发布要求至少一项技能。我们还排除了实习职位。
  • 然后我们将剩余职位发布的雇主企业与Compustat企业进行匹配。这一步骤是为了将职位发布聚合到企业层面并与其它企业层面变量合并所必需的。
  • 对于无法完全匹配的企业名称观察值,我们通过查看企业名称、行业和位置手动评估前十名潜在的模糊匹配。在1.12亿个雇主名称和技能非缺失的职位发布中,有4200万(占38%)与Compustat企业相匹配。这稍微过度代表了上市企业的员工,这类企业在非农商业部门中仅占美国就业的四分之一以上(Davis 等, 2006)。

其他数据来源

我们从人口普查局的美国社区调查(ACS)收集通勤区级别的工资和教育数据,从人口普查季度劳动力指标(QWI)收集行业级别的工资和就业数据,以及来自开放学术图谱的学术出版物(详见附录A)。企业层面的操作变量(例如销售额、就业人数、市值)来自Compustat。

Results

为了构建基于人力资本的企业层面AI投资衡量标准,我们首先利用职位发布数据中的详细技能信息来识别最相关的AI技能;然后聚焦于实证上与AI最相关的技能,并在简历数据中进行识别。最后,通过计算每个企业员工中具有AI技能的员工比例,我们将工人层面的数据聚合到企业层面。

AI investments from job postings (Burning Glass)

我们充分利用职位发布数据中对所需技能的详细信息,提出了一种新的数据驱动方法来识别AI相关技能。

  • 其他工作依赖于预先设定的关键术语列表,这可能会由于关键词列表的任意性而遭受第一类错误(将边缘相关的员工错误地标记为AI相关)和第二类错误(遗漏了未进入初始词典的真实AI技能)。
  • 我们的方法通过直接从职位发布数据中学习大约15,000个独特技能的AI相关性来规避这些挑战,依据是它们与无歧义的核心AI技能的经验共现(即在不同职位发布所需的技能列表中共现)。
  • 然后我们将技能层面的度量聚合到职位层面,生成一个连续的AI相关性度量,从而可以将职位分类为AI技能型和非AI技能型。

为了衡量每个技能的AI相关性,我们计算了该技能与人工智能(AI)及其三个主要子领域——机器学习(ML)、自然语言处理(NLP)和计算机视觉(CV)——的共现率: $$ w_{AI}^{s} = \frac{\text{# of jobs requiring skill s and (ML, NLP, CV or AI in required skills or in job title)}}{\text{ # of jobs requiring skill s}} $$

这个度量直观地捕捉了每个技能 s 与核心AI技能的相关程度。例如,“Tensorflow”这一技能的值为0.9,意味着要求“Tensorflow”的职位中有90%也要求核心AI技能之一或包含核心AI技能在职位标题中。因此,在职位发布中要求“Tensorflow”高度表明该职位与AI相关。相比之下,“Microsoft Office”这一技能的AI相关性度量仅为0.003。在线附录表A1列出了AI相关性度量最高的技能。

在这里插入图片描述

在这里插入图片描述

对于给定的职位发布 j,我们定义其职位发布级别的AI相关性度量 $w_{j}^{AI}$ 为所有由职位发布 j 要求的技能的平均技能级别度量 $w_{AI}^{s}$。我们通过对连续的AI度量进行二元转换,如果度量 $w_{j}^{AI}$ 超过0.1,则定义每个职位发布 j 为AI相关,这个阈值可以在涵盖整个范围的AI相关技术职位的同时最小化误报,这是基于对数据的手动检查得出的。企业层面的度量 $Share_{AI}^{f,t}$ 定义为企业 f 在年份 t 发布的职位中AI相关职位的比例(即 $w_{j}^{AI} >0.1$)。

我们使用离散分类是为了便于解释并与第4.2节中的简历基础度量保持一致,但在第5.1节中我们展示了结果对(i)应用替代截止值(例如0.05和0.15)以及(ii)使用聚合到企业层面的连续度量 $w_{j}^{AI}$ 的稳健性。基于职位发布的AI投资度量提供了对我们主要基于员工存量(从简历数据获得)度量的补充。

在线附录表A2提供了AI相关和非AI相关职位发布的例子。对于每个职位,连续的AI度量是所有要求技能的平均AI相关性。我们的度量使我们能够捕捉到广泛的AI相关职位,从数据科学家到语音识别科学家再到自动驾驶车辆工程师。虽然许多AI相关职位是数据科学家或类似的数据分析相关职位,但我们的度量区分了专门与AI相关的数据分析职位(编号6-10的职位发布)和不特定于AI且专注于更传统统计方法的数据分析职位(编号11-15的职位发布)。

在这里插入图片描述

AI investments from resumes (cognism)

对于我们的主要企业AI投资衡量标准,我们识别了Cognism简历数据中那些职位直接涉及AI的员工。我们从在线附录表A1中的67个关键词开始,这些是基于职位发布数据具有最高技能级别AI相关性度量的技能。我们在每个个体的每条简历中搜索这些术语,以查看:

  1. 该职位(角色和描述)是否直接包含任何已识别的AI术语;
  2. 该个体在那一年或接下来的两年内是否获得了含有这些AI术语的专利(考虑到工作与专利授予之间的时间滞后);
  3. 该个体在那一年或下一年是否有包括已识别AI术语的出版物或奖项。

如果满足以上任一条件,则将该个体在该企业、该年份分类为AI相关员工。例如,像“高级机器学习开发人员”这样的职位标题,或“使用Python与Tensorflow及深度学习模型开发聊天机器人”的职位描述,都被认定为AI职位。

在对每个时间点的每个人进行分类后,我们使用每年每个企业的AI相关员工数量和总员工数量来计算该企业在该年份中被分类为AI相关的员工比例。

Summary statistics and validation

我们的数据显示,无论是基于简历还是职位发布的AI投资度量,在2010年至2018年间都增加了七倍以上。

  • 图1的面板(a)显示,被我们分类为AI相关的员工比例从2007年的0.04%上升到了2018年的0.29%。
  • 图1的面板(b)展示了职位发布数据中的类似模式:AI技能型职位的比例从2010年的0.1%迅速上升至2018年的0.8%,特别是从2014年到2018年增速加快。
  • 附表中的Figure A1-4.表明在不同企业间,AI技能型劳动力的增长存在显著异质性,提供了分析AI投资与企业结果之间关系所需的变异。

在这里插入图片描述

在这里插入图片描述

图2的面板(a)绘制了每个两位数NAICS行业部门中公共企业的平均AI相关员工比例,分别针对2007-2014年和2015-2018年两个时期。面板(b)对AI相关职位发布的比例进行了同样的分析。

  • “信息”行业的AI技能型职位(或职位发布)比例最高,从2007-2014年初期的0.15%(0.57%)增长到2015-2018年后期的0.50%(1.68%)。
  • 几乎所有行业都看到了有意义的增长,支持了AI是一种通用技术的观点(Goldfarb et al., 2023)。我们的度量能够捕捉广泛经济部门的AI投资,突显了基于人力资本方法的关键优势。

在这里插入图片描述

AI投资与R&D支出增加呈正相关。例如,2010年至2018年间基于简历的AI员工比例变化与同期R&D支出对数值的变化之间的相关性为0.27,在控制行业固定效应后。这种模式支持了AI投资涉及大量应用新技术的实验的观点(Braguinsky et al., 2021)。

值得注意的是所识别AI职位的地理位置。我们将Compustat企业的AI招聘汇总到通勤区水平,并将2010年至2018年间通勤区内AI工人比例的变化与2010年美国社区调查(Census American Community Survey)的通勤区特征联系起来。这些差异表明,不同地理区域在吸引和培养AI人才方面的能力有所不同,反映了地方经济结构和技术环境对AI发展的支持程度。

在这里插入图片描述

在线附录图A7揭示了从2010年到2018年间AI工人比例变化与2010年通勤区内平均工资或大学学历员工比例之间的强烈正相关关系。这种模式是直观的,因为AI员工往往是高技能的技术导向型工作者,这一发现强调了AI作为高端技术和创新领域的特点,以及它倾向于集聚在教育水平较高、工资水平较高的地区。

在这里插入图片描述

最后,在表1中,我们观察到基于新简历数据和职位发布数据衡量的企业AI投资之间存在高度相关性。简历数据在衡量企业AI投资时提供了几项优于职位发布数据的优势:

  1. 实际雇佣情况:简历数据衡量的是实际雇佣的AI技能型劳动力。例如,如果一家企业无法填补AI相关的空缺职位,那么仅基于职位发布的度量可能会高估该企业在AI上的投资。
  2. 并购带来的影响:通过简历数据捕捉到了通过收购上船的人力资本,即被收购目标企业的员工在收购后被计入收购方企业的员工名单中。这对于理解企业如何通过战略收购来增强自身的AI能力非常重要。

在这里插入图片描述

鉴于上述原因,我们在基准设定中专注于基于简历的AI投资度量。然而,我们发现两种度量之间存在高度相关性,并且在整个论文的其余部分中结果一致,这减轻了关于使用职位发布数据衡量企业AI人才的一些担忧。

这种一致性表明,即使在没有匹配的雇主-员工数据的情况下,我们的方法论也提供了一个良好的代理,可以利用更易获取的职位发布数据来反映企业的实际AI雇佣情况。

Firm-level determinants of AI investments

我们考虑了企业层面的AI投资决定因素,并记录了规模较大和现金储备较高的企业倾向于更积极地投资于AI。

注:我们的重点在于理解广泛范围内企业对AI技术的使用,而非新AI工具的发明。因此,在本节及后续章节的主要实证分析中,我们将科技行业企业排除在外。

我们考察哪些企业的前期特征可以预测未来企业层面AI投资的增长。 $$ \Delta Share{AIWorkers}_{i,[2010,2018]}=\beta FirmVariable_{i,2010}+SectorFE+\epsilon_{i} $$

其中,$\Delta Share{AIWorkers}_{i,[2010,2018]}$表示从2010年到2018年间企业 i 的AI相关员工比例的变化(标准化为平均值为零,标准差为一)。所有回归包括两位数NAICS行业的固定效应(SectorFE)。$FirmVariable_{i,2010}$代表截至2010年的感兴趣的企业前期特征

在这里插入图片描述

表2中的结果显示,前期较大的企业在AI投资方面经历了更高的增长(但是不显著)。

  1. 2010年销售额对数的标准差增加一个单位对应着AI员工比例从2010年到2018年增加了17.5%的标准差,这一结果在1%水平上显著。
  2. 此外,初始Cash/Assets较高的企业也在单变量和多元回归中显示出更大的AI投资。
  3. 较年轻的企业也表现出更多的AI投资,但这种关系并不稳健,因为只在多元回归中观察到这一点。

在所有进一步的回归中,我们控制了能够预测企业AI采用的前期企业特征——规模、现金/资产比率和企业年龄。

AI investments and firm growth

我们接下来记录了投资于AI技术的企业在销售额、就业和市场价值方面增长更快的现象。我们考虑并排除了对此结果的其他解释,包括反向因果关系(例如,处于更快增长轨迹上的企业更多地投资于AI)和遗漏变量(例如,同时期对其他技术的投资或需求冲击驱动了企业和AI投资的增长)。

我们的主要设定是长期差分回归,即2010年至2018年间企业成果的变化对AI投资变化的回归,这里用AI员工比例来代理AI投资变化。这种策略特别适合我们的设定,因为AI投资是逐渐进行的(70%的企业在多年期间逐步引入AI员工),其效果可能不是立竿见影的。通过对自变量和因变量取一阶差分,长期差分设定确保时间不变的企业特征不会驱动结果。在表3中,我们报告了以下回归的估计值:

$$\begin{aligned} \Delta FirmVariable_{i,[2010,2018]}= & \beta\Delta ShareAIWorkers_{i,[2010,2018]} \ & +Controls_{i,2010}^{\prime}\gamma+SectorFE+\epsilon_{i}, \end{aligned}$$

其中,主要自变量$\Delta ShareAIWorkers_{i,[2010,2018]}$捕捉了基于简历数据的企业 i 从2010年到2018年的AI员工比例变化,并标准化为平均值为零和标准差为一。

  • 包含了控制变量,这些变量均在样本期初2010年测量:
    1. 在前面预测AI投资变化的初始(2010年测量)企业层面特征(销售额对数、现金/资产比率、企业年龄)和企业总Cognism就业人数的对数;
    2. 企业所在通勤区(CZ)的特征(从事IT相关职业的工人比例、大学学历工人比例、平均工资对数、外国出生工人比例、常规工作工人比例、金融和制造业工人比例、女性工人比例);
    3. 行业平均工资的对数。

我们进一步将样本限制为在整个期间内控制变量无缺失值的企业,以保持样本构成稳定。这导致了一个由1,052家企业组成的样本。

在这里插入图片描述

表3显示

  1. AI投资的变化与销售增长显著且经济上有意义的增加相关:八年内AI员工比例每增加一个标准差,对应着额外19.5%的销售增长。
  2. 我们发现AI投资与就业增长之间存在类似的正向关系,这表明AI尚未取代企业的劳动力,至少在净效应上是如此,尽管我们不排除不同工作职能或任务之间的劳动力重新分配。
  3. 投资于AI的企业也看到其股票市场估值的增加:AI员工比例每增加一个标准差,企业的市场价值会增加22-24%。

AI投资增长与企业增长之间的正向关系普遍存在于经济的不同部门,强化了AI是一种通用技术的观点。

附录表A7展示了分别针对最大的两位数NAICS行业部门回归销售额对数和就业人数对数变化与AI员工比例变化的结果:(i) 制造业,(ii) 批发和零售贸易,(iii) 金融,以及 (iv) 剩余的非科技行业。

在这里插入图片描述

总体而言,我们观察到AI投资与企业在运营上的经济显著增长有关,这些效应在关键经济部门中具有重要意义。

然而,AI投资带来的好处并未均匀分布在整个企业规模分布中。表4显示了按2010年就业人数(在企业所属两位数NAICS行业中)分为三分位的企业中,AI投资变化与企业增长之间的关系,控制了初始规模和行业-规模三分位固定效应。

在这里插入图片描述

企业AI投资与企业增长之间的关系随着企业初始规模单调递增。事前较大企业中AI投资变化与增长之间的更强正向关系与大数据和AI技术具有有利于大企业的规模效应一致,因为大企业在其经济活动中累积了大量数据(Farboodi et al., 2019; Farboodi 和 Veldkamp, 2022)。

Akcigit 和 Kerr (2018) 指出,大型企业由于新产品创新成本较高而面临扩展能力的限制。表4中的结果表明,AI可能提供了一种渠道,使大型企业能够通过利用其数据资产来克服创新和扩展障碍。例如,积累了大量专有分子化合物样本的生物技术公司能够利用AI工具获得相对于竞争对手的优势。另一方面,AI的好处并不局限于少数知名企业:在线附录表A9显示,剔除规模分布中前1%或5%的企业对全样本结果影响不大。

Robustness

替代的AI投资度量

我们主要使用基于简历的AI员工比例作为AI投资的主要度量,因为简历数据解决了关于职位发布数据测量的两个重要潜在问题:

  1. 职位发布数据仅捕捉企业对AI人才的需求而非其实际雇佣能力;
  2. 企业可能通过收购获得AI专业知识,这不会反映在职位发布中,但会体现在Cognism简历数据中,这些数据反映了实际员工,包括通过收购上船的员工。

当使用Burning Glass职位发布数据来衡量AI时,我们的结果仍然相似。这确认了与简历数据高度相关的职位发布数据也可以用来评估AI在企业层面的好处。结果对于使用连续AI相关性的不同截止点或企业层面平均连续AI相关性度量也是稳健的。

接下来,我们处理了关于AI投资偏斜性(skewness)的担忧。除了使用标准化的AI投资度量外,我们还考虑了指示企业AI投资是否处于分布前10%或25%的哑变量。在线附录表A13显示,从2010年到2018年,AI投资位于前25%的企业销售增长比其他企业多31%,而前10%的企业销售增长比其他企业多54%。

在这里插入图片描述

最后,虽然我们的度量侧重于内部AI投资,但我们丰富的简历数据也允许我们考虑企业对外部AI解决方案的使用是否会影响结果的解释。即使是外部AI软件也需要内部AI技能型员工的数据管理和实施指导才能有效(Fedyk, 2016),行业报告强调AI技能型劳动力是成功部署AI项目最关键的因素。尽管如此,我们处理了个别工作描述和职位标题中的任何提到外部AI软件(如IBM Watson、IPSoft Amelia、Symphony、AyasdiAI、Salesforce Einstein以及大约一百种其他关键AI驱动解决方案)的信息,以构建一个企业依赖外部AI解决方案的代理指标。在线附录表A14确认,将此代理直接纳入整体AI投资度量中,我们的结果依然稳健。

在这里插入图片描述

混淆因素

首先,我们处理了AI投资与其他技术(如IT)投资之间的关联可能性。我们利用详细数据开发了非AI技术投资的度量,这些度量平行于AI投资度量:对于每个企业,我们测量每年需要IT、机器人或非特定于AI的数据相关技能的工作发布百分比。在线附录表A15中,我们控制了:

  1. 非AI IT投资的增长
  2. 机器人投资的增长
  3. 非AI数据技能投资的增长(如“数据清理”)
  4. 非AI相关数据分析的投资(如“SAS”)

加入这些控制后,AI投资增长与企业增长之间的估计关系保持相似,确认了对企业增长的影响是由AI而不是其他技术驱动的。

其次,投资于AI的企业可能会经历正面的需求冲击或更高的增长轨迹,从而导致估计的正向偏差。在在线附录表A16中,我们控制了详细的行业固定效应以吸收行业特定冲击。AI投资变化的系数保持稳定,标准误差随着更精细的行业控制吸收更多变异而增加。

在这里插入图片描述

此外,在线附录表A17和A18确认,结果在控制(i) 样本期前十年(2000-2008)的行业和企业层面增长,(ii) 截止2010年的Tobin’s Q(作为企业未来增长机会的代理),以及 (iii) 州固定效应(控制州层面的增长机会和其他潜在遗漏变量)的情况下是稳健的。

最后,在线附录表A19估计了一个预测回归,即样本后期(2015-2020)的企业增长对样本前期(2010-2015)AI投资增长的回归。估计值在定性和定量上与表3相似,只是由于较短的估计期(2015年至2020年而非2010年至2018年),幅度较为温和,这反驳了反向因果关系驱动我们结果的可能性。

在这里插入图片描述

Dynamic relationship between firm AI investments and firm growth

我们通过估计AI投资后企业增长的动态来增强我们的长期差分设定。这一分析不仅提供了反驳反向因果关系担忧和AI投资企业在AI投资前处于不同增长轨迹的证据,还阐明了AI投资与其实际效果之间的滞后。

我们使用企业层面的面板数据,在分布式领先滞后模型中动态估计围绕AI投资的企业增长,该模型允许处理变量(即AI投资)的连续变化(Stock and Watson, 2015; Aghion et al., 2020)。这种设定特别适合我们的场景,因为企业倾向于持续投资于AI,而不是集中在某一年进行块状投资,这排除了我们在标准事件研究框架下(例如,在块状投资前后)检查动态效应的可能性。标准的分布式领先滞后模型被设定为: $$ Y_{it}=\sum_{k=-2}^{5}\delta_{k}\Delta_k ShareAIWorkers_{i,t-k}+\mu_{i}+\lambda_{nt}+\theta_{st}+\epsilon_{it} $$ 其中,$\Delta ShareAIWorkers_{i,t-k}$是从年$t-k-1$到$t-k$ 的AI员工比例年度变化,标准化为平均值为零和标准差为一;我们包括企业固定效应$\mu_{i}$以吸收特定于企业的不变因素,以及两位数NAICS行业-年固定效应$\lambda_{nt}$和州-年固定效应$\theta_{st}$,以控制行业特有和州特有的趋势。每个领先滞后系数$\Delta_k$捕捉了年 t 的结果变量对企业在年 t−k 的AI投资的累积响应,同时固定所有其他年份的AI投资路径。因此,上式包含了企业规模对企业AI投资的即时和延迟反应。对于领先的系数估计可以作为预趋势测试:如果投资于AI的企业在AI投资前的增长趋势与其他企业相似,则对于 k<0 的 $\Delta_k$ 应统计上无法与零区分。

在这里插入图片描述

图3报告了领先滞后回归的系数。顶部面板显示,销售在AI投资后增加,但并非立即——企业需要两到三年时间才能从AI投资中获益。年度AI投资增加一个标准差对年度销售额对数的累积效应为1.5%-2%,并且五年内保持稳定。底部面板显示,AI投资与企业就业的类似增长相关。

重要的是,两个结果变量均未显示出预趋势的证据:在我们包含的控制条件下,任何给定年份更多投资于AI的企业在前几年显示出可比较的销售和就业路径,并且只在此之后开始偏离。这进一步证明了我们的结果并未捕捉到企业增长对AI投资的反向影响或遗漏变量使AI投资企业处于不同增长轨迹的影响,有助于强化我们主要结果的因果解释。

Instrumental variable estimates

内生性问题的来源

  1. 遗漏变量偏差(Omitted Variable Bias)
  2. 测量误差(Measurement Error)
  3. 双向因果关系(Simultaneity or Reverse Causality)
  4. 样本选择偏差(Sample Selection Bias)
  5. 动态效应(Dynamic Effects)

工具变量(Instrumental Variable, IV)是一种统计方法,用于解决回归分析中的内生性问题。在经济学和其他社会科学领域中,我们经常遇到变量之间的相互影响,即一个变量可能同时受到其他变量的影响,同时也影响着其他变量。这种情况下,如果我们直接使用普通最小二乘法(OLS)进行回归分析,可能会得到有偏的估计结果。工具变量应满足以下条件:

  1. 相关性(Relevance):工具变量必须与解释变量存在相关性。
  2. 外生性(Exogeneity):工具变量与模型的误差项不相关,即它不应该受到模型中其他变量的影响。
  3. 排他性(Exogeneity):工具变量不应该直接影响因变量,除了通过解释变量之外。

我们使用企业对来自美国大学AI人才供应的暴露情况作为工具变量来衡量企业层面AI投资的变化。

  • 这有助于隔离源自AI劳动力供应的企业AI投资变化,减轻可能由需求冲击驱动企业AI投资和增长所带来的潜在偏差。
  • AI人才的稀缺性是企业采用AI技术的关键制约因素,IV(工具变量)估计直接反映了针对增加AI劳动力供应政策的处理效应,并且能够放松AI采用的约束(例如,资助大学AI研究和培训AI技能型人力资本,Babina et al., 2023c)。
  • 同时,学术界在AI领域的研究远早于商业界对AI的兴趣。因此,在2010年代商业界对AI兴趣激增期间,企业与AI强校预先存在的联系提供了一个可以认为是外生的企业获得AI人才供应变化的来源。

具体来说,我们使用企业预先暴露于历史上擅长AI研究的大学所供应的AI人才的变化作为工具变量来衡量企业层面AI投资的变化。

  • 历史上擅长AI研究的大学近年来能够培养更多的AI技能型毕业生,使通常从这些大学毕业招聘的企业更容易吸引到AI人才。这一直觉来源于美国学术科学对工业研究和技术采用溢出效应的证据(Furman 和 MacGarvie, 2007)。
  • 由于商业界对AI的兴趣直到大约2012年才广泛普及,我们认为(并提供了实证支持),企业在2010年与AI强校的联系并不是出于雇佣AI技能型工人的需要,特别是对于本文重点关注的非科技企业样本。

我们编制了两个数据集:

  1. 各大学在AI研究方面的预先实力
    • 大学AI研究实力:收集了关于各大学在AI研究方面历史实力的数据。这些信息可能来自于已发表的研究论文数量、引用次数、参与的重要科研项目等。
  2. 企业和大学之间的招聘网络
    • 企业-大学招聘网络: 这类数据可能包括企业员工的教育背景信息,通过分析简历中的教育经历来确定哪些大学为企业输送了大量人才。

通过将上述两个数据集结合起来,我们可以构造一个工具变量,它捕捉了企业在2010年时对AI强校毕业生的招聘倾向。这种倾向在很大程度上是外生于随后商业界对AI兴趣的增长,从而可以作为企业AI投资的一个有效工具变量。这使得我们可以更好地分离出因AI劳动力供给变化导致的企业AI投资变化,进而评估这些变化对企业增长的影响。

图A.2 显示了来自事前人工智能强校(ex-ante AI-strong universities)和其他大学的人工智能培训的新毕业生比例的时间序列。该图分别绘制了从2006年到2018年间,来自人工智能强校和非人工智能强校的新毕业生中接受过人工智能培训的比例的平均值。我们定义如果一所大学在2005年至2009年之间的某一年满足以下两个标准之一,则该大学为人工智能强校:

  1. 该大学的人工智能研究人员数量处于当年所有大学分布的前5%;
  2. 该大学的人工智能研究人员数量处于当年所有大学分布的前10%,并且人工智能研究人员的比例处于当年所有大学分布的前5%。

在这里插入图片描述

我们的数据显示了这两个特征:每个企业往往集中在少数几所大学进行招聘,并且事前网络(即2010年前各企业从哪些大学招聘)强烈预测了2010年后企业从哪些大学招聘。(没图)

我们定义每个企业的工具变量$IV_i$为: $$ IV_{i}=\sum_{u}s_{iu}^{2010}AIstrong_{u} $$ 其中,$s_{iu}^{2010}$是2010年企业i中STEM工人中毕业于大学u的比例,$AIstrong_{u}$是大学u是否为人工智能强校。(我们使用2010年前的出版物来衡量AI强校,因为AI研究早在2010年前就在大学中蓬勃发展,而商业界对AI的应用是在2010年后才开始的。因此,2010年后的出版物可能受到大学所连接的企业对AI需求的影响,而2010年前的出版物则可以被认为是大学AI人才的一个外生度量。)

对于我们的工具变量,一个主要的顾虑是AI强校可能在其他方面也有所不同。首先,如果擅长AI研究的大学也在更广泛的计算机科学(CS)领域表现出色,培养出更多的CS技能型毕业生,这可能通过非AI投资渠道影响企业结果。其次,如果AI强校总体排名也很高,那么高质量企业——无论是否涉及AI都可能增长——可能会仅仅因为从高排名大学招聘而选择AI强校。为了解决这些顾虑,我们控制了企业在计算机科学强校和顶尖大学的事前暴露情况。具体来说,我们构建了类似的事前暴露于计算机科学强校和前十大学的度量:$\sum_{u}s_{iu,2010}CS_{strong,u}$,$\sum_{u}s_{iu,2010}Top10_{u}$

附录表A.3展示了第一阶段的结果。我们在所有列中控制了行业固定效应以及对计算机科学强校和前十大学的暴露情况。工具变量在第一阶段非常强,F统计量在所有设定中均超过10,并且当所有控制变量被包括时接近20。

在这里插入图片描述

在线附录图A8绘制了工具变量与企业增长之间的简化形式关系。对于所有三个结果变量(销售、就业和市场价值),我们观察到企业事前对AI强校的暴露与其后续增长之间存在强烈的正向关系。

在这里插入图片描述

相反,附录表A.4显示,在2010年前,更多暴露于AI强校的企业并没有更快的增长。这与排除限制一致,即工具变量只通过企业在2010年后的AI投资影响企业增长。

在这里插入图片描述

表5呈现了2SLS估计结果。结果显示AI投资对销售(第1-4列)、就业(第5-8列)和市场价值(第9-12列)具有稳健且显著的影响。当所有控制变量被包含时,AI投资增加一个标准差会导致销售增长32%,就业增长33%,股票市场估值增长36%。然而,需要注意的是,OLS和IV系数在统计上并无差异。这表明点估计值之间的差异也可能由估计误差驱动。我们在在线附录表A20至A23中进行了一系列工具变量结果的稳健性检查,详细讨论见附录A。(不再赘述)

在这里插入图片描述

Mechanisms

AI as a driver of product innovation

AI可以通过以下方式促进企业增长:

  1. 促进新产品的创造和现有产品的改进;
  2. 通过改善产品对消费者口味的定制化来扩大产品范围。

为了实证研究这一点,我们需要企业层面的产品和服务数据,这类数据获取起来具有挑战性,尤其是在不同行业之间。我们通过使用三个代理指标克服了这一挑战,以考察产品创新,并使用长期差分设定进行分析。

  1. 首先,我们考察是否投资于AI的企业经历了商标数量的增长。商标新产品和服务创造的良好代理指标(Hsu et al., 2021)。
  2. 其次,产品专利反映了新产品创建以及现有产品线质量的创新。
  3. 最后,我们基于Hoberg等人(2014)的自我流动性度量构建了一个衡量企业产品组合变化的指标。(Hoberg等人(2014)利用企业10K报告,计算相邻两年描述企业产品提供的词向量之间的余弦相似度,以此衡量企业在给定年份内产品提供变化的程度。这些变化既反映了新产品的创建,也反映了根据不断演变的消费者偏好调整现有产品。)

在这里插入图片描述

表7显示,工具变量估计的AI投资也与商标数量、产品专利数量以及产品供应变化呈正相关(尽管并不总是显著)。总体而言,结果指向企业利用AI扩展产品种类和定制化,这与企业高管的调查结果一致,他们强调产品改进和创建是迄今为止AI的主要用途。

在这里插入图片描述

AI as a driver of lower operating costs

接下来,我们测试企业增长的增加是否可能反映了AI技术降低了企业的运营成本、提高了企业层面的生产力并改善了流程创新。

成本分析

  • 首先,在表8的第1至第4列中,我们直接考察成本,考虑企业AI投资的增长如何与销售成本(COGS)和运营费用的变化相关。结果显示,AI投资与成本的增加有关,这种增加在规模上与企业销售额的增加相似,这表明AI与较低的平均运营成本无关。

生产力分析

  • 其次,表8的第5至第8列考察了两个生产力指标:每工人的销售额(即劳动生产力)和收入TFP(全要素生产率)。AI投资与这两个生产力指标之间的关系始终不显著。
  • 劳动力生产力缺乏增长的结果与第5节一致,即AI投资预测销售和就业有相似的增长,这挑战了AI的主要作用是替代工作岗位的观点。
  • 在第9和第10列中,我们引入了另一个效率提升的代理指标——流程专利,这些专利反映流程创新和潜在的效率改进。我们发现AI投资与流程创新之间没有关系,这与表6中记录的产品专利大幅增加形成对比。

在这里插入图片描述

总体而言,我们发现AI技术通过产品创新而非通过减少运营费用或提高生产力来使企业受益。这一结果与之前的通用技术(如电力)导致快速生产力增长的情况不同(Fizsbein et al., 2020)。这种结果对比与Acemoglu等人(2022a)的研究一致,他们使用美国人口普查数据,未发现人工智能与劳动生产力之间的关联,但发现了机器人技术和专用软件等其他技术的正向生产力效应。

生产力J曲线解释

对于缺乏生产力增长的一种可能解释是Brynjolfsson等人(2021)提出的生产力J曲线。特别是,投资于通用目的技术的生产力增长可能最初被低估,因为资本和劳动力被用于积累无法测量的无形资本,这些无形资本补充了新技术。在在线附录表A27中,我们考察了2010-2014年期间AI投资变化对截至2018年的生产力增长的影响,未发现任何显著的正面效应。因此,即使经过几年的滞后,AI投资仍未与生产力改进相关联。尽管生产力J曲线反映了短期可测量产出的损失,但我们发现,在AI投资后的两到三年内,销售额增长有显著的正面效应。我们的证据表明,至少目前为止,AI主要通过产品创新刺激企业增长。

在这里插入图片描述

正如我们在在线附录A1中讨论的那样,产品创新对生产力的影响理论上是模糊的,因为企业在新产品线中的生产力可能会更高或更低。我们的实证结果表明,投资于AI的企业能够在更大的规模上维持相同的生产力水平。这些发现与最近记录的技术投资与企业规模扩大但无生产力增益相关的文献一致(Aghion et al., 2019; Curtis et al., 2021; Hirvonen et al., 2022)。

AI investments and industry-level outcomes

为了揭示AI潜在的总体效应,我们考察了行业层面AI投资的变化与以下两个方面的关系:

  1. 行业增长
  2. 行业集中度

虽然投资于AI的企业增长更快,但如果使用AI技术对企业竞争对手产生了业务抢夺效应(Bloom et al., 2013),那么行业的整体收益可能是零和游戏。例如,在机器人领域,负面溢出效应已被证明会主导积极的企业层面效应,导致总体就业的负面影响(Acemoglu et al., 2020; Benmelech and Zator, 2022)。

我们在行业层面上估计了以下长期差分回归:

$$ \begin{aligned} \Delta\ln y_{j,[2010,2018]}= & \gamma\Delta ShareAIWorkers_{j,[2010,2018]} \ & +Controls_{j,2010}^{\prime}\gamma+SectorFE+\epsilon_{j}, \end{aligned} $$ 其中,$\Delta\ln y_{j,[2010,2018]}$是5位数NAICS行业中所有Compustat企业(包括2010年后进入样本或2018年前退出的企业)总销售额或就业的变化,而$\Delta ShareAIWorkers_{j,[2010,2018]}$是2010年至2018年间行业j中AI员工比例的变化。类似于企业层面的测试,回归按照每个行业中2010年的简历总数进行加权。

在这里插入图片描述

  • 表9的第1至第4列显示,AI投资与行业层面就业和销售额的稳健增长相关。在包含完整控制变量的情况下,行业层面AI员工比例在简历数据中的一个标准差增加与销售增长17%和就业增长20%相关联。
  • 表9的第5至第8列显示,行业层面AI投资的增长与行业集中度变化之间存在稳健的正向关系。较大企业更高的AI驱动增长足以转化为行业集中度的增加。

另一方面,HHI的增加更大,并且对于投资于AI的行业,前四大企业的市场份额有显著增加。由于上市企业平均规模大于非上市企业,这进一步支持了从AI技术中获益的主要集中在拥有必要数据和资源的大型、已建立企业这一解释。

然而,我们的结果表明,作为一种可以应用于许多行业的通用技术,AI通过促进产品创新和扩大最大企业的规模,与广泛行业的集中度增加有关。这些发现支持了Crouzet和Eberly (2019)的观点,即无形资产的投资是美国数据中观察到的行业集中度上升的原因。

Conclusion

在本文中,我们研究了企业在过去十年最重要的新技术之一——人工智能(AI)上的投资及其从中获得的益处。我们引入了一种新的衡量企业层面AI技术投资的方法,该方法基于两个详细的人力资本数据集:

  • Cognism提供的简历数据,揭示了每个企业的实际员工构成;
  • Burning Glass Technologies提供的职位发布数据,显示了企业对特定技能的需求。我们的独特度量方法使我们能够广泛考察各行业中企业进行AI投资的决定因素及其后果。

我们发现了一个AI投资与企业规模之间的正反馈循环:AI投资集中在最大的企业中,而随着企业在AI上的投资,它们会变得更大,在销售、就业和市场份额方面获得增长。这种由AI驱动的增长似乎并不是源于成本削减;相反,投资于AI的企业通过产品创新和增加产品供应来扩展业务。

我们的研究结果强调了AI技术采用与20世纪80年代和90年代信息技术(IT)采用之间的重要差异。

  • 以往的大量文献发现,IT投资与经济上显著的生产力增长有关,但对企业增长指标(如市场份额)的影响结果不一。相比之下,我们观察到投资于AI的企业增长加快,并伴随更多的产品创新,但尚未发现企业层面生产力提高的证据。
  • 此外,我们的结果显示,更大的企业AI采用率更高,从AI投资中获得的收益也更大,这与关于IT扩散模式的先前工作形成对比(Hobijn and Jovanovic, 2001)。这些差异突显了AI相对于之前的IT浪潮的独特特征:作为一种预测技术,我们的结果表明,AI通过帮助企业更快更好地从大数据中学习,促进了产品创新并创造了新的商业机会。
  • AI技术和应用在2010年代及以后迅速扩展。我们的结果反映了早期AI采用浪潮,如果存在效率增益,则可能是更滞后的。我们预计AI的演变效应将成为未来研究的一个令人兴奋的领域。

我们的研究结果意味着,谁拥有作为AI技术关键投入的大数据,很大程度上决定了AI带来的好处(Fedyk, 2016)。虽然数据是非竞争性的(多个企业可以同时使用数据),但最近的理论研究表明,由于担心创造性破坏,企业可能会囤积自己拥有的数据,导致非竞争性数据使用的低效;并且将数据产权赋予消费者可以产生接近最优的分配(Jones 和 Tonetti, 2020)。

最新的实证证据表明,在金融服务中将数据所有权从企业转移到消费者可以激励企业进入市场,并可能打破大型企业的数据优势(Babina et al., 2023b)。尽管我们的实证工作没有直接讨论数据所有权的最优性,但我们的结果表明,在当前企业拥有消费者数据的状态下,AI促进行业集中度的提高和“超级明星”企业的崛起,这是近期研究中记录的现象(Gutiérrez 和 Philippon, 2017; Autor et al., 2020)。

进一步理解AI如何影响生产过程、公司战略和企业的组织结构,并评估AI技术在企业和工人之间的分配影响,是未来研究的富有成果的方向。