# 论文阅读
-
Financial Statement Analysis with Large Language Models
本文通过精读展示了使用大语言模型(LLM)进行财务报表分析的研究。文章首先在摘要部分概述了研究核心,包括使用GPT模型与传统分析师进行对比,探讨其互补性及错误预测的来源。 研究细节部分详细描述了基线模型的建立和GPT模型的具体应用,并与人类分析师进行对比,分析其优缺点。特别关注了GPT模型在预测中的增量信息增益,分析了分析师偏差和分歧的情况,以及GPT与专用机器学习(ML)模型的比较,包括时间趋势、错误预测的来源和增量信息增益。 文章还探讨了LLM模型的预测能力来源、记忆能力的检验以及其在猜测公司名称和年份时的表现。样本外分析显示了LLM生成文本的实际信息价值,并通过资产定价测试和投资组合收益结果,验证了其在财务分析中的应用效果。
-
Microstructure in the Machine Age
《Microstructure in the Machine Age》讨论了微观市场结构在高频交易环境下的应用。文章首先介绍了研究的方法论,包括相关论文综述和重要变量的定义。详细讨论了输入变量和预测变量的设定,以及使用随机森林进行变量重要性评估的方法。文章提到了迄今为止用于微观结构研究最大的数据集,并探讨了微观结构研究的三代模型。 进一步,文章比较了随机森林模型与逻辑回归模型的效果,以及Volume and Dollar Bar与Time-Based Bar在数据处理和模型结果上的差异。最后,文章总结了研究的主要发现和对微观市场结构研究未来方向的展望。
-
中介效应分析-方法和模型发展
这篇文章探讨了中介效应分析的方法和模型发展。首先介绍了检验中介效应的流程,包括直接效应、间接效应和总效应的概念。文章进一步讨论了完全中介与部分中介的区别,并提供了应用于Stata的代码示例,以展示如何实施这些分析。
-
ROLL 1984
本文讨论了Bid-Ask Spread在市场交易中的重要性及其方法论。首先介绍了Bid-Ask Spread的概念和意义,阐述了其作为市场流动性指标的重要性。文中提出了两条基本假设,即价差不变条件下的分析和与观测区间长度的独立性。通过举例分析和实证研究,展示了即使在信息变化时,Cov仍然保持不变的现象。最后,总结了文章的主要发现和对Bid-Ask Spread进一步研究的建议,强调了其在市场研究中的持续重要性。
-
LONG LIVE KEJU! THE PERSISTENT EFFECTS OF CHINA’S CIVIL EXAMINATION SYSTEM
LONG LIVE KEJU! 采用了严谨的方法论来探讨中国科举制度的长远影响。研究总览了研究框架,详细阐述了所采用的模型,并呈现了基础结果。研究还关注了残差的空间自相关问题,并进行了稳健性和内生性检验。研究探讨了科举制度通过文化传承、教育基础设施、社会资本的积累及其对政治精英的影响等渠道,分析了科举制度对代际社会流动的影响,深入揭示了科举在塑造中国社会和教育格局中的持久影响。
-
Diamond-Dybvig 银行模型(DD模型)
对Diamond-Dybvig(DD)银行模型的分析表明,该模型探讨了银行在挤兑风险下的运作机制和市场效率。模型假设三种经济配置状态:自给自足、中央计划和市场均衡,强调银行通过有效配置存款和贷款降低风险。银行制度存在两种纳什均衡,其中信任是解决挤兑问题的关键。虽然去中心化大网具有优势,但在信用和流动性管理方面尚不能替代传统银行的功能和效率。
-
Advanced candlesticks for machine learning
人类作为生物,更倾向于按照日光周期来构建数据集;但是算法交易更倾向于依赖CPU周期,那CPU有周期吗?显然是没有的.... 这篇文章讲述了机器学习模型使用的数据其实是不合理的,不应该使用time-base的烛图,而应该使用tick bars与volume and dollar bars
-
A Text-Based Analysis of Corporate Innovation
通过LDA主题模型得到分析师报告中关于创新的衡量,计算出文本创新指标,不同于以往的代理变量(如:专利数量,R&D研发投入等),本文采用的是对外部分析师的研究报告进行文本分析得到的衡量指标;