商泰普惠金融论坛第六十五期|Large Narrative Asset Pricing Model
发布日期:2025-12-22 供稿人:夏连峰 浏览次数:125
孟老师系统阐述了叙事经济学在金融学中的核心地位,指出叙事不仅对宏观经济运行产生重要影响,更能直接作用于金融市场,如人工智能繁荣叙事推动相关股票价格上涨,且叙事的病毒式传播效应进一步放大了其对市场的影响。他提到,过去十年叙事研究已覆盖市场叙事、企业层面趋势、政策趋势等多元类型,但海量叙事信息存在非结构化、内容繁杂等问题,难以进行有效测度,而大语言模型的出现为解决这一痛点提供了全新思路,有望成为叙事经济学与金融学交叉研究的重要方向。
针对传统实证因子定价模型难以刻画非线性、时变性特征及忽略跨企业信息溢出效应的局限性,孟老师提出基于大语言模型的底层创新框架,核心包含基于理论的半监督式结构化提示词框架与优化提示词策略两大创新方法。在实践层面,其团队通过对176万篇企业盈利电话会 Conference call 文本进行结构化提取,借助创新提示词策略成功提取出高维信息,这些信息可充分覆盖所有叙事的核心维度,有效解决了非线性时变性与信息溢出效应带来的研究难题,后续结合transformer与注意力机制处理定价信息,最终构建出大语言模型叙事定价因子并完成机制分析。
孟老师还深入探讨了提示词工程与嵌入向量的应用要点,介绍了零样本提示、少样本提示两种核心设计方式,同时指出当前大语言模型思路存在不稳定性,需进一步挖掘应用潜力。他详细阐述了嵌入向量在文本定量提取中的核心价值,即通过将非结构化文本转化为定量向量表达,利用向量的唯一性与维度特征实现精准量化,并结合相关研究案例介绍了将海量文本数据转化为嵌入向量后进行二次建模的应用路径。
关于模型构建与机制分析,孟老师针对资产定价中的非线性时变性与跨资产传染问题,提出利用transformer或attention框架建模,通过变形原始主题融入跨企业特征信息,借助自编码器网络提取核心定价因子,经样本外指标验证,该模型在资产定价解释力与投资组合收益表现上均优于传统模型。此外,他还提出通过注意力权重捕捉信息共享与溢出效应,发现可通过加权指数计算溢出强度与主题波动率精准判断溢出效应。
最后,孟老师强调大语言模型在经济政策不确定性识别中具有显著优势,尤其在关键词命名与主题解释方面表现突出,但同时存在不确定性识别局限性,需结合中国市场实际情况明确应用边界。他还分享了提示词设计、论文构思与执行的相关策略,与座的老师与同学们均表示获得了重要的启发。







