《世界经济》:AI如何解析来自分析师研报里那些“说不清”的直觉?

孟庆伟, 钟宁桦, 郝雨桐, 解咪. 非结构化数据增强出口预测：基于机器学习与大语言模型. 世界经济.

宏观经济预测长期受困于一个问题：我们究竟忽略了什么？传统预测依赖结构化指标，但许多关键信号隐藏于分析师的文字判断中。孟庆伟等近期在《世界经济》发表的研究，直接回应了这一困境。

该研究试图回答一个简洁但极具挑战的问题：用大语言模型处理分析师研报，能否提升出口预测精度？

研究团队收集了2007至2024年间4.7万条出口相关研报语段，借助DeepSeek大语言模型为每条语段的情感倾向打分，构建出量化的出口预期指数。

当这一指数被引入机器学习预测模型后，出口预测误差下降了约29%至40%，且在中长期预测中提升尤为明显。

更值得关注的是这篇论文在方法论层面的巧思。作者没有简单依赖大模型的输出做预测，而是设计了一套检验逻辑来捍卫结论的可信性。他们用残差正交化方法将出口预期指数拆解为两部分：宏观经济指标能够解释的部分，以及无法被解释的经验性残差。结果显示，正是这部分残差——分析师超越宏观数据的直觉、私有信息和经验判断——真正驱动了预测精度的提升。换句话说，大语言模型的价值不在于复述已有的宏观信息，而在于捕捉结构化数据装不下的那部分前瞻性信号。

另一个值得借鉴的做法是对大模型输出建立了严格的可信性验证流程。通过时间掩码排除前视偏误、跨版本重复评分确认稳定性、专家交叉复核检验评分可靠性，这些步骤虽然繁琐，却为LLM在经济研究中的应用树立了一个可参考的标尺。

这项研究也促使我们思考一个更深层的问题：在经济预测中，信息究竟是什么？是已经可以量化的数据，还是包括那些尚未被标准化、仍流落在文本中的判断？如果预测的边界很大程度上取决于我们所使用信息的边界，那么大语言模型提供的正是一种拓展信息边界的方式。它让那些原本仅在分析师话语间流转的前瞻性判断，得以被系统性地编码和利用。

文易平台新增RFS同款数据

限时开放获取！

🌐 官方网站：fintextai.com/database

文易平台现已推出RFS同款中国版企业文化测度数据，覆盖2001–2024年A股面板数据！诚信文化指标可直接获取，六类企业文化测度详见官网！

点击左下角「阅读原文」，直接跳转查看本篇导读原文并查看数据详情！该数据集可显著节省模型调试与文本处理时间，实用高效

如何用AI测度企业文化？RFS同款数据，免费分享给你！

声明：如需在论文中引用数据，请注明数据来自于AI文易平台。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

ZBlogIt

Nice to meet you, too!

《世界经济》:AI如何解析来自分析师研报里那些“说不清”的直觉?

wang 发表于2026-05-10 12:12:21 浏览8 评论0

少长咸集