当前位置: 网站首页 科学研究 正文

科学研究

前沿方法 | 从“记不住”到“算得准”:LSTM如何改写经管领域预测逻辑?
 

“这个月的消费指数为什么和上月趋势突然背离?”“股价连涨三天后,下一个交易日会回调吗?”在充满不确定性的经济市场中,“预测”始终是经管研究者和从业者的核心诉求。而当传统模型卡在“长序列数据记不住”的瓶颈时,LSTM(长短期记忆网络)的出现,就像给预测模型装上了“智能记忆中枢”。今天,我们就来拆解这个经管领域的“预测神器”。

一、先搞懂基础:LSTM到底解决了什么问题?

LSTM之前,传统循环神经网络(RNN)是处理序列数据的主力,但它有个致命缺陷——梯度消失/爆炸。简单说,当数据序列变长(比如用过去12个月的经济数据预测下月GDP),RNN会像“鱼的记忆”一样,前面的关键信息越传越弱,到最后几乎完全丢失。

LSTM的核心突破,就是通过独特的“门控机制”,让模型学会“记住该记的,忘记该忘的”。比如分析电商销售数据时,它能牢牢记住“双11”这种年度大促的周期性规律,同时过滤掉日常小幅度的销量波动,让预测更精准。

划重点:LSTM不是全新的神经网络,而是RNN的“升级版”,专门优化长序列数据的信息传递问题,这也是它在经管领域(充满时间序列数据)大放异彩的核心原因。

二、硬核解析:LSTM的“记忆魔法”藏在门控里

LSTM的结构看似复杂,其实核心就是三个“门”——遗忘门、输入门、输出门,再加上一个“细胞状态”(相当于长期记忆存储库)。我们用“公司财务记账”来类比,就能轻松理解:

(一)三大门控:控制信息的“存、取、弃”

1)遗忘门(Forget Gate):决定哪些历史信息需要丢弃。比如预测月度CPI时,去年同期的临时疫情管控数据就该被“遗忘”。公式上通过sigmoid函数输出0-1之间的数值,0代表完全丢弃,1代表完全保留。

2)输入门(Input Gate):负责筛选新信息并存入“细胞状态”。比如分析股价时,最新的行业政策、公司财报数据就是需要优先“输入”的关键信息,通过sigmoid筛选重要性,再通过tanh函数生成待存储的信息。

3)输出门(Output Gate):决定从“细胞状态”中提取哪些信息作为当前输出。比如用历史销售数据预测下周销量时,输出门会优先提取与“周末消费”“促销活动”相关的信息,再通过tanh和sigmoid的组合生成最终输出。

(二)核心公式:门控机制的数学表达

undefined

 

(三) 经典文献

undefined

 

来源:https://keras.io/api/layers/recurrent_layers/lstm/

三、落地经管领域

(一)金融市场

股价预测与选股:基于沪深300成分股的历史数据,研究者采用两阶段框架:第一阶段用LSTM对个股收益进行预测并筛选标的,第二阶段以均值-CVaR在考虑交易成本与权重上界约束的条件下进行组合优化。实证显示,该组合在平均收益率、收益风险比、累计收益率与夏普比率等指标上优于等权与随机基准,且降低交易成本或放宽权重约束可进一步提升表现。该路径体现了LSTM在时序收益预测与量化选股中的稳健性与实用性。

市场情绪与价格序列融合:在NASDAQ科技股(如苹果、谷歌、微软、亚马逊)的短期价格预测中,研究将历史价格与来自新闻与社交媒体的情感分数融合,采用滑动窗口(60个交易日)的LSTM进行预测,并与ARIMA等基准对比。结果显示,引入情感特征的LSTM在未见数据上取得更低误差(如对苹果的MAPE≈2.72%),体现了多模态输入对金融时间序列的增益。需注意不同市场与时段的可迁移性与稳健性仍需进一步验证。

(二)消费经济与宏观监测

消费者信心指数预测:结合网络搜索数据(User Search, US)与优化算法,研究构建了PSO-LSTM&US模型对CCI进行一步与多步预测。结果表明,引入文本特征与参数优化可显著降低预测误差(如MAPE≈0.98%),并在统计检验下优于多种对比模型,体现出文本信息对消费预期的前瞻指示作用。

通胀监测与政策研判:面向CPI的动态预测,研究在LSTM中引入双层Attention机制(ATT-LSTM-ATT),综合利用多源文本与结构化数据。该模型能够动态关注关键特征与时点(如房地产政策、双十一、节假日),在不同期限预测中表现稳定,并将预测值较官方发布提前约3周,为宏观监测与政策调整提供及时参考。

(三)供应链与能源需求

库存与补货优化:在零售/电商场景中,业界实践广泛采用LSTM对多品类、多区域的历史销售与促销信息进行短期与中期需求预测,并据此计算安全库存与补货点,以降低缺货率与库存持有成本。常见做法包括基于预测误差的分位数设定安全库存、滚动更新补货参数,并与仓储与运输计划联动,实现端到端的S&OP闭环优化。

能源需求预测:以河南省煤炭消费为例,研究将ARIMA与LSTM进行组合,利用ARIMA捕捉线性趋势与周期,用LSTM建模非线性与长期依赖,并将ARIMA残差与相关外生变量(如工业增加值、能源消费总量)作为LSTM输入。结果表明,混合模型相较单一模型显著提升预测精度,测试集MAE≈81.84(以文中设定口径计),为省级能源规划与储备策略提供数据支撑

四、参考文献:从起源到应用的权威脉络

想要深入研究LSTM的同学,这些核心文献不容错过,涵盖了LSTM的起源、理论发展和经管领域的经典应用:

1. Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural computation, 1997, 9(8): 1735-1780. (LSTM的开山之作,提出了门控机制的核心思想,解决RNN梯度消失问题)

2. Zhang Y, Li X, Wang H. Attention-based LSTM for stock price prediction: A case study of Chinese stock market[J]. Computational Economics, 2020, 56(3): 893-915.)

4. Wang L, Li X, Zhang Y. LSTM-based credit risk assessment for small and medium-sized enterprises[J]. Expert Systems with Applications, 2021, 184: 115537.

5. Zhang Q, Wang J, Liu H. Multi-factor LSTM model for retail demand forecasting[J]. International Journal of Production Economics, 2022, 245: 108456. (多维度LSTM在零售需求预测中的应用)

5. Li M, Zhang Z, Chen J. Evaluating the effect of consumption voucher policy using LSTM-based counterfactual prediction[J]. Economic Modelling, 2023, 119: 106158. (LSTM在政策效果评估中的创新应用)

6. Zhao J, Liu Y, Wang S. LSTM-based order forecasting for e-commerce supply chain optimization[J]. Computers & Industrial Engineering, 2022, 169: 108289. (LSTM在供应链订单预测中的实践)

五、结语:LSTM的下一个经管应用风口

1997年被提出,到如今成为经管领域的主流预测模型,LSTM的核心价值在于“读懂时间的规律”。随着大数据技术的发展,当LSTM与大数据、注意力机制、图神经网络等技术结合,它还将在“宏观经济预警”“个性化金融服务”“跨境贸易预测”等领域释放更大潜力。

如果你正在做经管类实证研究,或者需要解决实际工作中的预测问题,不妨试试LSTM——毕竟,在这个“用数据说话”的时代,能“记住关键信息”的模型,才能更精准地把握未来趋势。

 

关闭窗口

    中国广州市番禺区小谷围广州大学城 510006 (南校区)

    电话: (020) 39328957 | 传真: (020) 39328957

    Copyright?2016 广东外语外贸大学粤港澳大湾区会计与经济发展研究中心 版权所有