大语言模型对时间序列预测真的有用吗？

我们已经看到了语言模型的巨大进步，但时间序列任务，如预测呢？今天我们推荐一篇论文，对现有的语言模型和时间序列做了深入的研究。将探讨了是否可以从大型语言模型（LLMs）中获益于时间序列（TS）预测。

时间序列

时间序列是机器学习中最具挑战性的工作领域之一，解决时间序列任务，如异常检测、时间序列预测等，在多个行业中至关重要，能够节省大量资金。

由OpenAI发起的规模化法则显示，模型能在更多原始数据上更好地泛化结果就得到了ChatGPT。自那以后，大型语言模型（LLMs）吸引了所有人的注意。

自那以后，研究者们一直在尝试将LLMs用于时间序列！这在某种程度上是有道理的，因为无论是语言数据还是时间序列都是序列数据，研究者认为如果LLMs能在语言数据上表现出良好的泛化能力，那么它可能也适用于时间序列。

关于这方面有很多酷炫的研究成果，但问题是“有多少LLMs真正适用于时间序列任务？”

我认为一些工作展示了时间序列的光明未来，例如使用LLMs实现的时间序列推理和理解（代理）等。

时间序列推理：

使用大型语言模型（LLMs）进行时间序列推理可以通过整合三种主要的分析任务来增强时间序列推理：因果推理、问答和辅助上下文预测。

因果推理涉及假设观察到的时间序列模式背后的潜在原因，使模型能够识别最有可能产生给定时间序列数据的场景。

问答使模型能够解释和回应关于时间序列的事实性查询，如识别趋势或对数据变化进行反事实推断。

辅助上下文预测允许模型利用额外的文本信息来增强对未来数据点的预测，整合相关上下文以提高预测准确性。

但当前的LLMs在这些任务中表现出有限的熟练程度，比如在因果和问答任务中的表现仅略高于随机水平，并在辅助上下文预测中显示出适度的改进。

社会理解：

使用大型语言模型（LLMs）进行时间序列分析可以显著提高社会理解，使代理能够系统地分析和预测社会趋势和行为。基于LLM的代理使用来自财经、经济、民调和搜索趋势等多个领域的真实世界时间序列数据来近似社会的隐藏状态。这种近似有助于通过将时间序列数据与新闻和社交媒体等其他信息源相关联，对社会行为进行假设和验证。

通过整合这些多样化的数据流，LLMs能够深入洞察多面且动态的社会问题，促进包含逻辑和数字分析的复杂和混合推理。

这种方法确保代理不仅仅是执行历史数据拟合，而是积极与不断流动的真实世界数据互动并适应，使其分析和预测在真实场景中保持相关和适用。

但是当涉及到时间序列时，这些新模型并没有使用预训练的LMs的自然推理能力。