时间序列基础模型:预测未来的魔法?

探索如何用人工智能理解和预测随时间变化的数据

重医附属儿童医院:黄国宇&徐铣明+天工AI

时间序列示意图

第一章:时间的故事 - 什么是时间序列?

想象一下,你每天记录自己的身高,或者记录每天的最高气温。这些按照时间顺序排列的数据,就是时间序列

定义: 时间序列就是按时间顺序排列的一系列数据点。

生活中的例子:

关键特点: 数据点是有顺序的,后面的数据往往和前面的数据有关联。时间是单向流动的,我们只能根据过去和现在预测未来,不能改变过去。

时间序列长什么样?

时间序列示例图
比喻: 时间序列就像是一本日记,记录了某个事物随着时间推移的变化。通过阅读这本"日记",我们能了解它的过去,理解它的现在,甚至预测它的未来。

第二章:为什么关心时间? - 时间序列分析有什么用?

研究时间序列,就像是想从过去的故事里,找到未来的线索。

主要目的:

中学生理解方式:

时间序列分析目的

第三章:让机器变聪明 - 认识人工智能和深度学习

机器怎么才能像我们一样,从数据里学习规律呢?这就是人工智能(AI)和机器学习(ML)要做的事情。

人工智能 (AI): 让机器表现出智能,比如思考、学习、解决问题。

机器学习 (ML): 是AI的一种方法,让机器通过"看"大量数据来学习,而不是靠人编写死板的规则。

深度学习 (DL): 是机器学习里一种特别厉害的技术,它模仿人脑神经网络的结构,构建很多层"神经元"来处理信息。

比喻: 如果说机器学习是让机器学会"看图说话",那么深度学习就是给机器装上了一双特别厉害、能看懂很多细节的"眼睛",这双眼睛有很多层镜片(神经网络的层)。

深度学习是怎么"学"的?

简单来说,深度学习模型通过不断调整内部的参数(就像调整收音机的旋钮),让它的预测结果和真实结果之间的"错误"越来越小。这个调整错误的过程,有点像我们在做数学题时,根据答案检查自己的步骤,然后修改错误。

深度学习示意图

第四章:用深度学习预测时间 - 优势与挑战

深度学习模型因为能学习复杂的模式,所以也被用来预测时间序列。

如何应用: 它们可以学习时间序列数据中隐藏的复杂规律,比如长期的依赖关系、多个时间序列之间的相互影响等。

常见的深度学习模型:

优势:

挑战:

深度学习预测时间序列

第五章:AI世界的"万能工具" - 什么是基础模型?

最近几年,AI领域出现了一种新的趋势:训练"基础模型"(Foundation Models)。

定义: 基础模型是在海量、多样化的数据上进行预训练的超大型模型。它们学习到了很多通用的知识和能力。

比喻: 想象一个学识渊博、经验丰富的"通才"或"万事通"。他在很多领域都学习过(预训练),所以当遇到一个新的具体问题时,他不需要从零开始学,只需要稍微了解一下新问题的特点,就能很快上手解决。

关键特点:

基础模型示意图

第六章:时间序列的"万能预测家" - 时间序列基础模型 (TSFM)

把"基础模型"的思想应用到时间序列领域,就诞生了时间序列基础模型(Time Series Foundation Model,TSFM)。

定义: TSFM 是在海量、多样化的时间序列数据上进行预训练的模型。它们学习理解各种时间序列数据的通用模式和结构。

比喻: TSFM 就像一个"时间规律的百科全书"或"时间模式的语言大师"。它阅读了无数不同类型的时间序列"故事"(股票、天气、销售、传感器数据等),所以对各种时间变化的规律非常熟悉。当你给它一个新的时间序列"故事"时,它能很快理解并预测接下来的发展。

TSFM 的特点:

TSFM 的目标: 利用基础模型的强大能力,开发能够熟练理解和预测跨不同领域的时间序列数据的通用模型。

TSFM示意图

第七章:谁更厉害? - TSFM vs. 传统方法 vs. 深度学习

TSFM 和传统的统计方法、以及一般的深度学习模型有什么不同?它的优势在哪里?

比喻: 就像学习一门新技能,传统方法是针对一个具体任务反复练习(比如只学骑自行车),深度学习是学习更通用的技能(比如学开各种车),而TSFM则是在各种交通工具上都学习过(自行车、汽车、摩托车、飞机),所以学新的交通工具(比如滑板)会非常快。

对比表格:

特点 传统统计模型
(如ARIMA)
传统深度学习模型
(针对特定任务训练)
时间序列基础模型 (TSFM)
学习方式 基于数学公式和统计规律 从大量特定数据中学习复杂模式 在海量多样化时间序列数据上预训练,学习通用模式
数据需求 相对较少,但对数据特性敏感 需要大量特定任务数据 预训练需要海量数据,但适应新任务时数据需求少
泛化能力
(处理新类型数据)
通常较差,需要为每种数据重新建模 通常较差,需要为每种数据重新训练 很强!能理解并处理未见过的新类型时间序列
新任务适应性
(零/少样本学习)
需要重新建模和训练 需要大量新数据重新训练 很强!只需少量新数据甚至无需新数据就能预测
模型复杂度 相对较低 较高 非常高(模型规模大)
计算成本 较低 较高(训练) 非常高(预训练),但适应新任务成本较低
代表模型 ARIMA, 趋势分析等 LSTM, GRU, Transformer TimesFM, MOIRAI, Chronos, Timer等

总结: TSFM 的最大优势在于它的通用性和适应性,特别是在面对新的、数据量少的时间序列任务时,表现出色。

第八章:认识一些TSFM"明星"及其应用

科学家们已经开发出了一些厉害的TSFM模型:

TSFM的应用领域:

TSFM应用领域

第九章:TSFM 的未来展望

TSFM 是一个非常新的领域,但潜力巨大!

随着计算能力的提升和算法的革新,TSFM可能会帮助我们解决更多复杂的时间序列预测问题,让我们更好地理解和预测这个充满变化的世界!

TSFM未来展望

总结与思考

回顾:

思考题:

  1. 你能想到身边哪些数据是时间序列数据?
  2. TSFM与传统深度学习模型相比,最大的优势是什么?
  3. 如果你要预测自己的学习成绩变化趋势,你会选择哪种预测方法?为什么?