📝 时间序列教程

21篇技术文档
  时间序列教程

📅  最后修改于: 2020-12-10 06:21:02        🧑  作者: Mango

时间序列是在一定时期内的一系列观察结果。我们每个人每天遇到的时间序列的最简单示例是整个一天,一周,一个月或一年中温度的变化。时间数据分析能够为我们提供有关变量如何随时间变化的有用见解。本教程将教您如何借助精心设计和易于理解的各种统计和机器学习模型来分析和预测时间序列数据!本教程适用于寻求从零开始了解时间序列和时间序列预测模型的好奇心人士。在本教程的最后,您将对时间序列建模有一个很好的了解。先决条件...

  时间序列-简介

📅  最后修改于: 2020-12-10 06:21:25        🧑  作者: Mango

时间序列是在一定时期内的一系列观察结果。单变量时间序列由一个变量在一个周期内的定期时间实例所取的值组成,而多元时间序列由多个变量在一个周期内的相同周期性时间实例所取的值组成。我们每个人每天遇到的时间序列的最简单示例是整个一天,一周,一个月或一年中温度的变化。时间数据的分析能够为我们提供有用的见解,以了解变量如何随时间变化,或者变量如何取决于其他变量的值变化。可以将变量与其先前值和/或其他变量的这种...

  时间序列-编程语言

📅  最后修改于: 2020-12-10 06:21:52        🧑  作者: Mango

对任何编程语言的基本理解对于用户处理或发展机器学习问题都是必不可少的。下面列出了想要从事机器学习的任何人的首选编程语言列表-Python它是一种高级解释型编程语言,可以快速,轻松地编写代码。 Python可以遵循过程式或面向对象的编程范例。各种库的存在使复杂过程的实现更加简单。在本教程中,我们将使用Python进行编码,并将在接下来的章节中讨论对时间序列建模有用的相应库。[R与Python相似,R...

  时间序列Python库

📅  最后修改于: 2020-12-10 06:22:13        🧑  作者: Mango

Python因其易于编写和易于理解的代码结构以及各种各样的开源库而在执行机器学习的个人中广受欢迎。下面介绍了一些我们将在接下来的章节中使用的开源库。NumPy数值Python是用于科学计算的库。它适用于N维数组对象,并提供基本的数学功能,例如大小,形状,均值,标准差,最小值,最大值以及一些更复杂的函数,例如线性代数函数和傅立叶变换。随着本教程的深入,您将学到更多有关这些的知识。大熊猫该库提供了高效...

  时间序列-数据处理和可视化

📅  最后修改于: 2020-12-10 06:23:07        🧑  作者: Mango

时间序列是按等距时间间隔索引的观察序列。因此,应该在任何时间序列中保持顺序和连续性。我们将使用的数据集是一个多变量时间序列,其中包含大约一年的每小时数据,用于一个污染严重的意大利城市的空气质量。可以从下面给出的链接中下载数据集-https://archive.ics.uci.edu/ml/datasets/air+quality。有必要确保-时间序列等距分布,并且没有多余的值或空白。如果时间序列不...

  时间序列-建模

📅  最后修改于: 2020-12-10 06:23:26        🧑  作者: Mango

介绍时间序列具有4个成分,如下所示-水平-它是序列变化的平均值。趋势-它是变量随时间的增加或减少行为。季节性-这是时间序列的周期性行为。噪声-这是由于环境因素导致的观测值误差。时间序列建模技术为了捕获这些组件,有许多流行的时间序列建模技术。本节简要介绍了每种技术,但是我们将在接下来的章节中详细讨论它们-幼稚的方法这些是简单的估算技术,例如,给预测值等于时间相关变量的先前值或先前实际值的平均值。这些...

  时间序列-参数校准

📅  最后修改于: 2020-12-10 06:23:52        🧑  作者: Mango

介绍任何统计或机器学习模型都具有一些参数,这些参数会极大地影响数据建模的方式。例如,ARIMA具有p,d,q值。确定这些参数,以使实际值和建模值之间的误差最小。据说参数校准是模型拟合的最关键和最耗时的任务。因此,选择最优参数对我们来说至关重要。参数校准方法有多种校准参数的方法。本节详细讨论其中的一些。尝试校准模型的一种常见方法是手动校准,从可视化时间序列开始,然后直观地尝试一些参数值,并不断地更改...

  时间序列-天真的方法

📅  最后修改于: 2020-12-10 06:24:18        🧑  作者: Mango

介绍单纯的方法(例如,假设在时间“ t”处的预测值是时间在“ t-1”处变量的实际值或序列的滚动平均值)用于衡量统计模型和机器学习模型的性能并强调他们的需求。在本章中,让我们在时间序列数据的功能之一上尝试这些模型。首先,我们将看到数据“温度”特征的均值及其周围的偏差。查看最大和最小温度值也很有用。我们可以在这里使用numpy库的功能。显示统计在[135]中:我们拥有等距时间轴上所有9357个观测值...

  时间序列-自动回归

📅  最后修改于: 2020-12-10 06:24:39        🧑  作者: Mango

对于固定时间序列,自动回归模型将时间“ t”处的变量值视为值“ p”时间步长的线性函数。数学上可以写成-$$ y_ {t} = \:C + \:\ phi_ {1} y_ {t-1} \:+ \:\ phi_ {2} Y_ {t-2} + … + \ phi_ {p} y_ {tp} + \ epsilon_ {t} $$其中,“ p”是自回归趋势参数$ \ epsilon_ {t} $是白噪声,...

  时间序列-移动平均线

📅  最后修改于: 2020-12-10 06:25:01        🧑  作者: Mango

对于固定的时间序列,移动平均模型将时间“ t”处的变量值视为来自其前“ q”个时间步长的残差线性函数。通过将时间“ t”处的值与先前值的移动平均值进行比较,可以计算出残余误差。数学上可以写成-$$ y_ {t} = c \:+ \:\ epsilon_ {t} \:+ \:\ theta_ {1} \:\ epsilon_ {t-1} \:+ \:\ theta_ {2} \:\ epsilon_...

  时间序列-ARIMA

📅  最后修改于: 2020-12-10 06:25:34        🧑  作者: Mango

我们已经了解,对于平稳的时间序列,时间“ t”处的变量是先前观测值或残差的线性函数。因此,现在是我们将两者结合起来并拥有自回归移动平均值(ARMA)模型的时候了。但是,有时时间序列不是固定的,即序列的统计属性(例如均值,方差)会随时间变化。到目前为止,我们研究的统计模型都假设时间序列是固定的,因此,我们可以包括一个预处理步骤,使该时间序列微分以使其稳定。现在,重要的是要弄清我们正在处理的时间序列是...

  时间序列-ARIMA的变化

📅  最后修改于: 2020-12-10 06:26:14        🧑  作者: Mango

在上一章中,我们现在看到了ARIMA模型的工作原理,以及它不能处理季节性数据或多元时间序列的局限性,因此引入了包含这些功能的新模型。这些新模型的概览在这里给出-向量自回归(VAR)它是用于多元平稳时间序列的自动回归模型的通用版本。它以“ p”参数为特征。向量移动平均线(VMA)它是用于多元平稳时间序列的移动平均模型的广义版本。它以“ q”参数为特征。向量自回归移动平均值(VARMA)它是VAR和V...

  时间序列-指数平滑

📅  最后修改于: 2020-12-10 06:26:43        🧑  作者: Mango

在本章中,我们将讨论时间序列的指数平滑所涉及的技术。简单指数平滑指数平滑是一种通过在一段时间内为数据分配指数递减的权重来平滑单变量时间序列的技术。数学上,在时间t处给定时间t y_(t + 1 | t)的值在时间“ t + 1”处的变量的值定义为-$$ y_ {t + 1 | t} \:= \:\ alpha y_ {t} \:+ \:\ alpha \ lgroup1-\ alpha \ rgr...

  时间序列-前移验证

📅  最后修改于: 2020-12-10 06:27:04        🧑  作者: Mango

在时间序列建模中,随着时间的推移,预测变得越来越不准确,因此,当模型可用于进一步的预测时,采用实际数据重新训练模型是一种更为现实的方法。由于训练统计模型并不耗时,因此,前向验证是获得最准确结果的最优选解决方案。让我们对数据进行一步向前验证,并将其与我们之前获得的结果进行比较。在[333]中:在[335]中:在[341]中:在[340]中:我们可以看到我们的模型现在性能明显更好。实际上,趋势是如此接...

  时间序列-先知模型

📅  最后修改于: 2020-12-10 06:27:24        🧑  作者: Mango

2017年,Facebook开源了先知模型,该模型能够在日水平,周水平,年水平等和趋势方面对具有多个季节性的时间序列进行建模。它具有直观的参数,不是那么专业的数据科学家可以调整这些参数以获得更好的预测。它的核心是可加回归模型,可以检测变化点以对时间序列建模。先知将时间序列分解为趋势$ g_ {t} $,季节性$ S_ {t} $和假期$ h_ {t} $的分量。$$ y_ {t} = g_ {t}...