SVD Decomposition and Patterns in Multivariate Time Series

对于一个 $n\times T$ 的多元时间序列矩阵 $X$ ，其中 $n$ 是通道数（或变量数）， $T$ 是时间节点（观测数）。对其进行 SVD 分解，可以得到 $X=U\Sigma V^T$ 。下面解释分解后各个矩阵的意义及其应用。

对于矩阵 $U$ ，它代表了数据中的空间模式，其每一列都是特征通道的某种线性组合。

对于矩阵 $V$ ，它代表了数据中的时间模式，其每一列对应于上述空间模式的时间演化波形。

对于奇异值矩阵 $\Sigma$ ，它代表了空间-时间模式对的重要性。奇异值越大，对应的模式在原始数据中占比越重，解释的方差越多。

对于空间模式 $U$ 的每一个列向量 $u_i$ ，我们考虑奇异值最大的那个列向量 $u_1$ ，也就是最重要的空间模式：

对于多地区的气温序列研究，我们可能发现 $u_1$ 中所有表示北方地区的元素都较大，而南方地区的元素较小。这说明最重要的温度变化模式是全国空间上的差异（例如南北差异）。
对于脑电数据（EEG）， $u_1$ 可能意味着特定脑区的激活强度更高。

总之，空间模式 $U$ 度量了我们观测空间上的整体差异。

再看最重要的时间模式 $v_1$ 。它是一个时间序列：

至于奇异值矩阵 $\Sigma$ ，它负责度量这个（空间-时间）效应对整体数据的贡献程度。

当我们侧重于研究各个时间序列通道之间的差异和联系的时候，我们应该着重研究矩阵 $U$ 。

当我们侧重研究时间的动态特性的时候，就应该侧重研究矩阵 $V$ 。

SVD 分解也可以用于数据压缩，类似于其他矩阵分解方式。我们可以选择降低矩阵 $U$ 或者矩阵 $V$ 的维数：

这在观测事件过长（ $T$ 很大）也就是样本空间过大的时候可以考虑。