因子分析:原理、方法与应用
1. 引言
在数据分析领域,降低数据维度并揭示数据中的变异性和相关性结构是一个重要的任务。EOF分析(经验正交函数分析)或PCA(主成分分析)等方法是常见的探索性技术,它们通过从高维数据中找出与最大方差相关的少量模式来降低系统维度,不过这些方法并未涉及明确的概率模型。
而因子分析(Factor Analysis,FA)是一种基于适当统计模型从数据中寻找模式或因子的多元方法。与EOF分析主要关注解释观测到的方差不同,因子分析试图通过一组变量或因子来解释变量之间观测到的协方差。假设每个观测变量是这些因子的线性组合加上随机误差,那么因子与原始变量之间的关系就可能解释观测到的关联。
因子分析与PCA在维度降低和确定主要变异性或协变性模式方面有一些相似之处。它大约与Pearson的PCA工作(1902年)同时由Spearman(1904年)提出,后来由Hotelling(1935 - 1936年)正式和数学地进行了表述。虽然PCA/EOF方法常被视为探索性技术,但它也可以被看作是基于模型的,这使其与因子分析更为接近,实际上EOF/PCA方法可以被视为因子分析的一个特例。
2. 因子模型
2.1 背景
假设我们有一个多元时间序列$x_t$,其中$t = 1, 2, \cdots, n$,每个$x_t$由$p$个变量组成,即$x_t = [x_{t1}, \cdots, x_{tp}]^T$。假设该时间序列均值为零,其协方差矩阵为$\Sigma = E[x_tx_t^T]$,且该矩阵为满秩。
2.2 模型定义与术语
为了解释多元时间序列中观测到的协方差,假
超级会员免费看
订阅专栏 解锁全文

5万+

被折叠的 条评论
为什么被折叠?



