因子分析原理
因子分析原理 因子分析常用于通过可观测变量推断出其背后的公共因子(也称为隐变量),样本在公共因子上的取值变化影响其在可观测变量上的取值,因为一般公共因子的个数小于可观测变量的数目,所以因子分析也可以用来降维。 举个例子,假设每个学生有很多门考试成绩,其中包括,英语成绩,德语成绩,数学成绩以及物理成绩。我们可以认为这4门课程的成绩背后是由每个学生的语言学能力以及理科能力所决定的。这时,语言学能力与理科能力就是公共因子。 但是也会出现某些学生的语言学能力很强,但是就是德语成绩很差的情况,所以因子模型中除了公共因子之外,每个可观测变量还对应着特殊因子,例如下图所示,Specific Factor 1就表示在考虑两个公共因子的情况下,学习英语的能力。
因子分析的原理
因子分析的原理如下: 在对某一个问题进行论证分析时,采集大量多变量的数据能为我们的研究分析提供更为丰富的信息和增加分析的精确度。然而,这种方法不仅需要巨大的工作量,并且可能会因为变量之间存在相关性而增加了我们研究问题的复杂性。 因子分析法就是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。这样我们就可以对原始的数据进行分类归并,将相关比较密切的变量分别归类,归出多个综合指标。 这些综合指标互不相关,即它们所综合的信息互相不重叠。这些综合指标就称为因子或公共因子。因子分析法的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构。 即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。这样,就能相对容易地以较少的几个因子反映原资料的大部分信息,从而达到浓缩数据,以小见大,抓住问题本质和核心的目的。 隐性变量 因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量。比如,如果要测量学生的学习积极性,课堂中的积极参与,作业完成情况,以及课外阅读时间可以用来反应积极性。 而学习成绩可以用期中,期末成绩来反应。在这里,学习积极性与学习成绩是无法直接用一个测度测准,它们必须用一组测度方法来测量,然后把测量结果结合起来,才能更准确地把握。换句话说,这些变量无法直接测量。