spss怎么用

发布时间：2023-06-12 作者：admin 来源：文学

spss怎么用

2023年3月17日发(作者：both的用法和位置)

；.

使用SPSS软件进行数据分析

文档通过自己论证属实。

【例子】以全国31个省市的8项经济指标为例，进行主成分分析。

第一步：录入或调入数据（图1）。

图1原始数据（未经标准化）

第二步：打开“因子分析”对话框。

沿着主菜单的“Analyze→DataReduction→Factor”的路径（图2）打开因子分析

选项框（图3）。

；.

图2打开因子分析对话框的路径

图3因子分析选项框

第三步：选项设置。

首先，在源变量框中选中需要进行分析的变量，点击右边的箭头符号，将需要的变

量调入变量（Variables）栏中（图3）。在本例中，全部8个变量都要用上，故全部调入

（图4）。因无特殊需要，故不必理会“Value”栏。下面逐项设置。

图4将变量移到变量栏以后

⒈设置Descriptives选项。

单击Descriptives按钮（图4），弹出Descriptives对话框（图5）。

；.

图5描述选项框

在Statistics栏中选中Univariatedescriptives复选项，则输出结果中将会给出原始数

据的抽样均值、方差和样本数目（这一栏结果可供检验参考）；选中Initialsolution复选

项，则会给出主成分载荷的公因子方差（这一栏数据分析时有用）。

在CorrelationMatrix栏中，选中Coefficients复选项，则会给出原始变量的相关系

数矩阵（分析时可参考）；选中Determinant复选项，则会给出相关系数矩阵的行列式，

如果希望在Excel中对某些计算过程进行了解，可选此项，否则用途不大。其它复选项

一般不用，但在特殊情况下可以用到（本例不选）。

设置完成以后，单击Continue按钮完成设置（图5）。

⒉设置Extraction选项。

打开Extraction对话框（图6）。因子提取方法主要有7种，在Method栏中可以看

到，系统默认的提取方法是主成分（），因此对此栏不作变动，

就是认可了主成分分析方法。

在Analyze栏中，选中Correlationmatirx复选项，则因子分析基于数据的相关系数

矩阵进行分析；如果选中Covariancematrix复选项，则因子分析基于数据的协方差矩阵

进行分析。对于主成分分析而言，由于数据标准化了，这两个结果没有分别，因此任选

其一即可。

在Display栏中，选中Unrotatedfactorsolution（非旋转因子解）复选项，则在分析

结果中给出未经旋转的因子提取结果。对于主成分分析而言，这一项选择与否都一样；

对于旋转因子分析，选择此项，可将旋转前后的结果同时给出，以便对比。

选中ScreePlot（“山麓”图），则在分析结果中给出特征根按大小分布的折线图（形

如山麓截面，故得名），以便我们直观地判定因子的提取数量是否准确。

在Extract栏中，有两种方法可以决定提取主成分（因子）的数目。一是根据特征

根（Eigenvalues）的数值，系统默认的是

1

。我们知道，在主成分分析中，主成分

得分的方差就是对应的特征根数值。如果默认

1

，则所有方差大于等于1的主成分

将被保留，其余舍弃。如果觉得最后选取的主成分数量不足，可以将

值降低，例如

取

9.0

；如果认为最后的提取的主成分数量偏多，则可以提高

值，例如取

1.1

。主成分数目是否合适，要在进行一轮分析以后才能肯定。因此，特征根数值

的设定，要在反复试验以后才能决定。一般而言，在初次分析时，最好降低特征根的临

；.

界值（如取8.0

），这样提取的主成分将会偏多，根据初次分析的结果，在第二

轮分析过程中可以调整特征根的大小。

第二种方法是直接指定主成分的数目即因子数目，这要选中Numberoffactors复选

项。主成分的数目选多少合适？开始我们并不十分清楚。因此，首次不妨将数值设大一

些，但不能超过变量数目。本例有8个变量，因此，最大的主成分提取数目为8，不得

超过此数。在我们第一轮分析中，采用系统默认的方法提取主成分。

图6提取对话框

需要注意的是：主成分计算是利用迭代（Iterations）方法，系统默认的迭代次数是

25次。但是，当数据量较大时，25次迭代是不够的，需要改为50次、100次乃至更多。

对于本例而言，变量较少，25次迭代足够，故无需改动。

设置完成以后，单击Continue按钮完成设置（图6）。

⒊设置Scores设置。

选中Saveasvariables栏，则分析结果中给出标准化的主成分得分（在数据表的后

面）。至于方法复选项，对主成分分析而言，三种方法没有分别，采用系统默认的“回

归”（Regression）法即可。

图7因子得分对话框

；.

选中Displayfactorscorecoefficientmatrix，则在分析结果中给出因子得分系数矩阵

及其相关矩阵。

设置完成以后，单击Continue按钮完成设置（图7）。

⒋其它。

对于主成分分析而言，旋转项（Rotation）可以不必设置；对于数据没有缺失的情

况下，Option项可以不必理会。

全部设置完成以后，点击OK确定，SPSS很快给出计算结果（图8）。

图8主成分分析的结果

第四步，结果解读。

在因子分析结果（Output）中，首先给出的DescriptiveStatistics，第一列Mean对

应的变量的算术平均值，计算公式为





ijj

第二列ion对应的是样本标准差，计算公式为

2/1

2])(

[







jijj



第三列AnalysisN对应是样本数目。这一组数据在分析过程中可作参考。

；.

DescriptiveStatistics

1921.0931474.8060330

1745.933861.6419330

511.5083402.8854830

5457.6331310.2180530

666.1400459.9669930

117.28672.0253130

114.90671.8980830

862.9980584.5872630

国内生产

居民消费

固定资产

职工工资

货物周转

消费价格

商品零售

工业产值

ionAnalysisN

接下来是CorrelationMatrix(相关系数矩阵)，一般而言，相关系数高的变量，大

多会进入同一个主成分，但不尽然，除了相关系数外，决定变量在主成分中分布地位的

因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值，毕竟主成分分析是从

计算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关

矩阵的行列式值，根据关系式0)det(RI可知，det(λI)=det(R),从而

Determinant=1.133E-0.4=λ

*λ

。这一点在后面将会得到验证。

CorrelationMatrixa

1.000.267.951.191.617-.273-.264.874

.2671.000.426.718-.151-.235-.593.363

.951.4261.000.400.431-.280-.359.792

.191.718.4001.000-.356-.135-.539.104

.617-.151.431-.3561.000-.253.022.659

-.273-.235-.280-.135-.2531.000.763-.125

-.264-.593-.359-.539.022.7631.000-.192

.874.363.792.104.659-.125-.1921.000

国内生产

居民消费

固定资产

职工工资

货物周转

消费价格

商品零售

工业产值

国内

生产

居民

消费

固定

资产

职工

工资

货物

周转

消费

价格

商品

零售

工业

产值

Determinant=1.133E-04

在Communalities(公因子方差)中，给出了因子载荷阵的初始公因子方差（Initial）

和提取公因子方差（Extraction），后面将会看到它们的含义。

Communalities

1.000.945

1.000.800

1.000.902

1.000.875

1.000.857

1.000.957

1.000.929

1.000.903

国内生产

居民消费

固定资产

职工工资

货物周转

消费价格

商品零售

工业产值

InitialExtraction

ExtractionMethod:PrincipalComponentAnalysis.

在TotalVarianceExplained(全部解释方差)表的InitialEigenvalues（初始特

；.

征根）中，给出了按顺序排列的主成分得分的方差(Total)，在数值上等于相关系数矩

阵的各个特征根λ，因此可以直接根据特征根计算每一个主成分的方差百分比（%of

Variance）。由于全部特征根的总和等于变量数目，即有m=∑λ

=8，故第一个特征根的

方差百分比为λ

/m=3.755/8=46.939，第二个特征根的百分比为λ

/m=2.197/8=

27.459，……，其余依此类推。然后可以算出方差累计值（Cumulative%）。在Extraction

SumsofSquaredLoadings，给出了从左边栏目中提取的三个主成分及有关参数，提取的

原则是满足λ>1，这一点我们在图6所示的对话框中进行了限定。

TotalVarianceExplained

3.75546.93946.9393.75546.93946.939

2.19727.45974.3982.19727.45974.398

1.21515.18689.5841.21515.18689.584

.4025.03194.615

.2132.66097.275

.1381.72498.999

6.5E-02.81899.817

1.5E-02.183100.000

Component

Total

%of

Variance

Cumulative

%Total

%of

Variance

Cumulative

InitialEigenvaluesExtractionSumsofSquaredLoadings

ExtractionMethod:PrincipalComponentAnalysis.

ScreePlot

ComponentNumber

87654321

图8特征根数值衰减折线图（山麓图）

主成分的数目可以根据相关系数矩阵的特征根来判定，如前所说，相关系数矩阵的特

；.

征根刚好等于主成分的方差，而方差是变量数据蕴涵信息的重要判据之一。根据λ值决定主

成分数目的准则有三：

i只取λ>1的特征根对应的主成分

从TotalVarianceExplained表中可见，第一、第二和第三个主成分对应的λ值都

大于1，这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分

的。

ii累计百分比达到80%~85%以上的λ值对应的主成分

在TotalVarianceExplained表可以看出，前三个主成分对应的λ值累计百分比达

到89.584%，这暗示只要选取三个主成分，信息量就够了。

iii根据特征根变化的突变点决定主成分的数量

从特征根分布的折线图（ScreePlot）上可以看到，第4个λ值是一个明显的折点，这

暗示选取的主成分数目应有p≤4（图8）。那么，究竟是3个还是4个呢？根据前面两条

准则，选3个大致合适（但小有问题）。

在ComponentMatrix（成分矩阵）中，给出了主成分载荷矩阵，每一列载荷值都显

示了各个变量与有关主成分的相关系数。以第一列为例，0.885实际上是国内生产总值

（GDP）与第一个主成分的相关系数。将标准化的GDP数据与第一主成分得分进行回归，

决定系数R2=0.783（图9），容易算出R=0.885，这正是GDP在第一个主成分上的载荷。

ComponentMatrixa

.885.384.121

.607-.598.271

.912.161.212

.466-.722.368

.486.738-.275

-.509.252.797

-.620.594.438

.823.427.211

国内生产

居民消费

固定资产

职工工资

货物周转

消费价格

商品零售

工业产值

123

Component

ExtractionMethod:PrincipalComponentAnalysis.

3componentsextracted.

下面将主成分载荷矩阵拷贝到Excel上面作进一步的处理：计算公因子方差和方差

贡献。首先求行平方和，例如，第一行的平方和为

2=0.88492+0.38362+0.12092=0.9449

这是公因子方差。然后求列平方和，例如，第一列的平方和为

2=0.88492+0.60672+…+0.82272=3.7551

这便是方差贡献（图10）。在Excel中有一个计算平方和的命令sumsq，可以方便地算出

一组数据的平方和。显然，列平方和即方差贡献。事实上，有如下关系成立：

相关系数矩阵的特征根＝方差贡献＝主成分得分的方差

至于行平方和，显然与前面公因子方差（Communalities）表中的Extraction列对应的数

据一样。如果我们将8个主成分全部提取，则主成分载荷的行平方和都等于1（图11），

即有h

=1，s

=λ

。到此可以明白：在Communalities中，Initial对应的是初始公因子方差，

实际上是全部主成分的公因子方差；Extraction对应的是提取的主成分的公因子方差，我

们提取了3个主成分，故计算公因子方差时只考虑3个主成分。

；.

0.001000.002000.003000.004000.005000.00

国内生产总值

-2.00000

0.00000

2.00000

4.00000

第

一

主

成

分







第一主成分=-2.27+0.00*国生产总值

R-Sqare=0.78301

图9国内生产总值（GDP）的与第一主成分的相关关系（标准化数据）

图10主成分方差与方差贡献

ComponentMatrixa

.885.384.121-.203-6.87E-021.143E-022.420E-029.192E-02

.607-.598.271.409-7.61E-02.1575.525E-021.317E-02

.912.161.212-.270-7.71E-028.271E-028.113E-02-7.36E-02

.466-.722.368-.164.304-1.64E-02-7.62E-023.949E-03

.486.738-.275.212.3052.254E-026.855E-02-6.02E-03

-.509.252.797.0722.716E-02-.161.1072.435E-03

-.620.594.438-.0273.531E-02.247-9.23E-021.634E-03

.823.427.211.209-9.38E-02-.137-.157-2.30E-02

国内生产

居民消费

固定资产

职工工资

货物周转

消费价格

商品零售

工业产值

12345678

Component

ExtractionMethod:PrincipalComponentAnalysis.

8componentsextracted.

；.

图11全部主成分的公因子方差和方差贡献

提取主成分的原则上要求公因子方差的各个数值尽可能接近，亦即要求它们的方差

极小，当公因子方差完全相等时，它们的方差为0，这就达到完美状态。实际应用中，

只要公因子方差数值彼此接近（不相差太远）就行了。从上面给出的结果可以看出：提

取3个主成分的时候，居民消费的公因子方差偏小，这暗示提取3个主成分，居民消费方

面的信息可能有较多的损失。至于方差贡献，反映对应主成分的重要程度，这一点从方

差的统计学意义可以得到理解。

在图11中，将最后一行的特征根全部乘到一起，得0.0001133，这正是相关系数矩

阵的行列式数值（在Excel中，求一组数据的乘积之和的命令是product）。

最后说明ComponentScoreCoefficientMatrix（成分得分系数矩阵）和Component

ScoreCovarianceMatrix（成分得分协方差矩阵），前者是主成分得分系数，后者是

主成分得分的协方差即相关系数。从ComponentScoreCovarianceMatrix可以看出，

标准化主成分得分之间的协方差即相关系数为0（j≠k）或1（j=k），这意味着主成分之

间彼此正交即垂直。

初学者常将ComponentScoreCoefficientMatrix表中的数据当成主成分得分或因

子得分，这是误会。成分得分系数矩阵的数值是主成分载荷除以相应的特征根得到的结

果。在ComponentMatrix表中，将第一列数据分别除以λ

=3.755,第二列数值分别除以

=2.197,…，立即得到ComponentScoreCoefficient；反过来，如果将ComponentScore

CoefficientMatrix表中的各列数据分别乘以λ

=3.755，λ

=2.197,…，则可将其还原为

主成分载荷即ComponentMatrix中的数据。

ComponentScoreCoefficientMatrix

.236.175.100

.162-.272.223

.243.073.174

.124-.329.303

.129.336-.227

-.135.115.656

-.165.271.360

.219.194.174

国内生产

居民消费

固定资产

职工工资

货物周转

消费价格

商品零售

工业产值

123

Component

ExtractionMethod:PrincipalComponentAnalysis.

ComponentScores.

；.

ComponentScoreCovarianceMatrix

1.000.000.000

.0001.000.000

.000.0001.000

Component

123

ExtractionMethod:PrincipalComponentAnalysis.

ComponentScores.

实际上，主成分得分在原始数据所在的SPSS当前数据栏中给出，不过给出的都是标

准化的主成分得分(图12a)；将各个主成分乘以相应的√λ即特征根的二次方根可以将其

还原为未经标准化的主成分得分。

a.标准化的主成分得分b.非标准化的主成分得分

图12两种主成分得分

计算标准化主成分得分的协方差或相关系数，结果与ComponentScoreCovariance

；.

Matrix表中的给出的结果一致（见图13）。

第一因子第二因子第三因子

第一因子1

第二因子0.000001

第三因子0.000000.000001

图13主成分（得分）之间的相关系数矩阵

第五步，计算结果分析。

从ComponentMatrix即主成分载荷表中可以看出，国内生产总值、固定资产投资和

工业产值在第一主成分上载荷较大，亦即与第一主成分的相关系数较高；职工工资和货

物周转量在第二主成分上的载荷绝对值较大，即负相关程度较高；消费价格指数在第三

主成分上的载荷较大，即相关程度较高。

因此可将主成分命名如下：

第一主成分：投入－产出主成分；

第二主成分：工资－物流主成分；

第三主成分：消费价格主成分。

问题在于：一方面，居民消费和商品零售价格指数的归类比较含混；另一方面，主

成分的命名结构不清。因此，有必要作进一步的因子分析。

ComponentMatrixa

.885.384.121

.607-.598.271

.912.161.212

.466-.722.368

.486-.722-.275

-.509.252.797

-.620.594.438

.823.427.211

国内生产

居民消费

固定资产

职工工资

货物周转

消费价格

商品零售

工业产值

123

Component

ExtractionMethod:PrincipalComponentAnalysis.

3componentsextracted.

至于因子旋转之类，留待“因子分析”部分说明；计算结果的系统分析不属于软件

操作范围，预备课堂讲解。

【说明】本人计算机是双系统，现在常用的WinMe系统出了毛病，SPSS10.0在WinMe系统

中；故这次改用本人Win2000系统中的SPSS11.0。对于因子分析之类,SPSS11.0与

SPSS10.0基本没有什么差别。

👁️ 阅读量：0

🔖 本文标签：

🔥 最新发布文章