
spss线性回归
-
2023年3月19日发(作者:羟醛缩合)SPSS统计分析
多元线性回归分析方法操作与分析
实验目的:
引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五
年以上平均年贷款利率和房屋空置率作为变量;来研究上海房价的变动因
素..
实验变量:
以年份、商品房平均售价元/平方米、上海市城市人口密度人/平方公
里、城市居民人均可支配收入元、五年以上平均年贷款利率%和房屋空置率%
作为变量..
实验方法:多元线性回归分析法
软件:spss19.0
操作过程:
第一步:导入Excel数据文件
tadocument——opendata——open;
gexceldatasource——OK.
第二步:
1.在最上面菜单里面选中
Analyze——Regression——Linear;Dependent因变量选择商品房平均
售价;Independents自变量选择城市人口密度、城市居民人均可支配收入、
五年以上平均年贷款利率、房屋空置率;Method选择Stepwise.
进入如下界面:
2.点击右侧Statistics;勾选RegressionCoefficients回归系数选项组
中的Estimates;勾选Residuals残差选项组中的Durbin-Watson、Casewise
diagnostics默认;接着选择Modelfit、Collinearitydiagnotics;点
击Continue.
3.点击右侧Plots;选择ZPRED标准化预测值作为纵轴变量;选择DEPENDNT
因变量作为横轴变量;勾选选项组中的StandardizedResidualPlots标
准化残差图中的Histogram、Normalprobabilityplot;点击Continue.
4.点击右侧Save;勾选PredictedVaniues预测值和Residuals残差选项
组中的Unstandardized;点击Continue.
5.点击右侧Options;默认;点击Continue.
6.返回主对话框;单击OK.
输出结果分析:
1.引入/剔除变量表
该表显示模型最先引入变量城市人口密度人/平方公里;第二个引入
模型的是变量城市居民人均可支配收入元;没有变量被剔除..
2.模型汇总
ModelSummaryc
VariablesEntered/Removeda
ModelVariablesEnteredVariablesRemovedMethod
1
城市人口密度人/平方公里
.StepwiseCriteria:
Probability-of-F-to-enter
<=.050;
Probability-of-F-to-remove>=
.100.
2
城市居民人均可支配收入元
.StepwiseCriteria:
Probability-of-F-to-enter
<=.050;
Probability-of-F-to-remove>=
.100.
entVariable:商品房平均售价元/平方米
ModelRRSquareAdjustedRSquare
fthe
EstimateDurbin-Watson
11.000a1.0001.00035.187
21.000b1.0001.00028.3512.845
tors:Constant;城市人口密度人/平方公里
tors:Constant;城市人口密度人/平方公里;城市居民人均可支配收入元
entVariable:商品房平均售价元/平方米
该表显示模型的拟合情况..从表中可以看出;模型的复相关系数R为
1.000;判定系数RSquare为1.000;调整判定系数AdjustedRSquare为
1.000;估计值的标准误差ftheEstimate为
28.351;Durbin-Watson检验统计量为2.845;当DW≈2时说明残差独立..
3.方差分析表
ANOVAc
ModelSumofSquaresdfMeanSquareFSig.
1Regression38305583.5.50630938.620.000a
Residual11143.03991238.115
Total38316726.54510
2Regression38310296.528219155148.26423832.156.000b
Residual6430.0188803.752
Total38316726.54510
tors:Constant;城市人口密度人/平方公里
tors:Constant;城市人口密度人/平方公里;城市居民人均可支配收入元
entVariable:商品房平均售价元/平方米
该表显示各模型的方差分析结果..从表中可以看出;模型的F统计量
的观察值为23832.156;概率p值为0.000;在显著性水平为0.05的情形下;
可以认为:商品房平均售价元/平方米与城市人口密度人/平方公里;和城
市居民人均可支配收入元之间有线性关系..
4.回归系数
Coefficientsa
该表为多元线性回归的系数列表..表中显示了模型的偏回归系数B、
标准误差、常数Constant、标准化偏回归系数Beta、回归系
数检验的t统计量观测值和相应的概率p值Sig.、共线性统计量显示了变
量的容差Tolerance和方差膨胀因子VIF..
令x1表示城市人口密度人/平方公里;x2表示城市居民人均可支配收入
元;根据模型建立的多元多元线性回归方程为:
y=1555.506+1.020x1+0.017x2
方程中的常数项为1555.506;偏回归系数b1为1.020;b2为0.017;经
T检验;b1和b2的概率p值分别为0.000和0.042;按照给定的显著性水平
0.10的情形下;均有显著性意义..
根据容差发现;自变量间共线性问题严重;VIF值为20.126;也可以说
明共线性较明显..这可能是由于样本容量太小造成的..
5.模型外的变量
Model
Unstandardized
Coefficients
Standardize
d
Coefficients
TSig.
Collinearity
Statistics
eta
Toleranc
eVIF
1Constant1652.24624.13768.454.000
城市人口密度人/平
方公里
1.072.0061.000175.89
4
.0001.0001.000
2Constant1555.50644.43235.009.000
城市人口密度人/平
方公里
1.020.022.95146.302.000.05020.126
城市居民人均可支配
收入元
.017.007.0502.422.042.05020.126
entVariable:商品房平均售价元/平方米
ExcludedVariablesc
ModelBetaIntSig.
Partial
Correlation
CollinearityStatistics
Toleranc
eVIF
Minimum
Tolerance
该表显示的是回归方程外的各模型变量的有关统计量;可见模型方程
外的各变量偏回归系数经重检验;概率p值均大于0.10;故不能引入方程..
6.共线性诊断
该表是多重共线性检验的特征值以及条件指数..对于第二个模型;最
大特征值为2.891;其余依次快速减小..第三列的各个条件指数;可以看出
有多重共线性..
7.残差统计量
1
城市居民人均可支配
收入元
.050a2.422.042.650.05020.126.050
五年以上平均年贷款
利率%
-.001a-.241.815-.085.9991.001.999
房屋空置率%
.004a.596.568.206.9281.078.928
2
五年以上平均年贷款
利率%
.002b.391.708.146.9131.096.045
房屋空置率%
.002b.452.665.168.9141.094.049
torsintheModel:Constant;城市人口密度人/平方公里
torsintheModel:Constant;城市人口密度人/平方公里;城市居民人均可支配收入元
entVariable:商品房平均售价元/平方米
CollinearityDiagnosticsa
ModelDimensionEigenvalueConditionIndex
VarianceProportions
Constant
城市人口密度
人/平方公里
城市居民人均可
支配收入元
111.8981.000.05.05
2.1024.319.95.95
212.8911.000.00.00.00
2.1065.213.21.03.00
3.00330.736.78.971.00
entVariable:商品房平均售价元/平方米
该表为回归模型的残差统计量;标准化残差al的绝对值
最大为1.659;没有超过默认值3;不能发现奇异值..
8.回归标准化残差的直方图
该图为回归标准化残差的直方图;正态曲线也被显示在直方图上;用以
判断标准化残差是否呈正态分布..但是由于样本数只有11个;所以只能大
概判断其呈正态分布..
ResidualsStatisticsa
ionN
PredictedValue3394.718382.835465.641957.30211
Residual-47.03540.271.00025.35711
tedValue-1.0581.490.0001.00011
al-1.6591.420.000.89411
entVariable:商品房平均售价元/平方米
9.回归标准化的正态P-P图
该图回归标准化的正态P-P图;该图给出了观测值的残差分布与假设
的正态分布的比较;由图可知标准化残差散点分布靠近直线;因而可判断标
准化残差呈正态分布..
10.因变量与回归标准化预测值的散点图
该图显示的是因变量与回归标准化预测值的散点图;其中DEPENDENT
为x轴变量;ZPRED为y轴变量..由图可见;两变量呈直线趋势..
附件:
原始数据:
自变量散点图:
由散点图可以看出;可进入分析的变量为城市人口密度、城市居民人均可支配收入..