在数据分析领域,SPSSVIF检验可以帮助研究者判断多个变量之间是否存在高度共线性的情况,由此来筛选和删除共线性较强的数据组,进而优化和改良相关数据的回归方程模型。


一、SPSS如何做VIF检验

如果我们采集的数据包含多个自变量和一个因变量,并且想要了解这些自变量之间是否具有高度共线性的问题,可以使用SPSS回归方程的方法来进行VIF检验。需要注意的是,SPSSVIF检验对数据变量有着一定要求,因变量为一个连续变量,自变量为两个或两个以上的连续变量,满足上述条件才能够正常运行VIF检验的功能。


1、下图是某手机芯片部件的研发投入数据,已知器械精准率作为因变量,需要检测研发时长、单件年均损耗、年研发投入这三列数据组之间是否存在高度共线性的问题。所以首先找到SPSS回归分析的功能模块,点击其中的【线性】按键,进入VIF检验的指令操作页面。


1:某款手机芯片研发数据


2、在线性回归的应用功能页面,首先把器械精准率的数据放入因变量的内容框中,再把年研发投入、单件年均损耗、研发时长三组数据放入块,完成共线性检验的变量选项设置,这样就可以根据后续的统计结果来判断年研发投入、单件年均损耗、研发时长三组变量之间的关系。


2:器械精准率作为因变量


3、接下来进入线性回归的统计模块,在回归系数的显示栏选择估算值,然后勾选下图右侧的共线性诊断、描述、R方变化量、模型拟合四个选项,并在残差的内容框中选择德宾沃森模式,之后便能获得模型摘要、单因素分析、共线性诊断等相应结果。


3:选择估算值

4、为了查看该手机芯片的研发数据在整体上是否符合正态分布,我们需要在线性回归的图设置中选择DEPENDNT模式,并选择以正态概率图形式来呈现的标准化残差图。


4:正态分布和残差图


二、SPSS VIF检验结果怎么看


SPSS共线性诊断的结果主要看残差图、模型摘要R方值和显著性数值、单因素方差分析表格、回归模型系数这几个统计结果,如果VIF值大于5,表示各类变量之间存在高度相关性的情况,需要考虑剔除或更换相关数据。


1、在因变量为器械精准率的回归标准化残差图中,数值点基本排布在下图直线上,表示该手机芯片的研发数据符合正态分布的情况,可以根据后续的模型摘要、方差分析、回归系数等结果来判断年研发投入、单件年均损耗、研发时长三组变量之间的关系。


5:研发数据符合正态分布的情况


2、接下来我们看一下SPSS模型摘要表格,R方值为0.981,调整后R方值为0.978R方值越接近1表明数据模型的拟合度越好。德宾沃森数值为0.871,显著性数值小于0.001,这表示研发时长、年研发投入、单件年均损耗这些变量中至少有一个变量能够显著预测因变量器械精准率的变化。

 

6R方值为0.981


3、在手机研发数据的ANOVA表格中,因变量为器械精准率,预测变量为研发时长、年研发投入、单件年均损耗,回归平方和为5420.998,均方为1806.999,显著性数值小于0.001表明数据模型建构具备合理性,可以根据后续的分析结果进行进一步的判断。


7:回归平方和和显著性数值


4、在最后的系数表格中,年研发投入的标准化系数为0.562,显著性数值小于0.001,单件年均损耗的标准化系数为0.470,显著性数值小于0.001,表示年研发投入和单件年均损耗这两个变量对器械精准率有显著影响。与此同时,年研发投入和单件年均损耗的VIF数值分别为5.4765.845,表明两个变量存在高度相关的关系。



8:年研发投入和单件年均损耗的VIF值过高


三、小结

以上就是SPSS如何做VIF检验,SPSS VIF检验结果怎么看的解答。如果需要了解多个连续数值变量之间是否存在高度相关关系的情况,可以使用SPSS回归分析的方法计算VIF数值来进一步判断和分析。