研究汽车销量与汽车特征的关系
一、研究的经济意义
    近年来,随着人们生活水平的提高,越来越多的人们热衷于购买汽车来满足自己的消费需求,而汽车的销量与汽车的各项特征有密切联系,通过本次研究,可以看出特征对销量的影响。
二、数据来源
三、变量与模型设定
将“销售量”作为“因变量”,将“车长,车宽,耗油率,车净重等7作为自变量
则回归方程(i=17)
四、参数估计
对模型做普通最小二乘估计得下表
输入/移去的变量
模型
输入的变量
移去的变量
方法
1
车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机a
.
输入
a. 已输入所有请求的变量。
模型汇总
模型
R
R
调整 R
标准 估计的误差
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.680a
.462
.211
35.481273
.462
1.839
7
15
2月汽车销量.152
a. 预测变量: (常量), 车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
16208.824
7
2315.546
1.839
.152a
残差
18883.811
15
1258.921
总计
35092.635
22
a. 预测变量: (常量), 车长, 二手销量, 价格, 车轮轴距, 马力, 车宽, 发动机。
b. 因变量: 新车销量
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-242.074
457.240
-.529
.604
二手销量
-.228
1.352
-.057
-.168
.869
价格
-1.100
1.073
-.360
-1.025
.322
发动机
6.468
31.558
.153
.205
.840
马力
-.350
.492
-.421
-.712
.487
车轮轴距
4.577
3.296
.454
1.389
.185
车宽
-4.083
5.981
-.291
-.683
.505
车长
.824
1.759
.205
.469
.646
得到如下模型:
进行t检验可知,由于p值过大,未通过t检验,进行几次剔除分别将二手销量,发动机,车长,车宽删除。得到如下结果:
模型汇总
模型
R
R
调整 R
标准 估计的误差
更改统计量
R 方更改
F 更改
df1
df2
Sig. F 更改
1
.665a
.442
.354
32.095029
.442
5.023
3
19
.010
a. 预测变量: (常量), 车轮轴距, 马力, 价格。
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
15520.908
3
5173.636
5.023
.010a
残差
19571.727
19
1030.091
总计
35092.635
22
a. 预测变量: (常量), 车轮轴距, 马力, 价格。
b. 因变量: 新车销量
系数a
模型
非标准化系数
标准系数
t
Sig.
B
标准 误差
试用版
1
(常量)
-456.300
210.310
-2.170
.043
价格
-1.473
.750
-.482
-1.963
.064
马力
-.287
.199
-.345
-1.442
.166
车轮轴距
5.443
2.022
.541
2.692
.014
a. 因变量: 新车销量
P值在显著性水平0.1下近似通过,所以通过t和f检验。得到新回归方程:
五、残差分析
由未标准化残差的到残差图:
根据图的形态分布,推测可能存在异常值。
通过进行删除化残差,学生化残差,学生删除化残差,库克距离,杠杆值的计算,得到如下表:
通过检验学生删除化残差,第21个数据|SDR|=3.3226>3 中心化杠杆值ch=0.04988<2 D=0.18594<0.5 所以认为第21个数据为对于因变量的异常值,而不是关于自变量的异常值。
六、异方差检验
将价格,马力,车轮轴距与残差绝对值做等级相关系数检验得到如下结果:
相关系数
价格
马力
车轮轴距
abse
Spearman rho
价格
相关系数
1.000
.706**
.554**
-.217
Sig.(双侧)
.
.000
.006
.319
N
23
23
23
23
马力
相关系数
.706**
1.000
.484*
-.025
Sig.(双侧)
.000
.
.019
.909
N
23
23
23
23
车轮轴距
相关系数
.554**
.484*
1.000
.356
Sig.(双侧)
.006
.019
.
.095
N
23
23
23
23
abse
相关系数
-.217
-.025
.356
1.000
Sig.(双侧)
.319
.909
.095
.
N
23
23
23
23
**. 在置信度(双测)为 0.01 时,相关性是显著的。
*. 在置信度(双测)为 0.05 时,相关性是显著的。
从表中得知:残差绝对值与自变量不存在异方差。