第23卷第1期2021年1月
Vol.23No.1
Jan.2021交通科技与经济
Technology1Economy in Areas of Communications
DOI:10.19348/jki.issnl008-5696.2021.01.008
基于改进Compertz-PCA的汽车保有量联合预测
杜丹丰,贾金航
(东北林业大学交通学院,黑龙江哈尔滨150040)
摘要:立足汽车行业,整理我国2005—2019年有关汽车保有量的相关面板数据,使用PCA方法分析,确定营运公交数、轨道交通公里数、公路里程数、城市化率、汽车报废量、社会消费品零售总额、汽车
销售量、人均GDP、国民生产总值9项因素为汽车保有量影响因素。利用PCA分析后得出的7项主要影响因素构建汽车保有量综合影响指标M,借鉴国际上通用的饱和指标,结合Compertz曲线模型对我国未来20年汽车保有量的发展趋势进行预测,结合实际情况测算出我国汽车保有量。该模型由于引入综合影响指标M,所以在预测过程中考虑到更多的参数影响,提高预测精度。结果显示:我国汽车保有量已经在沿着Compertz曲线的轨迹发展,但并没有达到饱和点,即将处于成熟期,2031年汽车保有量将达到3.5亿辆。
关键词:汽车保有量*Compertz模型*PCA算法*综合影响指标M;预测分析
中图分类号:U491;F426文献标识码:A文章编号:1008-5696(2021)01-0047-07
Joint prediction of car ownership based on improved Compertz-PCA
DU Danf e ng,JIA J inhang
(College of Transportation,Northeast Forestry University,Harbinl50040,China)
Abstract:Basedontheperspectiveoftheautomotiveindustry"thispaperhascompiledrelevantpaneldata on the number of vehicles in China in the past15years from2005to2019,and analyzed the PCA method <ode<ermine<henumberofoperaingbuses,mileageofrail<ransi,highway miles,urbanizaionra<e, <o<alre
<ailsalesofconsumergoods,carsalevolume,volumeofinusevehicles,realpercapiaGDP,and grossnaionalproduc<,are<heinfluencingfac<orsofcarownership.And<heseven maininfluencing fac<orsob<ained af<er PCA analysis are used<o cons<ruc<a comprehensiveimpac<index M forcar ownership.In view of the internationally-used saturation indicators,a Compertz curve model is used to predict the development trend of China's car ownership in the next20years,calculating China's car ownership based on Chinas actual conditions.The model introduces a comprehensive influence index M, wh4chcantake4ntoaccountthe4nfluenceofmoreparameters4ntheforecastngprocessand4mprovethe accuracy of forecasting.The result shows that China's car ownership has been developing along the Comper<zcurve"bu<i hasno<reached<hesa<uraionpoin<"andiisabou<<obeinama<ureperiod.The car ownership wi l reach350mi l ion in2031.
Keywords:carownership*Comper<z model*PCA algorihm*comprehensiveimpac<index M*forecas< analysis
随着我国经济实力的迅猛提髙,到2019年底,我国民用汽车保有量已达到26150万辆,相较十年
收稿日期:2020-0911
基金项目:国家自然科学基金资助项目(51972050)
第一作者简介:杜丹丰(1972—)男,教授,博士,研究方向:汽车节能减排.前增加了近5倍)随着汽车保有量的增加,出现了城市拥堵、配套设施发展不足、能源短缺、环境污染等众多问题口3)因此,预测我国未来汽车保有量对城市发展战略布局具有重要指导意义。
汽车保有量预测模型主要包括灰神经网络
-48-交通科技与经济第23卷
模型、Logistic曲线组合预测模型⑷、灰马尔科夫模型、Gompertz模型等。吴文青等5在Simpson公式的基础上通过建立的灰神经网络模型对汽车保有量开展预测分析;戴学臻等6基于双重Logistic曲线模型对西安市汽车保有量进行预测;王玉环等7使用灰马尔科夫模型对郑州市保有量进行预测;杜传祥等8基于Gompertz模型利用最小二乘法确定参数,进行汽车保有量预测分析。基于Simpson的灰神经网络模型在预测过程中存在优化误差,且在分析权重时无法准确得出权重系数,预测精度不高。Logistic曲线组合预测模型在预测过程中偏向人口发展带来的影响#$,在参数选取时也存在困难。灰系统与马尔科夫模型相结合使用时,可利用的信息量较少,无法准确建立时间响应函数口0$,预测误差较大。相较于其他汽车保有量预测方法,Compertz-PCA预测模型能够在多因素影响下优化影响指标,充分考虑影响因素的广泛性和复杂性。同时,消除数据间的非线性关系,针对具有成长饱和点的发展模型进行预测,并具有较高的预测精度。
采用主成分分析法(PCA,Principal Component Analysis),对影响汽车保有量的关键因素进行分析,通过因子降维处理后使用较少的信息量概括出样本中的较全面信息3,从而优化处理数据过程。同时,将多个影响因素整合为几个具有代表性的影响因素。但在实际研究过程中,对一些时间跨度相对较长的数据预测时,如果采用年份作为变量会影响预测的准确性。因此,本研究利用得出的主要因素对汽车保有量的影响权重,采用归一思想构建出影响汽车保有量的综合指标M,并联合Comp-etz模型进行我国汽车保有量的预测分析。预测结果显示,采用改进PCA-Compertz模型的预测精度可以达到4%以内,预测结果更加准确。
1汽车保有量主成分
1.1主成分分析
PCA的主要思想是将相关程度较强的多个指标,经过线性变换后得到新的无关综合指标,同时最大程度上保持原有数据集的信息口2$。由多个自变量的最优组合共同预测或估计因变量,比只用一个自变量进行预测估计更有效、更符合实际口3$。在汽车保有量预测分析中,影响数据准确性的因素众多:营运公交车数量X1,轨道交通公里数X2,公路里程数X3,城市化率X4,社会消费品零售总额X5,汽车销售量X6,汽车报废量X7,人均GDP X8,国民生产总值X9。国家对汽车行业的政策制定、燃油动力采购价格变化等都可能使汽车保有量产生波动,各因素与汽车保有量之间的关系如图1所示)因此,通过整合分析
上述因素并借助SPSS软件进行主成分分析,得到关于汽车保有量的几个最重要关键影响指标。通过关键指标进行预测,不仅能够降低大范围数据的处理难度,也能够保证预测的准确性。
1.2主成分提取
通过对原数据进行主成分分析,并利用得到的新组合进行分析拟合,不仅能减少大量的数据处理工作,也能减少各因素之间存在多重共线性的可能,提高拟合精度口4$。适应性检验是主成分分析的必要前提,如表1所示,即KMO和Bartlett的球形 度检验。
表1KMO和Bartlett的球形度检验表
KMO取样适切性量数(0.836)
近似卡方431.329 Bartlett球形度检验自由度36
显著性).)))
一般来说,当KMO值大于0.5'Bartlett的球形度检验值小于0.05就可视为通过适用性检验。模型KMO).836、).5,Bartle t的
形度检验近似卡方值为431.329,显著性P值为0.000、小于0.05,通过了适用性检验,可以进行主成分提取分析。
采用析法得的公因方差2示,9项影响因素的提取值范围在87.0%〜99.8%之间,提取率只要大于70%的标准,就认为提取主成分的过程有效,提取结果成功,因此,成功提取到涵盖较多原始指标的信息主因素。确定提取的主成分个数主要受以下三方面影响:
1)提取的所有特征值大于某一特定特征值,一般设为1。
2)达到85%以上的主成分提取累计贡献率,即所提取的主成分要能够概括原有指标的绝大部分信息。在表3中主成分1的贡献值达到96.748%,足够描述影响程度。
3)考析产的,选取
所有因子及拐点后的第一个因子作为主成分。观察图2可以看出,组件1的特征值介于8〜10之间,组件2、3为拐点处,特征值递减,均小于1,故只有组件1(即主成分1)能满足要求。
对经过筛选的9个影响汽车保有量因素进行公
第1期杜丹丰,等:基于改进Compertz-PCA 的汽车保有量联合预测・49・
30 0007030 000
25 00020 000
15 00010 000
5 000-
亠汽车保有量
■65
B X
蠢瞅的tn
凹
6055504540
25 00020 00015 000
10 0005 000
E g 敲
養
Q o
o
o O
0 5 0 5 5 4 4 3550
<2006 2008 2010 2012 2014 2016 2018
年份
(a)营运公交数与汽车保有量关系■30
<———2006 2008 2010 2012 2014 2016 2018
年份
(b)公路里程与汽车保有量关系
30030 00025 00020 000
15 000
10 000
5 000
20062008 2010 2012 2014 2016 2018
年份
(C )城市化率与汽车保有量关系
30 00025 00020 000
15 00010 000
5 000
7 6 5 4 3 2
挥耳、*他超出虻
■ .......2006 2008 2010 2012 2014 2016 2018
年份
(d)汽车销售量与汽车保有量关系
10002006 2008 2010 2012 2014 2016 2018
蠢
删
ng
腿
年份
30 000
25 000
20 000
15 000
10 000
5 000
年份
(f)人均GDP 与汽车保有量关系
25 00020 00015 000
10 000
5 000
亠汽车保有量 十轨道交通公里数
o o o
O
o o o O o o o O 01510530 00025 000
(e)社会消费品零售总额与汽车保有量关系° 2006 2008 2010 2012 2014 2016 2018年份
(h)汽车报废量与汽车保有量关系1000
o o o O
o o o O 8 6 4 2° 2006 2008 2010 2012 2014 2016 2018
■0
30 00025 00020 000
15 000
10 000
5 000
100908070605040302010
2006 2008 2010 2012 2014 2016 2018
年份
(g)轨道交通公里数与汽车保有量关系年份
(i)国民生产总值与汽车保有量关系
图1各因素与汽车保有量关系
表2公因子方差表
因素
初始
提取
营运公交数(X 1)/万辆
1.0000.974轨道交通公里数(X 2&/104 km
1.0000.946
公路里程数(X 3&/104 km
1.0000.988城镇化率(X 4)/%
1.0000.980社会消费品零售总额(X 5 ) /亿元
1.0000.997
汽车销售量(X 6)/万辆 1.0000.870汽车报废量(X 7)/万辆
1.0000.958人均GDP(X 8)/万元 1.000
0.998民产总(X 9)/
1.000
0.998
13 分分
由表4可知,主成分1与营运公交数、轨道交通出
1的 因素有一个,而且这一主
因素能够解释原有
96. 748%的数据,公
因子提取
。
公里数、公路
、城 率、社会消费品零售总
、汽 量、汽车报废量、人均GDP 、国民生产
总
现正相关,可见
1
盖了交
・50・交通科技与经济第23卷
通设施与经济发展的因子。3,可
知1的累计率达到96.748%,且所有因
素系数0.8,由认为主成分1为我
汽有量发展情况的综合体现。
表3总方差解释表
成分
初始特征提取载荷
总计值方差
/%
累计/%总计方方差
/%
累计/%
18.7796.74896.7488.7796.74896.748
2.248 2.75699.53
3.250.27899.781
40.0110.12499.95
5.4.4299.947
6.2.2499.971
7.10.01799.988
8.1.1199.999
9.1.1100.00
表4成分矩阵表
因素1
营运公交数0.987
轨道交通公里数0.943
公路里程数0.994
城镇化率0.990
社会消费品零售总额0.998
汽车销售量0.933
汽车报废量0.979
人均GDP0.999
国民生产总值0.999
14保有量重指标
通过以上主成分分析得到的成分矩阵,选择成分得0.94的各因素建立权重模型,即选择营公交数、轨道交通公里数、公路数、城市化率、社会消总额、汽车报废量、人均GDP、民生产总因素得出综合模型中的;系数,为析过程,将因素作归一:理。
认权重过需要以下步骤:
1&各性组合中的系数;
2&的方差率;
3)指标权重的归一化。
根据以下权重公式,进行归一化后得到如表5的各因素权重
F=62V j.(1)式中:F为影响因素权重值6j为各指标成分系数,#为提取载荷合计值V j为初始特征值累计百比。
表5归一化后各因素权重表
因素一权重
公交数0.112
轨道交通公数.17
公路数0.113
城率0.112
消总0.113
汽报废量0.110
人GDP0.113
民产总0.113
2构建综合指标与模型
2・1构建Compertz模型
采用Compertz模型做汽车保有量预测是由:一方面,它比模型更,文设定的综M在不同的阶段中,Compertz模型现出一定的饱和状态;另一方面,Compertz 模型的特性,从其函数公式以看出Compertz 模型的变度不的,其增长速度呈现出快
慢,直至饱和值停止的趋势口",Compertz模型的基本公式为
Y%=.(2)式中:K为汽有量最终的饱和,取’在模型估计前确定q H为待估参数;为时间变量,随的增长。
数Q决定曲线的,参数H决近线的斜率同时决定了增长速度与饱和极限,其值通介于0〜1为,其曲
3,其中%为横坐标,X为纵坐标。
0(Lnb/d)
k亠•..
....*-•
k/e
…,..y
•・・••
图3Compertz曲线形状
汽车的市场保有状态和商品一样,都有其长曲线,经初始、迅速壮大、瓦饱和的过程。通过以现,汽
第1期杜丹丰,等:基于改进Compertz-PCA的汽车保有量联合预测・51・
有量和人正比例相关"旦汽有量受不因素。运用Compertz模型对汽有量,通过综M出遵循汽有量周期的S型曲线,更具有广泛性"度更高。
2・2构建综合指标
汽有量预测过,与预测量有关的因素众多,在多重因素下,仅序列的数据堆积测"测的误差’度无法保证。将以上各因素与%结,得到一的综弋替模型变量的取值,则能够出与汽有量相关的各因素有量的。提出一种新的法代替关%的函数,可得一各因素的权重,九项因素汽有量的度一定差距。过,为提高度,提出改进因素的方法。
以统计数据中2005年的各因素数据为,建立以下模型,得出年度综M值,如表6所示。
M%=兽阿。.⑶
%
M t="8=1M%$⑷式中:M%为%年(因素的影响指标,P%为%年(因素的数据值丁%十1为%+1年(因素的数据值M为(因素2005年归一化权重。
表6年度综合影响指标M
年份252627282921211212213214215216217218219综
指标(M)
1. 1.16 1.31 1.43 1.56 1.81
2.7 2.24 2.56 2.78
3. 3.36 3.76 3.97
4.39
3汽车模型检验与分析
3.1饱和水平的设定及拟合
一些,国际上通常将K值为0.62设置为汽有量的饱和点"旦在一些发展家由于经济政策限制,虽一定高度,但仍然无法饱和。Button曾经将'入的饱和设定为0.3〜0.45的连续区18$"高的发展
配的饱和水平。
依据Tanner的饱和水平估计技术,将我国汽车保有量饱和水平设定在0.5〜0.62的内,得出4的效果。
根据输出的以看出,R-square为0.9987,趋近于1表明综合指数M可以解释99%的我国汽有量变化,因此,可用此模型对我国未来汽有量测。
7,我国汽有量的预测值和实际值的误差应控制在4%以内,说模型的建立为,可以对我国未来汽有量发展趋势进测。
3・2保有量标预测
计“十四五”时期我内汽产总值环比增长速度为5%左右,这是一趋势“20。我汽车报废量在2005年、2008年有小幅下降"旦总体呈现趋势,利用序列法中的移法
X汽车保有量拟合曲线
5
5
5
2
2
L
L
O.
•y vs.x
—拟合曲线
1.0 1.5
汽车综合2.0 2.5
3.0 3.5
4.0 4.5
指标m
$esults
General model:
ffx)=k*exp(-a*exp(-b*x))
Coefficients(with95%confidence bounds):
a=4.238(3.997,4.48)
b=0.5375(0.4788,0.5962)
k=3.765e+04(3.394e+04,4.136e+04)
Goodness of fit:
SSE:9.734e+05
R-square:0.9987
Adjusted R-square:0.9985
RMSE:284.8
图4汽车保有量拟合
来预测汽车报废量的长期变动趋势。近年来,我国城市,截至2019年末,我国总人到14.0005亿,城人口8.4843亿,城率达
60.60%。城市展使得我交通设施建设的需求"艮据《国家高速公路网7我高速公路覆盖将逐步"(覆盖全国一半
发布评论