PM2.5浓度影响因素的主成分回归分析
张红;董小刚;李
【摘 要】选取全国31个城市,对空气中细颗粒物(PM 2.5)浓度的影响因素进行分析.为处理自变量之间存在的共线性,选用主成分回归.确定主成分的个数,将原自变量的主成分代替原自变量进行回归分析.总结出造成空气中细颗粒物(PM 2.5)浓度上升的因素分为两方面,直接因素中二氧化氮浓度和间接因素中汽车数量.
【期刊名称】《长春工业大学学报(自然科学版)》
【年(卷),期】2017(038)002
【总页数】6页(P105-110)
【关键词】PM2.5;主成分分析法;回归分析
【作 者】张红;董小刚;李
【作者单位】长春工业大学 基础科学学院, 吉林 长春 130012;长春工业大学 基础科学学院, 吉林 长春 130012;长春工业大学 基础科学学院, 吉林 长春 130012
【正文语种】中 文
【中图分类】O212
近年来雾霾天气越来越严重,尤其是人口聚居的城市地区,雾霾中混杂着有害物质,对健康产生直接危害。细颗粒物(PM2.5)是构成霾的主要成分,与较粗的大气颗粒物相比,细颗粒物(PM2.5)粒径小,面积大,活性强,易附带有毒、有害物质(例如重金属、细菌等),且在大气中的停留时间长,输送距离远。人体的鼻腔、咽喉挡不住,它们可以一路下行,进入细支气管、肺泡,再通过肺泡壁进入毛细血管,再进入整个血液循环系统。对人体的呼吸系统和心血管系统造成伤害。所以,治理雾霾的关键就是解决细颗粒物(PM2.5)问题[1]。
城市空气中有毒颗粒物的来源如下:
1)汽车尾气。使用柴油的大型车大量排放PM10,使用汽油的小型车虽然排放的是气态污染物,比如氮氧化物等,但碰上雾天,也很容易转化为二次颗粒污染物。
2)北方冬季烧煤供暖所产生的废气。
3)工业生产排放的废气。比如冶金、窑炉与锅炉、机电制造业,还有大量汽修喷漆、建材生产、窑炉燃烧排放的废气。
4)建筑工地和道路交通产生的扬尘。
5)可生长颗粒,细菌和病毒的粒径相当于PM0.1~PM 2.5,空气中的湿度和温度适宜时,微生物会附着在颗粒物上,特别是油烟的颗粒物上,微生物吸收油滴后转化成更多的微生物,使得空气中的生物有毒物质生长增多。
6)家庭装修中产生的粉尘。现在很多城市的空气污染物排放水平已处于临界点,对气象条件非常敏感,空气质量在扩散条件较好时能达标,一旦遭遇不利天气条件,空气质量和能见度就会立刻下滑。
不同城市空气中细颗粒物(PM2.5)浓度有很大的差异,这与每个城市所处的地理位置、气候以及人们的行为活动有很大的关系。选取全国31个主要城市,分别为北京、天津、石家庄、太原、呼和浩特、沈阳、长春、哈尔滨、上海、南京、杭州、合肥、福州、南昌、济南、郑
州、武汉、长沙、广州、南宁、海口、重庆、成都、贵阳、昆明、拉萨、西安、兰州、西宁、银川、乌鲁木齐,分析不同因素对空气中细颗粒物(PM2.5)浓度的影响。
造成细颗粒物(PM2.5)浓度上升的原因很多,有直接的因素,也有间接的因素。根据现有理论和检测结果,文中将细颗粒物(PM2.5)浓度的影响因素概括为17个方面。间接的因素有:平均温度、平均湿度、降水量、日照时长、工业二氧化硫排放量、工业氮氧化物排放量、工业烟(粉)尘排放量、生活二氧化硫排放量、生活氮氧化物排放量、生活烟尘排放量、汽车总量。直接的因素有:二氧化硫年平均浓度、二氧化氮年平均浓度、可吸入颗粒物(PM10)年平均浓度、一氧化碳日均值第95百分位浓度、臭氧(O3)日最大8 h第90百分位浓度、空气质量达到及好于二级的天数。
确定了造成细颗粒物(PM2.5)浓度上升的因素后,可以建立多元线性回归模型[2] :
y=  α0+α1x1+α2x2+α3x3+α4x4+α5x5+α6x6+α7x7+α8x8+α9x9+
式中:  y----因变量,细颗粒物(PM2.5)年平均浓度;
x1----平均温度,℃;
x2----平均湿度;
x3----降水量;
x4----日照时长;
x5----工业二氧化硫排放量,t;
x6----工业氮氧化物排放量,t;
x7----工业烟(粉)尘排放量,t;
x8----生活二氧化硫排放量,t;
x9----生活氮氧化物排放量,t;
x10----生活烟尘排放量,t;
x11----二氧化硫年平均浓度,μg/m3;
x12----二氧化氮年平均浓度,μg/m3;
x13----可吸入颗粒物(PM10)年平均浓度,μg/m3;
x14----一氧化碳日均值第95百分位浓度,μg/m3;
x15----臭氧(O3)日最大8 h第90百分位浓度,μg/m3;
x16----空气质量达到及好于二级的天数;
x17----汽车总量,万辆。
汽车尾气成分文中数据来源于文献[3]。
对因变量与所有自变量做相关分析,相关系数矩阵说明自变量与因变量之间有较大的相关关系,分析结果见表1。
直接做最小二乘回归,得到结果见表2。
对回归模型的检验中P值小于0.01,说明该回归模型适合该数据的分析,结果见表3。
对数据做共线性诊断,结果见表4。
从表4中可以看出,很多条件指数都超过10,说明变量之间共线性很大[4]。
主成分回归的基本思想是将线性相关的一类变量转化为线性无关的一类新的综合变量,这些综合变量反映原来多个变量的信息,主成分回归是选取其中较少的几个新的综合变量建立模型回归方程。主成分回归的方法步骤如下:
1)对自变量数据进行标准化变换;
2)计算相关系数矩阵;
3)计算相关矩阵的特征值及对应的特征向量;
4)计算主成分贡献率并选择合适的主成分;
5)计算主成分载荷与得分;
6)利用所选主成分进行回归分析[5-6]。
运用统计软件SAS9.4对影响PM2.5浓度的各因素进行主成分分析,结果见表5。
从表5中可知,第1主成分的特征根为5.573,解释了总变异的32.78%;第2主成分的特征根为3.395,解释了总变异的19.97%;第3主成分的特征根为2.814,解释了总变异的16.55%;第4主成分的特征根为1.685,解释了总变异的9.92%。前4个特征根的累计贡献率达到79.23%,说明前4个主成分已经反映原来17个指标79.23%的信息,因此确定选择前4个主成分建立模型。提取的前4个主成分F1,F2,F3,F4见表6。
以4个主成分F1,F2,F3,F4为自变量进行多元线性回归分析,建立回归模型:
方差分析结果见表7。
R2为0.841 2,调整R2为0.816 8,说明模型拟合较好。最后,将4个主成分表达式代入,得到最终的主成分回归方程:
从主成分回归方程可以看出,直接影响因素对细颗粒物(PM2.5)浓度影响比较大。空气中污染物浓度的上升直接导致细颗粒物(PM2.5)浓度上升,其中二氧化氮的浓度(x12)对细颗粒物(PM2.5)浓度影响最大,可吸入颗粒物(PM10)的浓度(x13)对细颗粒物(PM 2.5)浓度影响次之,而二氧化硫年平均浓度(x11)、一氧化碳日均值第95百分位浓度(x14)、臭氧(O3)日最大8
h第90百分位浓度(x15)对细颗粒物(PM 2.5)浓度影响较小。空气质量达到及好于二级的天数与对细颗粒物(PM2.5)浓度是负相关的。
间接影响因素对细颗粒物(PM2.5)浓度影响比较小。但是汽车总量(x17)作为间接影响因素对细颗粒物(PM2.5)浓度影响非常大,废气的排放中,生活氮氧化物排放量(x9)和生活烟尘排放量(x10)对细颗粒物(PM2.5)浓度影响比较大,工业二氧化硫排放量(x5)、工业氮氧化物排放量(x6)和生活二氧化硫排放量(x8)对细颗粒物(PM2.5)浓度影响较小,工业烟(粉)尘排放量(x7)对细颗粒物(PM2.5)浓度影响很小,甚至有了负相关。天气因素中温度(x1)、湿度(x2)、降水量(x3)、日照时长(x4)对细颗粒物(PM2.5)浓度影响都很小。温度(x1)越高,湿度(x2)越大,细颗粒物(PM2.5)浓度越大,降水量(x3)越小,日照时长(x4)越短,细颗粒物(PM2.5)浓度越小。
根据实证分析结果,温度、湿度对细颗粒物(PM2.5)有一定的影响,温度越高,湿度越大,越有利于空气中颗粒物的形成。但这个因素是人为无法控制的。降低细颗粒物(PM2.5)浓度应该降低空气中二氧化氮、可吸入颗粒物(PM10)、二氧化硫、一氧化碳、臭氧的浓度。措施如下: