2021年(第43卷)第1期汽车工程
Automotive Engineering2021(Vol.43)No.1基于数据驱动的电动汽车动力电池SOC预测*
胡杰,高志文
(1.武汉理工大学,现代汽车零部件技术湖北省重点实验室,武汉430070;
2.武汉理工大学,汽车零部件技术湖北省协同创新中心,武汉430070;
3.新能源与智能网联车湖北工程技术研究中心,武汉430070)
[摘要]为准确预测电动汽车动力电池的能耗,缓解驾驶者的里程焦虑,本文中提出一种基于数据驱动的电动汽车动力电池SOC预测模型。首先分析电动汽车能耗构成并提取能耗影响因素,接着基于某款电动出租车CAN总线采集的汽车运行数据,采用机器学习算法,提出基于温度分层的能耗模型,通过宏观数据与微观数据的融合减小误差,最后使用该模型对车载BMS提供的SOC数据进行对比验证。结果表明,该模型预测效果较好,为帮助优化电动汽车能量控制策略、缓解里程焦虑提供科学的决策支持。
关键词:电动汽车;SOC预测;数据驱动;机器学习
A Data-driven SOC Prediction Scheme for Traction Battery in Electric Vehicles
Hu Jie&Gao Zhiwen
1.Wuhan University of Technology,Hubei Key Laboratory of Modern Auto Parts Technology,Wuhan430070;
2.Wuhan University of Technology,Auto Parts Technology Hubei Collaborative Innovation Center,Wuhan430070;
3.Hubei Technology Research Center of New Energy and Intelligent Connected Vehicle Engineering,Wuhan430070
[Abstract]In order to accurately predict the energy consumption of traction battery in electric vehicle (EV)and alleviate the mileage anxiety of drivers,a data⁃driven SOC prediction model for the traction battery in EV is proposed in this paper.Firstly,the composition of energy consumption in EVs is analyzed and the influencing fac⁃tors of energy consumption are extracted.Then based on the vehicle operation data collected by the CAN bus of an EV with machine learning algorithm adopted,an energy consumption model based on temperature stratification is proposed and the macro data and micro data is fused to reduce errors.Finally,the model is used to verify the SOC data provided by on-board BMS.The results show that the model has a good prediction result,providing a scientifi
c decision support for optimizing the energy control strategy of EVs and alleviating driver’s mileage anxiety.
Keywords:electric vehicle;SOC prediction;data‑driven;machine learning
前言
近年来,新能源汽车逐渐成为汽车工业的发展趋势,也是我国战略性新兴产业之一。但是其续驶里程短,充电设施少和电池能量密度低等问题仍阻碍电动汽车产业的发展[1]。为解决市场和用户对电动汽车能耗及续驶里程的担忧,除须推进电池技术的研发以及充电设施和电网的覆盖,还须基于实际运行数据对电动汽车能耗进行研究,以提高电池能量的利用率[2]。
为准确预测电动汽车动力电池能耗,国内外学者做了大量研究。其中Ng等[3]首次提出安时积分法,该方法通过对电池充放电电流积分得到电池充放电能量,实现剩余电池容量的实时计算。Lee等[4]对电池长时间静置下的开路电压与电池SOC进行线
doi:10.19562/j.chinasae.qcgc.2021.01.001
*柳州市重点研发计划项目(2018BC20501)资助。
原稿收到日期为2020年3月29日,修改稿收到日期为2020年6月28日。
通信作者:胡杰,博士生导师,副教授,E-mail:auto_hj@163。
汽车工程2021年(第43卷)第1期
性分析,通过测量电压计算SOC值。李革臣等[5]使用内阻法,通过分析电池内阻与SOC的特定关系进行预测。Fang等[6]提出基于卡尔曼滤波的方法,该方法在建立等效电池模型基础上建立卡尔曼滤波状态方程与观测方程,将SOC作为状态参数进行预测。在此基础上Zhang等[7]提出一种基于扩展卡尔曼滤波算法与Rint模型相结合的SOC预测方法,可以有效减少计算量。Fan等[8]提出结合安时积分法和
EKF算法,将工作电压和电池SOC作为观测变量和状态变量,并通过递归最小二乘法确定模型参数,提高预测精度。在人工智能迅速发展的今天,智能算法也被用于动力电池的能耗预测。He等[9]开发了基于人工神经网络的电池模型,根据测量的电流和电压预测SOC。Kang等[10]提出一种径向基函数神经网络模型用于消除电池退化对原始训练模型精度的影响。Liu等[11]提出一种用于电池剩余能量估计的反向传播神经网络。Alvarez Anton等[12]使用支持向量机方法从实验数据集预测电池SOC。Hu等[13]提出基于双重搜索优化过程的优化支持向量回归机的SOC预测方法。鲍伟等[14]提出使用支持向量机与贝叶斯优化的方法对电动公交车SOC进行自主预测。
综上所述,目前主流SOC预测方法大多使用电池内部复杂电化学参数进行预测,主要侧重研究电池内
部机理与物理特征,而对于汽车实际行驶工况与参数的可测量性以及实际路网中交通参数的结合研究较少[15]。汽车实际行驶时工况变化频繁,在不同工况下能耗差异较大,且复杂电化学参数在汽车实际行驶过程中测量困难。因此在上述研究的基础上,通过数据驱动的方法进行SOC预测,并将预测的SOC值与实际上传的车载BMS估计的SOC值进行相互佐证,为优化动力电池能量管理、发现电池能耗规律、提高能量利用率提供科学依据。
1电动汽车数据采集
1.1电动汽车数据采集流程
所使用数据为某新能源公司已投放使用的电动出租车在2018-2019年内的实际运行数据,数据采集频率为0.1Hz。数据由安装在汽车上的车载数据采集设备获取,数据传输按照GB/T32960《电动汽车远程服务与管理系统技术规范》执行,车载数据采集设备由车载诊断系统(OBD)接口供电。当车辆启动后车载诊断系统从车辆的CAN总线中实时读取车辆运行状态参数,同时利用定位系统(GPS)获取车辆位置数据,数据的采集频率可以根据需要进行调节。采集的数据符合国家标准的TCP通信协议,数据以数据流的形式通过无线网络传输到监控平台,参照GB/T32960将所需要的信息解码,最终形成可以利用的数据。数据的采集处理流程如图1所示,仅对数据应用层研究部分进行详细说明。
电动汽车SOC是指电动汽车动力电池剩余容量与总容量之比[16],即电池剩余可用电量,计算公式
SOC=
Q remain
Q discharged+Q remain×100%(1)式中:Q remain为电池中剩余的电池电荷容量;Q discharged为最近一次充满电后电池中已经放掉的电荷量。
1.2电动汽车能耗构成分析
为准确预测电动汽车动力电池能耗,首先须提取能耗相关影响因素。因此对电动汽车行驶中的能耗构成进行分析[17],具体如下。
电动汽车行驶模型如图2所示。当汽车从A点
移动到B点的过程中,电池所消耗的能量E
总耗能
可以
分解为牵引力做功E
牵引
、空调能耗E
空调
和其他附件
能耗E
其他
,而牵引力做功所消耗的能量又分为汽车
行驶过程中动能变化ΔE
动能
、重力势能变化ΔE
重力势能
克服道路滚动阻力耗能E
滚阻
、克服行驶过程中风阻
耗能E
风阻
和传动系统能量损失E
传动损失
E
总耗能=E牵引+E空调+E其他(2)E
牵引=ΔE动能+ΔE重力势能+E滚阻+E风阻+E传动损失(3)假设道路滚动阻力系数f与坡度角θ为常数,且E
风阻
与E
传动损失
之和与E
牵引
成正比,比例为λ,因此由动力学公式可以推导化简为
E
牵引≈α+βΔE动能(4)其中α=
mg(tanθ+f)L
1-λ,β=
1
(1-λ),
均为常数。
图1电动汽车数据采集处理流程
2
2021(Vol.43)No.1胡杰,等:基于数据驱动的电动汽车动力电池SOC 预测因此电动汽车行驶中能耗构成为E 总耗能≈α+βΔE 动能+E 空调+E 其他
(5)
由上述分析可以得出,电动汽车动力电池能耗主要与动能变化和空调耗能有关。其中动能变化由汽车的行驶速度决定。而空调能耗在一般行驶工况下占整车能耗的10%~20%,怠速情况下占比为77.08%[18],且与外界温度直接相关,但通过车载终端无法直接获取外界温度信息,考虑使用经纬度与
时间信息结合并通过爬虫技术进行温度匹配,而汽车的运行工况与电池工作工况又可通过电压电流进行表征,因此须提取上述能耗参数进行后续的分析与建模。
对原始数据进行能耗参数提取,并通过解码后的数据格式如表1所示。其中共提取5辆同款电动出租车在一年内的实际运行数据作为实验数据来源,有效数据共有3000多万条。
2
电动汽车数据预处理
2.1
数据可视化
绘制部分数据的SOC 分布如图3所示。由于汽
车行驶数据是通过传感器进行采集,传感器信号可能存在延迟和丢失等情况造成数据的异常与缺失,因此需对异常数据进行处理。
2.2数据清洗
由图3可知,采集数据中包含大量充电数据,本
文通过判断连续的静止片段内是否出现电流为负来筛选充电片段并进行删除处理,还对图4中里程为0的异常值与缺失值进行线性插值填补。
汽车的实际行驶数据由多个运动片段组成,电动汽车的运动学片段定义为车辆从停车开始到下一次停
车开始的运动[19],且通过运动学片段的特征数能够把握片段的主要属性。因此对行驶数据进行切片处理,使单条数据转换为运动学片段,
每个运动学
图2
电动汽车行驶模型
表1
数据信息格式说明
列名
time speed mileage voltage current SOC longitude latitude
单位
YYYYMMDDhhmmss
(Y-年,M-月份,D-日期,
h-时,m-分,s-秒)
km/h km V A %(°)(°)
说明
实时数据时间
实时车速累计里程总电压总电流荷电状态经度
纬度
图3
SOC
变化分布
图4行驶里程变化分布
3
汽车工程2021年(第43卷)第1期
片段均由停车、匀速、加速和减速4种行为构成。2.3
基于变量解耦的数据同分布
采集数据中训练数据集与测试数据集分布图如图5~图8所示,其中μ、σ、skew 、kurtosis 分别代表数据分布的均值、方差、峰度以及偏度,两条曲线分别为样本实际分布和拟合标准正态分布(Normal dist.)。由于目前多数机器学习算法须保证训练集与测试集的数据呈独立同分布,以使所训练的样本具有总体代表性,减小因训练集中的个例样本而导致的模型误差增大,但此数据下的SOC 和片段行驶里程特征表现为耦合状态。
因此本文中提出了一种基于分箱处理的滑动窗口重采样方法,实现对多维变量耦合分布的解耦处理。
该方案同时考虑了行程片段的起始SOC 和片段行驶里程的影响,分箱方式如表2所示。对于运动学片段的起始SOC 和行驶里程进行分段,考虑到算法效率与精度的结合,将起始SOC 在20%以上数据分为8段,标记为A-H ,将行驶里程分为6段,标记为a-f 。事实上当SOC 达到20%以下时,驾驶员应即刻去进行充电而不是选择继续行驶,但考虑到数据完
整性,本文也将SOC 为20%以下的数据考虑在内,并将其标记为X 。
为使训练集与测试集同分布,并扩充训练集数据样本个数,采用基于滑动窗口重采样的方法对训练集样本进行重采样,可以得到大量新的运动学片段,将重采样数据与原始训练集合并后,根据测试集分布重新扩充原始的训练集,扩充结果如图9和图10所示,
此时训练集与测试集近似同分布。
图5目标测试集SOC
分布
图6
目标测试集里程分布图7
训练数据集SOC
分布
图8训练数据集里程分布
表2
SOC 与里程分箱表
里程/km 0~2020~35
…65~8080以上
SOC /%
0~20Xa Xb …Xe Xf
20~30Aa Ab …Ae Af
………………
80~90Ga Gb …Ge Gf
90~100Ha Hb …He Hf
4
2021(Vol.43)No.1胡杰,等:基于数据驱动的电动汽车动力电池SOC 预测3能耗特征构建与选择
机器学习中,为使算法达到最优性能,须通过特
征工程对数据进行处理使原始数据转化为特征,从而对数据中所包含的信息进行充分挖掘,使模型能够更好地进行学习。因此须构造动力电池能耗相关特征,以便模型进行学习与训练。3.1
能耗特征构建
由于电动汽车在不同的行驶工况下,电池SOC 的消耗规律不同,因此须构建汽车行驶工况相关特征。目前国内外对此研究较为深入,本文中基于Wu 等
[20]
提出的10个工况特征参数,并对其进行进一步
完善,提出包括最大加速度、速度标准差和平均速度等15个特征参数进行输入。其次外界环境温度影响动力电池的充放电性能,从而影响SOC 消耗。本文中通过爬虫技术,根据已知的经纬度与时间信息得到按小时记的温度信息作为外部环境特征,而
车辆的自身状态信息可由汽车传感器获取。在此构建了共20个特征,如表3所示,由于特征维度较多,因此须进行特征选择。
3.2
能耗特征选择
由于特征工程中所构建的特征可能存在信息重
复或无关特征,若全部输入模型进行训练,则会使模型出现过拟合或维度灾难,降低模型预测效果。因此须进行特征筛选,排除冗余或无效特征以减少特征数量,增强模型的泛化能力。
本文中使用顶层特征选择算法中的稳定性选择进行特征筛选。稳定性选择是基于二次抽样和选择算法的结合,在不同的数据子集和特征子集上不断重复运行,最终得到汇总结果来进行特征筛选,可以有效克服过拟合,增强对数据的理解。使用随机森林与L1正则化结合的稳定性选择方法,此方法能够自动选取正则化参数以提升模型效果。其输出结果如图11所示,图中对所构建的20个特征进行了重要性
的排序,
可看出部分特征对模型预测结果影响
电动汽车技术网图9
测试集分布
图10同分布后数据集分布
表3
能耗模型特征表
类型
车辆状态信息
环境信息
行驶工况信息
特征字符
begin_soc
average_mileage slice_time slice_mileage
slice_temp
jiasu_average_a jiansu_average_a
max_a max_v std_v
slice_average_speed
jingzhi_ratio jiasu_ratio jiansu_ratio yunsu_ratio low_v_ratio
mid_low_v_ratio mid_v_ratio mid_high_v_ratio high_v_ratio
数据类型
int float
int int
float float float float float float float float float float float float float float float float
说明起始SOC 值片段平均累计里程片段运行时间片段运行里程平均温度加速段平均加速度减速段平均减速度
最大加速度最大速度速度标准差平均速度静止段比例加速段比例减速段比例匀速段比例低速比例中低速比例中速比例中高速比例高速比例
5