电动汽车充电用户行为特征研究
作者:李雪梅 段晨悦 许鑫 傅军 孙志杰 周国鹏
来源:《中国市场·营销研究方向》 2018年第5期
    [摘要]通过充电交易数据发现电动车用户的行为特征比较困难,但这些特征对于充电站运营企业提高运维服务质量至关重要。文章使用K-means聚类模型对2016年10月至2017年9月冀北地区充电站交易数据进行了研究,发现了3类用户:高速一级用户、高速二级用户和城市用户;在此基础上,进一步钻取出5类用户:跨城办公用户、游玩用户、过路用户、城市居民用户、北京办公用户。根据这些用户特征,提出了相应的运营策略、充电站规划建设建议。
福特探险者2021新款
    [关键词]充电站;用户行为特征;聚类分析
    [DOI]10.sc.2018.13.125
    1引言
起亚soul报价
    充电站作为电动汽车充电基础设施,与电动汽车为互补产品。在国家“十三五”规划关于电动汽车充电基础设施需要建设适度超前、车桩相随、智能高效的充电网络体系的精神指导下,电动汽车充电站覆盖
面积不断扩张、充电站用户也越来越多。正确识别充电站用户或电动汽车用户的行为特征,对于运营企业提高运营效率、提升运维服务质量、引导用户充电行为,都具有重要意义。
    目前,国内关于电动汽车用户行为特征的研究较少。李跃(2013)和王飞龙等(2013)在研究充电站的需求预测中,将电动汽车用户分为规律性较强的A类用户、规律性一般的B类用户、随机性的C类用户,其依据主要看电动车是否为公交车或私家车。[1-2]邢龙等(2013)研究电动汽车参与的微网运行优化中,将用户分为及时充电、低价充电和双向充放电三种模式,其依据是电动汽车剩余量的多少。[3]陈丽丹等(2015)在研究电动汽车充电负荷预测中,将用户按照出行目的划分为回家、工作、购物吃饭、社交休闲和其他事务五大类。[4]陈静鹏等(2016)研究电动汽车充电站优化规划模型,也使用了类似的分类。[5]这些研究虽然不是专门研究用户特征,但是,从侧面反映出用户行为特征在相关领域研究中所起的重要作用。
    国外关于电动车用户充电行为特征的研究也比较少。Xydas等(2016)研究了英国电动车充电需求的特征,集中在充电电量方面。[6]Speidel等(2014)研究了澳大利亚西部电动汽车的充电模式,主要考虑充电时段、电动车剩余电量等方面的因素。[7]Bi等(2016、2017)通过考虑电动车行程和充电剩余电量门限研究了新加坡电动车的充电行为。[8-9]这些研究涉及充电需求,但没有涉及用户本身。
    国内外其他相关研究基本上集中在充电站布局选址、充电站负荷、充电站营运模式、电动车产业政
策等方面。本文将使用冀北公司已运行充电桩的相关数据,对电动车充电用户的行为特征进行研究,从用户标签出发提出相关建议,为其他领域的研究奠定基础。
    2数据处理与研究方法
    充电用户行为特征研究主要依赖于从车联网管理平台提取的数据,其中包括充电桩档案、冀北地区充电交易数据等。这些数据一般只涉及用户的充电卡号、充电电量、交易金额、交易方式、交易时间、交易桩号,欠缺用户准确的描述。如何从现有数据抓取用户特征依赖于正确研究方法的选择。抓取用户特征本质上就是对用户进行分类,在数据分析技术中聚类分析是最为有效的分类工具。聚类分析是一组模型、工具,使用这组工具可以将数据目标分成若干类。由于车联网平台数据相对较大,我们选择K-means模型进行聚类。
    K-means模型的使用对数据结构有一定要求,但从车联网平台提取的数据结构性较差。因此,需要结合业务知识,对原数据进行整理和预处理,得到格式统一的、数据完整的和标准化的电动汽车用户相关的结构数据。
    2.1数据处理
    数据处理将原数据从业务角度转换成K-means模型可以使用的格式。这包括代表性处理、业务处理、K-means处理。
    代表性处理:电动车用户充电行为主要体是大众,公交充电不具有代表性,因此,将2016年10月1日至2017年9月30日冀北交易数据中公交充电站交易数据剔除。
    业务处理:按照运营企业业务需要,将站点分为北京相关高速、城际高速、承德市站点、廊坊市站点、唐山市站点、秦皇岛市站点、张家口市站点7类;将交易时段划分为0—3:59、4—7:59、8—11:59、12—15:59、16—19:59、20—23:59 6个时段;将交易日期划分为工作日、周末、节日3种。
    K-means模型聚类,要求变量为数值型。因此除了卡号识别用户作为观测单位之外,充电交易数据中,高速、城市站充电次数;工作日、周末、节日充电次数;一天各时间段充电次数;各类别充电站的充电次数等都为数值型。具体变量明细参见表1。
   
一汽丰田普拉多   
    K-means处理:由于各个变量的单位不同,需要对变量进行标准化处理;为防止大数据过于分散,使用类内标准差对距离进行标准化处理,以便类特征更容易显现出来。
进口宝马1系    通过上述数据处理,得到20个变量反映充电用户的特征,这些变量的数据结构可以用K-means模型聚类计算。
别克南京630孕妇
    2.2K-means模型
    K-means聚类模型由MacQueen(1967)提出后,从算法、工具方面得到很大发展。[10-11]尤其在处理大数据方面表现出比系统聚类的优势更受欢迎。聚类模型的两个基本步骤是:选择相似性度量、选择并类算法。K-means聚类的相似性度量主要依据欧氏距离,也就是需要不断计算观测单位与每个
类均值的距离。如果观测单位包含p个变量,每个类的均值坐标计算公式如下:
   
    K-means聚类模型的并类算法选择如下:
    Step 1:将观测单位划分成K个初始类。
    Step 2:遍历观测单位列表,将每个观测单位分配到其最近的K个类当中的一个;重新计算类元素变化的类的均值。
    Step 3:重复Step 2直到目标分配达到稳定为止。
    其中Step 1可以随机划分K个类。Step 2计算每个观测单位与每个类的距离,然后,将其分配到最近
的类。这种分配如果发生,必然导致某个类元素的减少,另一个类元素的增加。从而需要对变化的类重新计算类均值:
   
    对于用户特征的研究,观测单位为充电用户,或用户ID,共16012个。每个用户j都有共p=20个变量(见表1):Dl、Dc、Zg、Zs、Zb、Zc、Zj、Zl、Zq、Zt、Zz、Tg、Tz、Tj、T1、T2、T3、T4、T5、T6对应K-means模型中的xj1,xj2,…,xj20。
菲亚特汽车价格    K-means聚类模型的并类算法可以通过大部分程序语言或软件包实现。
    3用户行为特征
    下面的分析基于2016年10月至2017年9月冀北交易数据,经过数据的标准化处理,使用K-means模型对在冀北地区使用过充电桩的16012个用户进行聚类分析。K的设定以及最终应该产生多少类是任何聚类模型的一个难题。一个可行的方法是对给定的一组K的值进行实验,使得类中的元素个数相对比较平衡,结合专业知识来选择最终的类数。
    3.1初步K-means聚类结果
    为了覆盖潜在的类数,我们对K=1至15进行K-means聚类分析,最终选择K=6的聚类结果,再进一步确定最终类数。K=6的聚类结果如表2。
   
    从初步聚类结果来看,类别4、5、6包含的成员数只有1个或没有,对于这3个类别可以不去关注。
因此,初步得到3个比较平衡的类别1、2、3。下面分别从高速使用、充电电量、充电次数、充电时间方面比较这3个类别。
   
    由表3可知,第一、二类用户高速站充电使用较为频繁,第三类用户很少使用高速站充电。因此,初步定义这3个类别为高速一级用户、高速二级用户、城市用户。第一、三类用户的年人均充电电量远高于第二类用户。但三类用户的平均充电电量都比较显著、充电时间主要就集中在8:00—20:00,需要我们进一步关注。
    第一类用户为高速一级用户,共有5497人,约占冀北用户的34.33%,大部分用户高速使用率高且使用次数高。高速使用比高;充电电量及充电次数在三类用户中最高,微高于第三类用户。
    第二类用户为高速二级用户,共有4769人,约占冀北用户的29.78%,大部分用户高速使用率高,但使用次数低。高速使用比高;充电电量及充电次数在三类用户中最低,且远低于其他类用户。
    第三类用户为城市用户,共有5744人,约占冀北用户的35.87%,大部分用户高速使用率低,但使用次数高。高速使用比低,接近于0;充电电量及充电次数与第一类用户相似,微低于第一类用户。
   
    从表4可以看出,高速一级用户工作日使用次数:周末使用次数:节日使用次数≈3.3∶2.0∶1;8—19:59时间段使用次数高;站点使用情况,北京相关高速远高于其他站类型。
    高速二级用户工作日使用次数:周末使用次数:节日使用次数≈3.7∶2.3∶1;8—19:59时间段使用次数高;站点使用情况,北京相关高速远高于其他站类型。
    城市用户工作日使用次数:周末使用次数:节日使用次数≈10.6∶4.9∶1;12—19:59时间段使用次数高;站点使用情况,廊坊市站点远高于其他站类型。
    3.2用户特征
    通过上述研究,结合运维业务经验大致可以得到如下结果:
    高速一级用户,多数为跨城办公用户。其充电行为的主要特征为在京津冀地区工作日充电电量较大且充电次数较多,充电站使用频繁人,而且在北京相关站点、城际高速站点常有充电。
    高速二级用户,多数为过路用户、游玩用户。其特征是充电量、充电次数不大,但充电的站点分布相对均匀、分散。
    城市用户,基本上是城市居民用户、北京办公用户。其特点是工作日充电次数相对多,但充电站点不太均匀,且北京办公多集中于廊坊市燕郊地区站点充电。
    4建议
    根据上述研究,我们提出针对不同用户类型的运营策略建议。
    高速一级用户:推出分段计价、套餐服务。这种策略可以通过分时段、分地段,或工作日节假日等多种形式的组合套餐,给用户提供一定程度的优惠,来更好地吸引用户,提高服务质量。