40
AUTO TIME
FRONTIER DISCUSSION | 前沿探讨
徐可超 王涵笑 霍思远 谷晓彤山东科技大学 山东省青岛市 266510
摘 要:
共享汽车行业曾在几年前广为繁荣,但由于其所具有的重模式、高成本、难以盈利等弊端,造成企业难以持续融资,行业难以持续繁荣的困境。如今,随着汽车车型更新换代日益迅速,加之疫情影响经济发展,消费者更倾向于轻便的用车模式,使得具有“分时租赁”特点的共享汽车获得很大发展机遇。本文综合利用Excel、Python 软件,先以经纬度为横纵目标对附件数据进行离值剔除与可视化展示,并将其在空间上划分成25个区域,从而更准确地研究其空间特征;其次,使用Matlab 软件构建DBSCAN 聚类算法模型,将不同区域共享汽车的实际密度情况以热力图形式在地图上可视展现,得出共享汽车分布主要集中在经度34.78377、纬度32.0556等区域附近,这些区域大多集中位于城市中心,人口密度相对高,共享汽车使用频率高的结论,同时编程得出不同型号车辆在整体区域信息的出现频率次数表,进行不同维度变化分析,
得到共享汽车使用集中在早午晚高峰期,该时间段内人流量大,用车需求量高,汽车使用频率高的结论。
关键词:联合调度优化模型 共享汽车 DBSCAN 聚类算法1 引言
共享汽车行业曾在2015年以来“百花齐放”,受到投资融资方青睐,但由于其具有重模式、高成本、难以盈利等特点,导致其难以持续繁荣,陆续有公司因为融资问题倒闭。在2019年,在共享汽车行业,中小企业不断出局,头部平台拉动了行业重新增长,增速甚至超过网约车和线上租车。
2 模型建立
2.1 数据信息可视化分析与数据处理由于附件中为列表数据集信息,为方
便观察特征,以经纬度为横纵坐标,利用Python 软件对其进行可视化处理,共享汽车经纬度分布中部分区域出现离点,为保证整体数据集分析的可靠性,减少模型因歧异值带来的误差,需要剔除离点,剔除后的分布图像如图1所示。
针对分布图中整体较为密集的集中停车点,以经纬度为划分标准进行区域划分,形成一个5*5的正方形矩阵区域。为了解各区
域中共享汽车数量关于时间的变化情况,了解其汽车流量的高峰期低谷期,将区域数据按时间标准转化为多列,以凌晨3;00-6;
Analysis of Shared Cars Based on Joint Scheduling Optimization Model
Xu Kechao ,Wang Hanxiao ,Huo Siyuan ,Gu Xiaotong
Abstract :
T he shared car industry once prospered a few years ago, but due to its heavy model, high cost, and difficulty in profitability, it is difficult for companies to continue financing and the industry to continue to prosper. Nowadays, with the increasingly rapid replacement of car models and the impact of the epidemic on economic development, consumers are more inclined to use the light-weight car model, making shared cars with the characteristics of “time-sharing lease” a great opportunity for development. In this paper, using Excel and Python software comprehensively, outlier removal and visual display of the attachment data are first performed with the latitude and longitude as the horizontal and vertical targets, and the space is divided into 25 regions, so as to more accurately study its spatial characteristics: secondly. Using Matlab software to build the DBSCAN clustering algorithm model, the actual density of shared cars in different areas is visually displayed on the map in the form
of heat maps. It is concluded that the distribution of shared cars is mainly concentrated in areas near longitude 34.78377 and latitude 32.0556. Most of these areas is concentrated in the center of the city, the population density is relatively high, and the frequency of shared cars is high. At the same time, it is programmed to draw the frequency table of the appearance frequency of different types of vehicles in the overall area, and analyze the changes in different dimensions. It is obtained that the use of shared cars is concentrated in the morning, afternoon and evening. During the peak period, the flow of people is large, the demand for cars is high, and the frequency of car use is high.Key words :
j oint scheduling optimization model, car sharing, DBSCAN clustering algorithm 图1 剔除离点后汽车经纬度分布图
lognitude
latitude
0.100.080.08
0.10
0.12
0.14
0.16
0.18
0.060.04
0.02
FRONTIER DISCUSSION | 前沿探讨
时代汽车 wwwautotime
00、早上6;00-8;00、上午8;00-11;30、
中午13;00-17;00、傍晚;17;00-19;
00、晚上;19;00-23;00、深夜;23;
00-3;00的标准划分时间段;同时,以是
否为假期、周末、节假日来考虑个列,从而
得到各区域在一天不同时间段内的停车数量
变化。
2.2 DBSCAN空间密度聚类分析
首先定义以下概念,给定数据集D和参
数ε和MinPts,有以下定义:
(1)ε-邻域:对x j∈D,其ε-邻域包
含数据集D中和x j距离不大于ε的样本,即;
Nε(x j)={x j∈D∣dist(x j,x j)≤ε}
(2)核心对象:若x j的ε-邻域至少包含
MinPts各样本,即∣Nε(x j)∣≥MinPts,则
x j是一个核心对象;
(3)密度直达:若x j位于x i的ε-邻域内,
且x i是核心对象,则称x j由x i密度直达;
(4)密度可达:对x i与x j,若存在样本
序列P
1,P中国汽车模型网
2
,…,P
n
,其中P
1
=x i,P
n
=x j,且
P i+1,由P i密度直达,则称x j由x i密度可达;
(5)密度相连:对x i与x j,若存在x k使得x i与x j均由x k密度可达,则称x j由x i密度相连。
基于以上定义,DBSCAN聚类算法流程步骤为:
●输入数据集D={x1,x2,…,x m}及参
数ε和MinPts,从数据集中随机抽取
一个未被访问的对象,在其-邻域内
满足阈值要求的称为核心对象;
● 遍历全部数据集,到所有从对象的
密度可达对象,形成新的簇;
●利用密度相连,产生最终簇结果;
● 重复步骤2与3,直到访问数据集中的
所有对象为止。
因本题聚类密度均匀且分布较为集中,将各区域停车车辆数量等相关信息作为数据集,以=0.05km和MinPts=261为参数进行DBSCAN密度聚类。[1]使用Matlab软件编程得到不同区域的在地图上的车辆密度分布热力图如图2。
3 模型求解
由聚类处理后数据可以得出:该城市共享汽车分布主要集中在城市中心,其人口密
度相对较高的维度。对各天区域车辆数气泡
进行分析,并结合上文中各区域一天不同时
间段内的汽车数量折线图,可以得出一天中
不同区域不同时间的车辆数目变化情况,进
而得到按时间段划分的车辆时间变化趋势,
其各区域一天中停车数目分配大致相同,在
早午晚高峰期内中心区域车流量多,汽车数
量多,在边缘郊区汽车数量少,而在其他时
间段内汽车数量大致稳定。
可以综合得出,按天车流量在每月中旬
呈上升趋势,到达峰值后持续下降,上下旬
均会出现一个较为平缓的增长趋势,并呈现
先增后降的趋势;同时,用车数量在年末到
达高峰期,这一期间人们用车需求增长迅速,
共享汽车使用数量大幅增长;在18、19年内,
12月/第四季度车辆数目均要多于1月/第
一季度车辆数。
在时间上集中于早午晚高峰期,在这段
时间内人流量大,用车需求量高,汽车使用
频率高;在共享汽车型号上,最受消费者欢
迎的汽车为234号汽车,其次为199号、235
号等,共享汽车使用次数在数据集中均高于
2000次,受欢迎的汽车型号均高于3000次,
使用频繁。
4 总结
停车点是基于经纬度定位,且数据庞大,
密度集中,基于密度的聚类算法以数据集在
空间分布上的稠密程度为依据进行聚类,能
处理任意形状和大小的簇,方便处理多而繁
琐的停车点数据[2]。利用DBSCAN聚类算法
时,可在聚类的同时发现样本数据异常点,
方便处理大量的影响数据有效性的异常值。[3]
采用特征性分析,引入锡尔系数作为判断的
依据,有利于从多个角度为调度的方案提供
依据。
密度聚类算法对于输入参数和MinPts敏
感,确定参数较为困难,带有一定的估算性质。
特征性分析对于次要因素包含度不高,推广
使用具有一定的局限性,仍需要进一步优化。
而DBSCAN空间密度聚类模型本身自带的参
数带有一定的主观性,可以利用遗传算法对
模型进行进一步优化改进。本题所建立的模
型具有较好的理论基础,得到的联合优化模
型可以作为共享汽车企业的参考相关依据。
联合优化模型为多模型综合使用,适应性广,
其不仅仅适用于共享汽车,也能推广到共享
单车等其他行业领域。
参考文献:
[1]马小宾,侯国林,李莉,杨燕.基于
DBSCAN算法的民宿集识别、分布格局
及影响因素——以南京市为例[J].人文地
理,2021,36(01):84-93.
[2]王倩倩,孟繁宇,曾益萍,张少标,吴国华,
杨丽丽.基于DBSCAN聚类的城市区域火
灾风险计算方法——以深圳市盐田区为例
[J].中国安全生产科学技术,2021,17(02):
177-182.
[3]Ester M,Kriegel H P,Sander J,et al.A
density-based algorithm for discovering
clusters in large spatial databases with noise[C].
Portland,Oregon,USA:The AAAI
Press,1996:226-231.
图2 不同区域在地图上车辆密度分布热
力图
作者简介
徐可超: (2002.01—),男,汉族,山东滨州人,
在读本科。研究方向:智能开采。
AUTO TIME 41
发布评论