第七届“泰迪杯”数据挖掘挑战赛——
C题:运输车辆安全驾驶行为的分析
一、问题背景
车联网是指借助装载在车辆上的电子标签通过无线射频等识别技术,实现在信息网络平台上对所有车辆的属性信息和静、动态信息进行提取和有效利用,并根据不同的功能需求对所有车辆的运行状态进行有效的监管和提供综合服务的系统。当前道路运输行业等相关部门利用车联网等系统数据,开展道路运输过程安全管理的数据分析,以提高运输安全管理水平和运输效率。
某运输企业所辖各车辆均存在常规运输路线与驾驶人员。在驾驶员每次运输过程中,车辆均可自动采集当前驾驶行为下的行车状态信息并上传至车联网系统。驾驶行为可能随气象、路况等因素的变化而变化,进一步影响行车安全、运输效率与节能水平。
帕杰罗v93油耗
请根据该运输企业所采集的数据(见附件1、附件2),分析车辆行驶过程中的驾驶行为对行车安全、运输效率与节能情况的影响,运用数据挖掘的方法,建立有效的数学模型进行评价。
二、研究问题
大众xl1报价
(1) 利用附件1所给数据,提取并分析车辆的运输路线以及其在运输过程中的速度、加速度等行车状态。提交附表中10辆车每辆车每条线路在经纬度坐标系下的运输线路图及对应的行车里程、平均行车速度、急加速急减速情况。
(2) 利用附件1所给数据,挖掘每辆运输车辆的不良驾驶行为,建立行车安全的评价模型,并给出评价结果。
(3) 综合考虑运输车辆的安全、效率和节能,并结合自然气象条件与道路状况等情况,为运输车辆管理部门建立行车安全的综合评价指标体系与综合评价模型。
附表
三、数据说明
1. 附件1给出450辆运输车辆的行车轨迹采集数据,由于采集设备精度,实际采集数据可能存在某些异常。
附件1的数据说明共青城到南昌
车架号后4位
2.附件2给出2018年7月30日至2018年10月10日全国主要城市的自然气象数据。
附件2的数据说明
3.在车辆运输过程中,不良驾驶行为主要包括疲劳驾驶、急加速、急减速、怠速预
热、超长怠速、熄火滑行、超速、急变道等。
4.目前常用的坐标系有如下三种:
(1)WGS-84(世界标准地理坐标系)
(2)GCJ-02(中国国测局地理坐标系)
(3)BD-09(百度地理坐标系)
本道赛题附件1所给的行车轨迹采集数据中,经纬度数据所使用的坐标系为WGS-84,若需调用高德地图或百度地图等工具进行经纬度处理,则需做相应的坐标系转换。
附录:
请仔细阅读以下说明:
1、关于赛题数据
①示例数据:2019年3月16日随赛题公布。
②全部数据:2019年4月13日公布。
exige2、提交作品
①命名方式:论文命名为“C题”,附件请直接命名为“作品附件”。
②论文及附件内请勿出现队号、学校、学院、队员以及指导老师相关任何信息,否则该作品视为无效作品。
小刮蹭千万别补漆
③请参赛队于2019年4月26日16:00之前在竞赛【提交作品】处提交论文(PDF 版,大小不超过50M)及附件(论文正文(Word版)、源数据(组委会提供的源数据除外)、过程数据、程序的压缩包,大小不超过200M)。