汽车售后服务数据挖掘探索与研究
一、吉利汽车售后主要市场指标解释
1、MIS指标
MIS即千车故障率,指一千辆车中发生故障的个数。千车故障率根据不同的需求,设定了不同的时间区间,目标公司主要通过3个月、6个月、12个月来监控。同时,处于市场三包期内的车辆会涉及到另外一个指标,索赔额的概念。该索赔额会换算为单台车辆的索赔额,目标公司一般监控一年内车辆的索赔额,指标表示为12CPV。12CPV只是包含了12MIS范围内的单台索赔额。
1、3MIS(‰):统计日期前推3个月生产并销售的车辆在同期产生的故障数占这3个月生产并销售车辆数的比例。(例如:3月份3MIS=1-3月生产并销售车辆在1-3月发生的故障数/1-3月生产并销售车辆数);
2、6MIS(‰):统计日期前推6个月生产并销售的车辆在同期产生的故障数占这6个月生产并销售车辆数的比例。(例如:6月份3MIS=1-6月生产并销售车辆在1-6月发生的故障数/1-6月生
产并销售车辆数)
2、12MIS(‰):统计日期前推12 个月生产并销售的车辆在同期产生的故障数占这12个月生产并销售车辆数的比例。
3、12CPV(元/台):统计日期前推12个月生产并销售的车辆所发生的索赔额与这12个月生产并销售车辆总数的比例。
MIS指标的市场具体体现:
为更好的表述论文内问题,特引入静态市场问题和动态市场问题概念:
静态市场问题:指车辆销售以后并未被用户购买,在经销商处处于库存车辆,或者车辆被用户购买以后,里程数不足100公里的车辆出现的市场问题
动态市场问题:指车辆被用户购买,且行驶里程已经超过100公里的车辆出现的市场问题。
1.反映了特点时间区间内市场质量问题的发生频率,该指标要求在特点时间区间内销售并且在同期产生的故障数。有以下几种规避:
为了能够避免车辆生产后但是未投入使用车辆计入指标,计入MIS的指标必须都是销售以后的车辆,从而将能够更加准确的反映车辆的市场表现。但是,这样也导致了MIS指标存在以下不足:
车辆生产以后在销售终端库存时间过久,即使当天销售,次日发生故障,同样有可能不计入市场MIS。例如:2013年8月生产车辆,在2013年12月售出,同样该车出现的问题不计入3MIS,但是计入6MIS和12MIS。MIS对车辆在库放存时间,同样累计到MIS时间计算区间内。
1.由于在库时间过久,导致新车使用阶段市场质量监控不足,为了弥补该问题,后面将引入另外一个概念,即初期的概念。同时,由于在库时间过久,在未销售阶段(库存阶段)的质量监控不足,引入了另外一个概念,即零公里(0KM)的概念。假设车辆库存在2月(含)以上,该车不能非常准确的反映车辆自生产以后,市场使用过程的故障。该车辆的1MIS、2MIS为静态市场问题,该车辆躲避了1MIS、2MIS的市场监控。该车辆出现的问题将计入相应时间段的0KM指标。
2.MIS指标可以比较准确的去反映车辆在生产以后的耐久性问题,考虑到库存时间,该耐久
性还是有一定的不足。此处会将车辆在经销商库存阶段的静态耐久性检验也计入车辆市场耐久性问题。(对动态耐久性和静态耐久性“一视同仁”了。)该类情况的出现并不罕见,尤其是对于车辆销售相对较冷的车型。如果说我们避开该类情况,假设车辆在生产和销售之间的库存时间非常短,所有车辆都是用户订单生产(非经销商的订单生产)。那么MIS指标就能非常准确的反映出车辆的市场质量情况,包括产品耐久性,整车装配质量等。
2、初期
初期N故障:指不同生产日期的车辆自用户购车之日起在N个月内发生的故障数。即:初期N故障率=故障数/该月生产的车辆数。
吉利汽车售后服务
举例:1月份初期一:1月份生产的车辆在1月和2月发生的故障数/1月份生产的车辆数;1月份初期三:1月份生产的车辆在1-4月发生的故障数/1月份生产的车辆数。
初期的概念和MIS的概念有一定的类似,都是在某一时间段内的故障率,但是对于时间段的界定又有很大的不同。
首先初期是从当月生产的车辆前推一定月份后出现的故障率,而MIS是指从当月后推一定月
份内生产销售的车辆出现的故障率。即初期内的车辆,该车在初期概念涵盖的时间段中,车辆处于用户使用阶段。而MIS内的车辆,该车在MIS概念涵盖的时间段内,车辆可能有一定的时间段处于库存阶段,而只有部分时间段在用户使用阶段。如果将车辆的出厂后的状态分为静态(车辆处于经销商状态)和动态(车辆处于用户使用状态),那么初期则为动态下市场质量反映,MIS则为静态+动态下市场质量反映。
3、安抛
安抛率(PPM): MIS抛锚率=前推特点时间段生产并销售的车辆所发生的抛锚数/前推相同的的时间段内生产并销售的车辆数×1000000。
安抛是由于车辆故障导致不能行驶抛锚的概率,安抛是在12MIS的基础上来定义的,就是在12MIS问题中属于抛锚的车辆数与12月内生产并销售的车辆数的比值,换算为PPM就乘以一百万。
安抛问题属于较大质量问严重影响用户使用,甚至对用户造成一定的安全隐患。安抛率反映了车辆较大质量隐患问题发生的概率。
4、零公里
零公里故障率(PPM): 0KM=前推3个月生产并在经销商PDI的车辆产发生的不良数/前推3个月生产并在经销商PDI的车辆数×1000(国内)。
零公里顾名思义就是暂未行驶(用户未使用)前的故障问题,为了更加准确的明确零公里问题,目标企业计算时规定零公里计算解读为在经销商PDI时车辆出现的故障率。零公里指标主要反映了汽车生产以后的一个最初质量水平,是衡量检验商品车的一个指标。
上述指标对车辆在市场不同状态下的质量问题作了量化,而如何再从这些数据中出更多的信息?这是摆在现在企业面前非常大的一个问题,此时数据挖掘技术的研究便是为了从这些信息中出规律,挖掘出有价值的信息。
2.2数据挖掘技术
在指标分析中的应用
2.2.1 MIS指标应用分析
数据聚类分析:
对2013年年度数据挖掘分析,以下为聚类分析。
K-means算法:K-means算法的基本的形式已经被几位研究人员在不同的学科中解开了,尤其是由劳埃德.佛雷德里曼和麦克奎恩。K-means算法应用于那些可以用多维度向量空间中的点来表示的对象。因此,它聚集了一套多维向量空间,D ={xi/i = 1, . . . , N},当xi ∈d 表示第i个对象或者数据点。k-means均值算法就是将D数据集划分为k个簇类点集的聚类算法。也就是k-means算法对D中所有的数据点进行聚类分析,使每一点xi有且只有落在k个分类中的一个。并且通过给每个点指定一个的簇类ID来记录每一个点的划分结果。有相同ID的点属于同一个簇类,不同ID的属于不同的簇类。
1、生产日期聚类分析
生产日期聚类分析,就是通过聚类将满足一定规则的数据区间合并为一个簇,分析不同簇类的特点和独有特征。
数据为2013年度的所有索赔信息,
2、故障模式聚类分析
3、行驶里程聚类分析
通过生产日期、故障模式、行驶里程聚类分析。
2.2.2 初期指标应用分析
2.2.3安抛指标应用分析
2.2.4零公里指标应用分析
2.3汽车故障数统计预测模型
2.3.1模型建立
2.3.2模型应用分析
2.4千车故障率模型
2.4.1模型建立
2.4.2模型应用分析
2.5数据挖掘技术售后质量应用研究
2.5.1车型故障分析研究
2.5.2服务站服务成本研究