⽤户画像案例⼀:汽车精准营销
酷熊怎么样⽤户画像案例⼀:汽车精准营销
做汽车精准营销项⽬已经快⼀年的时间了,但是说起正真的⽤户画像,⼜不知道该如何说起,所以我就开始从数据的处理流程⼀点点的来引进⽤户画像的建⽴。
1、数据的处理流程
我们⽤到的技术就是⽤java写mapreduce框架来实现⽤户上⽹数据的url的识别,这⾥识别⽤的是正则表达式,其次就是模型的建⽴使⽤hive 就⾏处理。
⾸先我们的数据来源有两个⽅⾯:⼀个是客户的数据,还有⼀个是⽹络爬⾍数据。
客户的数据有:⽤户⼿机上⽹⽇志(识别上⽹的url)、基础信息(性别、年龄、省份、地市等)、语⾳话单(综采话单、计费话单)、App汇总表、⽤户搜索关键字解析表、综采短信话单等;
爬⾍数据:在url中我们解析出来⼀般是汽车的车型id,但在实际的使⽤中我们⽤到的却是汽车的名称,所以这就需要爬取汽车⽹站的数据来进⾏匹配处理。电话营销会显的更直观,更可靠,所以我们定义了不同的⼝径去分析⽤户的购车意向。
宝骏e300报价数据的处理流程说明如下:
1. 对原始上⽹⽇志数据进⾏初筛处理(由客户来处理,我们提供规则),因为全国的上⽹⽇志数据是特别⼤的,⼀天⼤概产⽣80-90T。
所有先由客户初筛出我们需要的数据,我们做的汽车⾏业,就会只拿出汽车⾏业相关的数据推送给我们。
x80奔腾2. 初筛之后的数据我们还需要清洗⼀遍,过滤掉号码异常的,过滤掉url异常的数据。此过程除了清洗最重要作⽤还是识别,识别url的⽹
站来源、访问的板块(例如:⾸页、图⽚、价格、论坛等)、车型id、⼀⼿车还是⼆⼿车等。
3. 数据的匹配和模型的建⽴,根据⽤户的浏览⾏为和⼀些基础的标签,判断意向购车⽤户,给⽤户赋值不同的等级类别。
2、⽤户画像的建⽴
我们的⽤户画像可以分为三⼤类:⽤户的基本属性、汽车的基本属性、经销商的基本属性,根据客户的现有数据建⽴模型,分析现有标签对客户意向的影响。根据多个标签属性综合分析可以得到三类⽤户:意向阶段、对⽐阶段、决策阶段。
美亚奇骏
1)⽤户属性:年龄、性别、城市
年龄段:将年龄按照5岁为⼀个阶段划分为不同的年龄段,25—50岁之间为购车的主⼒⼈;
性别:购车⽅⾯男⼥的⽐例是8:2,男⼠占主要的地位;
城市等级:将城市划分成不同的等级,从城市等级看,主要集中⼆三四线城市,三线城市男性、⼆线城市及六线⼩城市⼥性买车偏好度更⾼。⾼等级城市对⾼价位车型明显偏好,低线城市10万元以下价位车型偏好度⾼于其它等级城市;⼆线城市对15万以上车型偏好度显著⾼于其他城市;
2)汽车属性:品牌、最低价、最⾼价、级别、车⾝形式、⽹站、国别、渠道、能源形式、是否纯电动
品牌:品牌的销量与⽤户的年龄、性别是密不可分的。分析数据我们得到20—25岁⼈更偏向于国产品牌,25—30岁⼈更偏向于⼤品牌,30—35岁⼈更偏向合资品牌,35—40岁⼈偏好成熟稳重品牌,40—50岁⼈对商⽤车品牌更青睐。⼥性⽤户购车品牌中合资品牌⽐例明显⾼于男性⽤户,合资品牌偏向中⾼端品牌;
价格段:⼥性⽤户更偏向于⾼端车型,男性⽤户购车⽅⾯更偏向于实⽤为主。⾼等级城市对⾼价位车型明显偏好,低线城市10万元以下价位车型偏好度⾼于其它等级城市。35—45岁对50万以上⾼端车型
奥迪三厢车购买⽐例最⾼;30—40岁对25—40万的中⾼端品牌车型购买⽐例最⾼;⽽25—35岁⽤户对5—10万的中低端品牌车型购买⽐例最⾼。
3)经销商属性:主营品牌、电话类型、经销商名称
这些标签主要是针对⽤户的语⾳话单进⾏处理的,这⾥的电话可以分为:官⽹的400电话,以0开头的座机号和⼀些⼿机号,不同的经销商所主营的品牌的销售额是不⼀样的,根据他电话咨询经销商的情况我们可以推断⽤户的意向情况,这⾥也刚好和汽车属性的判断很好的衔接上了。
4)已有车⽤户的建⽴
已有车⽤户的建⽴,对模型的意向结果是⾄关重要的。我们重点分析的是⽤户的上⽹⾏为,⽐如某个⽤户是汽车爱好者,他每天都会有浏览汽车⽹站的⾏为,但是他没有买车的意向或者已经有车了,我们就需要排除这样的⽤户,那么应该怎样做呢:
1. 可以从⾏为分析:爱好者⼀般好看汽车新闻、图⽚、论坛等模块,⽽意向客户会偏重参数配置、报价、询底价、预约试驾等模块。这
xlr样可以初步的到爱好的⽤户;
2. ⽤户访问的app:如果⽤户使⽤这些app,车轮查违章、途虎养车⽹、58违章查询、导航⽝等app,则可以判断此⽤户是⽤车⽤户;
3. 根据已营销⽤户的反馈情况就可以确定那些⽤户是⽤车⽤户,从⽽在底层的模型中去做过滤;
说明:以上的结果全是我们⾃⼰的分析整合得出的结论,不代表整个⾏业的现象,望周知。
3、模型数据的输出
我们是从不同的⼝径去得到模型结果的,这⾥我们叫做模型规则,不同的规则⽤户的意向率是不同的,⽽且我们是根据⽤户的需求去下发数
据的,这样我们的规则就是必不可少的。(⼀下规则仅供参考)
规则1:浏览汽车页⾯的⽤户,这⾥⼀个⽤户可能访问多个⽹站、同⼀个⽹站⽤户可以访问不同的车型,这⾥我们处理时,⼀个⽤户是只能保存⼀条访问记录的。⾸先选择汽车车型不为空的数据,然后按⽹站统计的⽤户的停留时长,停留时间最长的⽤户⽹站数据带出,然后根据基础标签得到⽤户的等级,再排除已有车的⽤户,就可以得到规则1的结果;
规则2:直接通过电话咨询的⽤户,从⽤户的综采话单、MB计费话单、CB计费话单和⾃建表的电话相互关联,到主动咨询的⽤户;
有很多规则这⾥就不详细的⼀⼀说明了,最终的结果是将所有的规则合并写到⼀张表中去做外呼处理。
发布评论