O2O产品质量保障体系(四)| 基于学习的线下商户质量挖掘
一、线下商户问题迫在眉睫糯米不仅仅是团购,它是O2O的生活服务平台,糯米的产品质量可以定义为线上和线下,线上主要是在线商品的售卖情况,所对应的质量问题也就是商品类的badcase,这些会直接影响我们的流水。而线下主要是商家服务的接待质量,会直接影响用户的留存。对一些商家不接待的情况,如用户开心地买了团购券去实体店里消费,发现店家在装修或者已经倒闭,其后果会非常影响糯米用户体验及口碑。 首先看一下糯米的退款情况,我们对一个月内的用户申请退款的原因进行了词频统计,对退款原因切词之后生成词频云图,最大的三个字就是“不能用”,除此之外还有类似“关门”、“倒闭”、“不接待”等字眼。同时在梳理售后的客诉数据中也可以发现,商家类投诉占比比较突出。所以商家不接待已经成为了严重影响用户体验的产品top问题。而我们的目标也是希望通过分析退款原因,结合交易、商品特征,对商家不接待的case进行挖掘。 由于糯米的产品特性,一个团单可能是只支持一家分店,也有可能支持多家分店,所以需要对具体的场景进行特定的分析。 其中单分店的商品,用户意图比较明显,(一个用户购买是这个分店,退款是这个分店)所以我们可以提取团单维度的特征进行学习挖掘。而多分店的,用户意图并不明显,因为不清楚用户购买和退款某个团单是因为哪家分店。所以我们是无法知道分店的退款率、验券率以及销量。所以我们需要借助lbs定位信息等大数据来提取用户到店信息,来构造门店特征进行分析挖掘。 这是我们的一个整体方案。主要是通过机器学习/大数据来进行数据挖掘,然后交由客服品控进行干预处理。 在学习模块:我们的样本集来源主要是退款数据、客诉数据、交易数据、以及UGC。而我们的训练样本主要是一些客服标注的接待和不接待数据。有了这些数据,我们会对我们所需要的特征进行提取。在经过一些列的样本去噪后,使用模型进行训练。而由此产出的实验数据交由客服以糯米客服的身份进行电话回访,初步确认相关原因。确认异常之后,再由客服交由品控运营同学对团单进行操作处理。而最终处理产生的这些实验数据我们会再用来优化我们的模型,提高准确率。 其中建模部分,我们聚焦了决策树算法。因为商家是否接待,其实是可以简单的进行二分,接待或是不接待。而我们的目的就是通过分类算法,把一个无序的数据集变得有序。而决策树会对每个特征节点引入影响整个数据集有序程度的这样一个量,也就是信息增益。而决策树的建树过程是个贪心算法,每次会选择信息增益最大的作为根节点。而除此之外,我们引入了区域矩阵的概念,主要是根据我们发布的几期数据,发现地域差异对准确率的影响比较大,所以我们针对团单大区进行了分类建模(不同城市匹配不同模型)。 多分店情况相比单分店业务特征比较欠缺。所以我们需要借助大数据来填充这些空白。虽然无法获得分店的下单和退款信息,但是可以清楚一个门店的验券信息。通过人流密度信息,来判断分店所处的位置客流量是否大,可以量化这样一个热门商圈因子,从而构建漏斗模型来挖掘支持多分店商品的异常不接待门店。 关注“百度质量部”订阅号,回复以下内容立马查看干货哦~ ----------------------------------------------------------- ?1.回复关键词“评测”查看评测系列文章 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |