DataRobot:预测客户流失,数据如何帮助留住客户
2019年08月19日 由 bie管我叫啥 发表
570967
0
客户维系是公司最关心的问题。获取客户成本通常比维系客户的成本高5至25倍。但是,不希望被打扰的客户会流失,另一方面,无论你提供什么,一些客户都可能想要离开。你如何识别仍然可以维系的客户?
答案是客户流失建模。但这并不像将数据放入电子表格和构建模型那么简单。你可能有跨许多不同数据源的客户数据。除了关于每个客户的一般人口统计数据(如他们何时首次成为客户以及他们居住在哪里)之外,你可能还有他们的购买或产品使用历史。
你也可以和你的支持团队或调查反馈进行互动。将这些数据结合在一起,可以更深入地了解客户可能流失的原因。那么,如何将所有这些数据集中到一个位置?
客户流失对业务意味着什么
在合并数据源之前,需要考虑重要的数据和业务方面。首先,需要定义流失的含义。是否会在未来30天内进行购买?或是下一年?或者公司是基于订阅的,流失取决于客户是否续订其订阅。这些问题的答案将定义您如何创建目标变量(客户流失)以及您希望关注的时间范围。
下一个要解决的问题是,你有多少数据?如果你有数千或数十万客户,那么你可以在确定的固定时间段内对客户抽样。在此数据集中,客户永远不会超过一行。
但是如果你只有几百个客户呢?如果数据的观察数量有限,则可以创建一个数据集,其中每行代表一个客户的一个时间片段。
在此设置中,将为每个客户提供多个观察(时间片段)。时间片段将由你定义流失的方式决定。如果在接下来的30天内将流失定义为购买,那么一个时间片段将是一个月,每个客户的行数将等于他们曾经(或曾经)客户的月数。如果客户是按年度订阅,那么一个时间片段将是一年。
在这种情况下,你的数据是累积的,按客户划分数据非常重要。如果一个客户的数据被分割到多个分区,那么你的样本外预测将不会真正是样本外的,模型将与训练数据过度匹配。
最后,你需要了解公司将如何处理此客户流失模型。如果有一天没有足够的时间来说服客户留下来,那么预测明天谁会流失会有什么好处呢?关注哪些利益相关者将利用这些预测。客户支持是否会使用此模型将额外的时间花在最有可能流失的客户身上?你的营销团队能否提供折扣或优质产品来说服客户留下来?
这不仅会影响建模的时间周期,还会提示你需要在数据中包含哪些特性。请记住,预测的时间越长,模型需要利用的数据就越少。因此,模型可能会降低准确性。最终,在准确性和可操作性之间存在权衡。与模型预测的消费者密切合作,将确保他们使用可以信任的模型获得所需的业务结果。
如何避免前瞻性偏见
我们在流失建模中看到的最常见的错误是前瞻性偏见。对于流失模型,很容易包含模型中预测时不具备的数据。
同样,如果随机抽样选择2017年是否有客户流失,并且某个功能是平均每月支出,那么需要注意不要计算客户生命周期内的平均每月支出。它必须是2017年之前的平均每月支出。提前考虑潜在目标泄漏的区域可以帮助模型在生产环境中按预期运行。
一旦有了数据集,DataRobot可以帮助你在短时间内为用例构建最佳模型。我们的解决方案将自动构建数十个模型,不仅可以找到最具预测性的模型,还可以找出可能的解释为什么客户可能会流失。
模型可以识别最不可能流失的客户,因此你不会因保留电子邮件而烦恼。对于那些可能流失的人,我们的解释可以确定导致客户流失的原因。如果他们为了控制之外的原因而离开,那么无论你如何努力他们都会离开,你可以将时间集中在仍然可以维系的客户身上。
你的营销团队会喜欢有人推荐他们能为客户做些什么来留住他们,你的整个公司将从更好的商业智能中受益。