数据驱动的反思
2019年07月06日 由 sunlei 发表
378155
0
企业正在大量雇佣数据科学家,以做出严谨、科学、公正、数据驱动的决策。
现在,坏消息来了:这些决策通常不是所想象的那样。
要想做出数据驱动的决策,就必须是数据(而不是其他东西)驱动它。看起来很简单,但在实践中却很少见,因为决策者缺乏关键的心理习惯。
数据驱动被破坏
想象一下,你正在考虑在网上买东西,而不是到镇上的另一边去购物。你已经把你的决定归结为是否相信网上卖家。快速搜索会产生一些相关的数据:您可以看到卖家的平均评分是4.2分(满分5分)。
如果没有决策基础,您的决策最多只会受到数据的启发,而不是数据的驱动。
现在你不能用4.2来驱动你的决策。游戏结束!一旦我们看到了答案,我们就可以自由地选择最方便的问题。如果我们做的第一件事是在数据中摸索,那么我们的决定充其量也就是我所称的数据启发。
数据启发
这就是我们,就像鲸鱼遇到浮游生物一样,在一些地方游来游去,然后到达情感的临界点,然后……做出决定。有一些数字接近我们的决定,但这些数字并不能推动它。这个决定完全来自其他地方。
[caption id="attachment_41795" align="aligncenter" width="1024"]
在一些数据中游动的鲸鲨。[/caption]
决策者在数据出现之前就已经下定决心了,所以决策一直都在那里。事实证明,人类会选择性地与数据互动,以确认我们内心深处已经做出的选择。我们找到了最方便的光线来观察证据,但我们并不总是知道自己在做什么。心理学家对此有一个可爱的名字:确认偏见。
许多人只使用数据来更好地了解他们已经做出的决定。
使问题与答案相符
4.2/5是个好数字吗?这取决于你无意识的偏见。一个真正想在网上购物的决策者会眯着眼睛看4.2,然后高兴地唱出这个数字有多高。“已经超过4.0了!”他们甚至可以给出一个严格的分析,说明它在统计上是如何显著高于4.0的。(确定!这是你一直想要的p值。)与此同时,如果有人真的不想使用这个卖家,他会找到另一种方式来回答这个问题:“我为什么要满足于一个评级低于4.5星的卖家?”或者“看看那些一星评论。我不喜欢有这么多。”听起来是不是很熟悉?
分割数据的方法越多,你的分析就越容易滋生确认偏见。
数学的复杂性并不能提供解解药,它只会使问题更难被发现。结果,在我们刚刚看到的这个简单例子中显而易见的东西被隐藏在一堆华丽的高斯函数中。不要假设你友好的邻居数据科学家也看到了它。分割数据的方法越多,你的分析就越容易滋生确认偏见。
结果呢?决策者最终会使用数据来更好地了解他们将要做的事情。
一个昂贵的业余爱好
当分析复杂或数据难以处理时,一些悲剧就会进入我们的喜剧。有时候,一群数据科学家和工程师花了几个月的时间才把一切归结为4.2这个数字。在一段艰苦的旅程结束时,数据科学团队成功地给出了结果:5分满分这里的数据为4.2分!数学计算得很细致。这个团队夜以继日地工作,以便按时完成任务。
利益相关者如何处理它?是的,和我们之前的4.2一样:通过他们的观察,对真实世界的行为没有影响。它是否准确并不重要——如果所有那些糟糕的数据科学家只是编造了一些数字,那就没有什么不同了。
[caption id="attachment_41797" align="aligncenter" width="493"]
当决策者缺乏基本技能时,世界上没有数学可以解决这个问题。您的数据科学团队不会对数据驱动的决策做出贡献。[/caption]
使用这样的数据来更好地了解我们无论如何要采取的行动,这是一种昂贵(也是浪费)的爱好。数据科学家朋友们,如果你的组织受到这种决策者的困扰,那么我建议坚持最轻量级和最简单的分析,以节省时间和金钱。在决策者得到更好的训练之前,你那华丽的数学柔术只会产生消散的热量。
消除确认偏误
问题:在确定数据的位置之后,您可以自由地移动目标栏。(当然你每次都能正确进入,你真是棒。
解决办法:提前设定目标,抵制诱惑,以后再去做。
换句话说,决策者在分析数据之前有一些家庭作业要做。
在决策者得到更好的训练之前,华而不实的数学柔术只会产生消散的热量。
制定决策和制定决策标准本身就是一门科学(我们将在以后的文章中深入探讨,因为我们在这里研究的问题只是冰山一角),但与此同时,一个快速的解决方法是在您的数据科学项目中提前提出您的决策边界。
熟能生巧
最近我和朋友艾玛去布鲁克林买衣服。她炫耀一件漂亮的连衣裙,扯着背后的价签。“嘿,这多少钱呢?”她问我。“如果少于80美元,我就买。”
现在这是一些决策智能!她没有先看到价格,然后自言自语地做出她的决定,最后使用数据来驱动它。有了一个良好的练习反射,她权衡了自己对服装的喜爱程度和预算,然后设定了决策边界,并且只允许自己在完成后查看数据(价格)。她习惯于按正确的顺序使用数据,这也是你可以参考的。
人们并不总是需要数据驱动,艾玛知道这一点。她不必那样做不重要的决定,但她也知道实践是完美的。在琐碎的决定上养成习惯要比在重要的决定出现时努力养成习惯容易得多。
谈判课
这种想法并不新鲜。很多不同的课程都会教谈判,尽管其中有一门几乎肯定会在第一天就涵盖到谈判。如果你在谈判前没有给你的最佳替代方案估价,你最好在你的额头上画上“不知道我在做什么”。换句话说,这是一样的事情:找出默认操作和替代操作之间的决策边界。
解决方法是提前设定决策标准。
事实上,对于谈判者来说,标准的建议是通盘考虑所有可能的报价组合,并事先计划好你对它们的反应,否则,经验丰富的对手很容易占你的便宜。即使没有对方所有的说服策略,一些无关紧要的短期因素,比如你的血糖水平、你的心情、对方微笑的程度,以及阳光是否灿烂,都会对交易产生不成比例的影响。同样,数据分析也是如此——把数据想象成与你谈判以改变你的想法。解决办法就是提前计划好你的反应。比如,下次你在谈薪水的时候,一定要在听到对方的数字之前想好自己的数字。
当你掌握它的窍门时,它很容易
不管你是在看到一个数字之前还是之后思考它对你意味着什么,你仍然需要思考它。事先进行此操作可以帮助您对抗人工编程中的一些bug,从而在决策质量和协商性能方面获得较大的收益。改进这里的操作顺序是一个值得培养的宝贵习惯,如果你想参与数据驱动的决策,这一点至关重要。
最后这里有一些额外的好消息:通过练习,它会让你感觉很自然。