奇趣编程|统计宝|吐钱机问题稳定提高胜率的原理[精华]

奇趣编程通过统计宝数字规律分析器研究随机数规律时发现,只要是人工决策的东西,就必定存在某些定势或规律,这是因为人类存在着某些共同的心理倾向或思维习惯。

历史上曾经有一个困扰了科学家很久的“吐钱机问题”。

假设你走进一个房间,里面有编号“0”至“9”的十台随机吐钱的机器,但是每台机器吐钱的概率各不相同,而你又不知道哪一个机器的吐钱概率比较高,如果你想得到最多的钱,你会怎么做呢?很明显,你肯定会一台一台机器都测试一下,看每台的机器吐钱的概率是多少,然后挑出吐钱概率最高的那一台来玩。

然后你又走进另一个房间,里面只有编号为“A13579”和“B24680”两台随机吐钱的机器,你在编号为“A13579”的机器上测试了10次,吐出了6次钱,又在编号为“B24680”的机器上测试了2次,只吐出了1次钱,那么请问哪一台机器更有可能让你得到更多的钱?

奇趣编程认为,我们可以这样算,编号为“A13579”的机器上测试了10次,吐出了6次钱,出钱概率为60%;编号为“B24680”的机器上测试了2次,只吐出了1次钱,出钱概率为50%,显然大多数人会认为前者更有可能让你得到更多的钱。

但是,这样的决策过程是有问题的,因为第二台机器只测试了2次,测试的次数太少了,原则上是应该两台机器测试同样多的次数才能进行比较,因此,只测试了2次而计算出来的概率,是不能作为决策依据的,很容易失灵,你要两台都测试够10次才能进行决策。

这里还有一个隐含的问题,就是你能在这个房间里总共玩多少次,假如你最多只能玩13次,而你已经测试用掉了12次,最后的第13次你选择哪一台机器?假如你可以玩100次,那你会分别在两台机器上各测试多少次?如果你可以每天玩1000次你会先在两台机器上测试多少次还是有别的更好的解决思路?

这就引出了另一个更深层次的问题,剩余时间的价值会随着剩余时间的减少而不断提高,利用好剩余时间是我们最好的策略,那么如何合理利用剩余时间?如何最大化利用剩余时间的价值?这是一个历史上曾经困扰了科学家很久的问题。

直到1952年,哥伦比亚大学的数据学“赫伯特-罗宾斯”提出了一个可以优于碰运气的简单的策略,这个策略就是随机选择一台吐钱机,只要它不断吐钱,就一直在这台机器上玩,如果多次不吐钱了,就换另一台机器。

这个策略虽然不完美,但也优于碰运气的瞎玩,这个策略叫做“赢留输变”策略。

后来不少人进一步通过实验研究,发现这是人类决策过程中普遍存在的现象,所以又叫做“赢留输变”原则。人们研究发现,当某台机器让你获得了钱,你就会对这台机器的评估值升值,倾向于在这个已经让你盈利的机器上再玩一次,而不是冒险去一台完全没玩过的机器上去碰运气。

奇趣编程个人认为,这可能和人类进化的历程有关,因为人类是从原始动物进化来的,在人类还是原始动物时,如果在一个地方经常捕获到猎物,那么他就会倾向于下次还来这个地方,如果这个地方变得很难打到猎物了,他就会换一个地方。这是一个生存的策略,不符合这个生存策略的动物物种都已经灭绝了,符合这个生存策略的动物物种才能生存下来一直进化到今天。所以这个生存策略,是经历了几百万年的演化过程而存在于我们人类的基因里的,是所有动物界的决策策略。

既然我们已经知道人类的决策倾向,那么我们怎么利用别人的决策倾向来为自己谋利呢?我们下篇分享。