数据科学家如何玩台球 - 策略篇

risk

准度提高没有那么快,在准度相对固定的情况下,要赢得比赛,需要怎么样的策略?

上一篇讲到提高准度的问题,需要正确的方法和足够时间的投入,是一个渐变的过程,不能一蹴而就。在准度相对固定的情况下,要赢得比赛就要使用恰当的策略,每一个球的选择,力量的大小的选择,都有优化的空间。本篇以国标黑八规则为例,说说具体策略的思路,同时针对的也是普通球友准度的情况。

如果把这个问题看成典型的策略选择问题,就需要以下三个步骤:

  • 估收益
  • 算概率
  • 定决策

1. 估收益

黑八比赛的规则是双方各有7个球,黑八公用,先把自己的球打进,再打进黑八算赢,既然是目标就是把球自己的球打完,那么最简单计算每杆收益的方法就是,这一杆能打进一个球就算1,打不进就算0。这样计算简单直接,结果就是先把好打的都打进了,一开始就领先,但是剩下几个贴库,粘连的球,费了很多杆才打进,最后还是输掉了比赛。

从另一个角度想想,一个球从开球到进袋,也不是一步完成的,这有点像高尔夫的情形,离洞口越近,越容易进球,从下图中可以看到,黄色的一号球,可能处于不同的位置,如果进袋算1的话,打到离洞最近的同心圆也算是0.8了,再往外推为0.6,0.4,0.2。

risk

这样设想,如果从0.2的区域,打到0.8的区域,收益就是0.6,按原来的算法就是0,现在有了正向的收益。

再进一步想,台球是对抗的游戏,想赢球只要比对手少打一杆就行了,所以目标应该是让对手的球更难打,让自己的球更好打,让两者的差距更大,就是每次击球的目标。

比如如果一杆让对手的球从0.8的位置到0.2的位置,这一杆的收益也是0.6,比如对手有一颗球离袋口很近,这时把球停在对方球前面,就是很有收益的结果。

经过这样层层递进,最后计算每一杆收益的方法,更加接近于比赛的实际情况。

2. 算概率

每一杆的收益算完了,接下来有个问题就是准度的影响,这一杆设想的不错,但是打出来救可能不一样了。

每个人的准度在短时间内是一定,这个准度如何衡量?我们可以用一个概率分布来衡量,就是每次击球偏离最理想方向的角度分布,比如下图:

risk

蓝色线是水平较高的选手,橙色线是普通选手。对于离袋口比较近的球,容许的偏离角度误差比较大,比如黑色虚线的范围,两位选手的都有90%多的概率打进,但是对于比较远的球,这个容许误差非常小,比如黑色实线的范围,那么两位的差别就出来。

每个选手对于不同位置,不同角度都有自己的偏好,有的人打贴库球很有心得,有的人就是不知道贴库球怎么打,所以正确的估计自己在不同情况击球概率至关重要,这是接下来策略选择的基础。对于这个概率的估计,需要更多的比赛和练习,来不断校准。

3. 做决策

在了解了不同打法的收益和自己的击球概率之后,下面结合具体情况,模拟一下决策的过程。

risk

比如上图这个情景:有两颗球可以选,红色的3号是离母球比较远,但是离袋口近的,另外一颗是贴库的橙色5号球,比较难打进。

如果选择打3号球球,由于离袋口很近,打进的收益是0.4,同时由于距离较远,打进的概率是0.6,同时打不进还可能位置更差,那么收益是-0.4,这种概率为0.4,那打这颗球的期望收益就是:

0.4 X 0.6 + (-0.4 ) X 0.4 = 0.08

再看选择打5号球,而对于贴库的球,很难打进,但是可以把他打离库边,或者打到离袋口比较近的地方,这样的收益为0.3,概率为0.9,同时也可能比现在的位置还差,但是由于现在已经是很差的位置,所以收益为-0.1,概率为0.1,那么打这颗球的期望收益就是:

0.3 X 0.9 + (-0.1) X 0.1 = 0.26

这样比较下来选择这一杆选择打五号球比较好,等机会更好的时候在更容易的打三号球。

如果换一种情形,就是你的准度很好,打进三号球的概率为0.9,那么打三号球的期望收益为:

0.4 X 0.9 + 0.1 X (-0.4) = 0.32

这时候的收益比打5号球打,策略就应该是打3号球。从这里就可以看出,相同情况,不同准度,会有不同的策略,所以说对于自己准度的估计非常重要。

risk

在打8号球的时候,情况又有不同,因为八号球是公有的球,你打完之后是对方打,如果你力量比较小,没打进就给对方留下了更好的机会;如果力量太大,黑球不进弹到另外的洞里也算输球,这里面有两个不同方向因素的影响,所以对于力量的选择要更加的精准。

  • 小结

通过以上的三步,你可以在赛场上选择更优化的策略,这种策略不能保证你一定能赢,但是在一定的准度下,可以提高获胜的概率。

凭着准度的提升,策略的优化再加上运气,我有幸获得过公司内部俱乐部的杯赛和联赛冠军,希望这些对你也有用。