随机数扑克解决方案
规则
- 两名玩家各获得一个从 0 到 1 的均匀分布中抽取的随机数。
- 玩家 1 可以保留他的号码,也可以将其换成一个新的随机号码。
- 玩家 2 知道玩家 1 的决定,也可以切换或保留原来的号码。
- 最后的数字较大者获胜。
问题
- 每个玩家的最佳策略是什么?
- 假设两个玩家都遵循最佳策略,那么每个玩家获胜的概率是多少?
答案
- 玩家 1 应以小于 0.567364 的点数换牌,否则停牌。
- 如果玩家 1 换人,那么玩家 2 应该以小于 0.5 的点数换人,否则停牌。
- 如果玩家 1 停牌,那么玩家 2 应该以小于 0.660951 的点数换牌,否则停牌。
- 玩家 1 获胜的概率 = 0.494333。
- 玩家 2 获胜的概率 = 0.505667。
- 假设每个玩家下注一个数字,那么玩家 1 的预期值 = -0.011333。
解决方案
显然,如果玩家 1 切换,那么玩家 2 应该以小于 0.5 的点数切换,否则保持原样。否则,如果玩家 1 的初始点数大于某个特定数字,则他应该停牌。我们把这个数字设为 x。
如果玩家 1 停牌,那么玩家 2 可以假设玩家 1 的点数不错。玩家 2 需要积极进攻才能击败他。他的策略应该是,如果玩家 1 停牌,则在某个点数(我们称之为 y)以上时换牌。
要解决这类问题,你必须求解这些无差异点 x 和 y。你可以通过将站立和切换的期望值相等来实现。
对于该解决方案的其余部分,我将从玩家 1 的角度计算预期值,假设两个玩家各下注一个单位。
我们先来解一下 x。
预期值 = y*(2x-1) - (1-y)
命中预期值 = 0.5 * 0 + 0.25 * 0 + 0.25 * -1 = -0.25。
接下来,将这些预期值设置为彼此相等:
y*(2x-1) - (1-y) = -0.25
2xy-y-1+y=-0.25
2xy-1 = -0.25
2xy = 0.75
xy = 3/8
接下来,让我们找出如果玩家 2 拥有 y 并在玩家 1 站起来后站起来的期望值:
(yx)/(1-x)+(1-y)/(1-x)* -1 =(x-2y + 1)/(x-1)
接下来,让我们找出如果玩家 2 持有 y 并在玩家 1 站立后击球的预期值:
(1 /(1-x))* [(1-x)^2 * 0 + x *(1-x)* -1] =
(1 / (1-x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x
接下来,将这些预期值设置为彼此相等:
(x-2y+a) / (x-1) = -x
x^2 - 2y + 1 = 0
x^3 - 2xy + x = 0
接下来,用 3/8 代替 xy。
x^3 + x - 0.75 = 0
4x^3 + 4x - 3 = 0。
此时您可以使用三次方程求解器得到 x = 0.567364。
已知 xy = 3/8,您可以用上面的值代入 x 得到 y = 0.660951。
然后,只需遍历这 2 到 4 个数字的所有可能落点,即可得出每个玩家获胜的概率。这可以用几何或微积分来完成。请原谅我将这部分留给读者。答案如下:
玩家 1 获胜的概率 = 0.494333。
玩家 2 获胜的概率 = 0.505667。
假设每个玩家下注一个数字,那么玩家 1 的预期值 = -0.011333。
对于那些必须准确表达答案的人来说:
设 z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0.926962
那么 x = z - 1/(3z) ~ 0.567364
那么 y = 3/(8x) ~ 0.660951
那么玩家 1 的预期值 = 3x/8 + y(y-1) ~ -0.011333
感谢 Joe Shipman 解决此问题。