请问巫师 专栏158 附录

在NBA美国职篮, 每个联盟有3个分⽀, 每个联盟的8⽀球队最后进⼊决 赛。各联盟最顶级的3⽀seeds种⼦球队分别是各分⽀的冠军, ⽽#4到#8的 seeds种⼦球队则是最佳纪录的non-division⾮分⽀赢家。今年, 有2⽀球队 来⾃Western Conference⻄部联盟的相同分⽀, Spurs⻢刺队与Mavericks 独⾏侠队, 在⻄区俱备最⾼的纪录。如果按照这样下去, 代表Western Conference⻄部联盟当中第⼆强的球队将会在第⼆轮时对战#4种⼦球 队、如果他们双⽅都胜出的话。许多⼈指出这点为体制上的问题, ⽽NBA 美国职篮将之认定为反常现象。为了费⼒解释这并⾮是反常的情况、因为 它可能常常会发⽣, 最近ESPN运动频道在⼀则博客做出以下的说明: 「每 个联盟各有15⽀球队, ⽽其中三个分⽀各有五⽀球队。那表⽰有14分之4 的机会、第⼆⽀最佳纪录的球队将会来⾃相同的分⽀、因为该队保有最佳 的记录。」他认为在某个特定联盟当中有4/ 14的机会出现这样的情况、 这样的论点是对的吗?你如何得出这样的结果?如果他是对的, 那么⾄少 在⼀个联盟当中会发⽣这种状况的机率为57%, 对吧?? — AJ from Huntington Woods, MI

是的, 他是对的。从15⽀球队当中选出最佳的两⽀球队、共有 combin(15,2)=105种⽅式。从既有分⽀当中有 3*combin(5,3)=30种⽅式 可以选出他们。所以来⾃相同分⽀选出最佳两⽀球队的机率为 30/105 = 4/14. 这样的状况来⾃⾄少⼀个联盟的机率为 1-(10/14)2 = 48.98%.

 

位读者来信批评我的假设。这⾥是他的e-mail电邮全⽂。

 

嗨 巫师,

我是你⺴站的忠实读者 - 这⾥有海量的资讯。读过某些你较旧的「Ask the Wizard请问巫师」专⻚, 我遇到⼀个问题、我认为解决的⽅式太过于 简化了。可以再深⼊检视、⽽⾮只⽤资讯来解决问题。我认为你所给出的 答案实际上⽐起真正的解答还要更加⾼深。

问题是, 在「Ask the Wizard请问巫师」 # 158, 那是关于NBA美国职篮选 拔种⼦球队的问题。其主张为, 在⼀个联盟当中的最顶端两⽀球队、来⾃ 相同分⽀的机会是14分之4. 你所给出的解答似乎是假设每⽀球队在联盟 的最后决赛时都俱有相同的排名可能性。这个论点或许是对的, 并且可以 安全假设这个问题, 接着你似乎⼜假设每⼀⽀球队在任何的3个分⽀当中都 有相等的排名。我不认为这完全就是本案例所描述的, 我相信会是这样、 那是因为排名的达成⽅式。亦即, 透过⽐赛、获得积分, 每⽀球队的排名并 ⾮独⽴于其他球队的排名之外, 也不是独⽴于它所属的分⽀之内。

我并不常将事情解释得清楚完备, 不过我试着要解释这⾥的论点为何。我 相信有某种影响在最后的排名上、那是由于各⽀球队是在稍微不平衡的赛 程当中进⾏⽐赛。每⽀球队将要⽐赛16场、对抗它⾃⾝所属的分⽀球队 - 每⽀球队⽐赛4场。不过每⽀球队在它所属联盟只要⽐赛36场⽐赛对抗其 他球队 - 4场对抗6⽀球队与3场对抗4⽀球队。这个影响让球队对抗⾃⼰所 属分⽀球队以获得积分、更甚于与其他分⽀球队⽐赛以争取积分。结果就 是, 完成联盟当中第⼀轮的球队常常会从它所属分⽀当中获得更多的积 分、⽐起其他两个分⽀的胜出者所获得的积分还要更多。这表⽰联盟当中 第⼆名的球队更难累积到积分, 因此最后更可能在联盟当中只有第⼆⾼的 积分。

我知道这个差异是微不⾜道的, ⽽且我不知道要如何将之量化, 不过我相信 可以写出电脑的模拟(这远超过我的能⼒)去找出其中可能的效应。

为了让这个问题更加凸显, NHL美式⾜球所使⽤的甚⾄是更加不平衡的赛 程。每⽀球队参加82场⽐赛、就如同NBA美国职篮那般。不过每⽀球队在 所属的分⽀要⽐赛32场 - 每队8场对抗其他4⽀球队。接着他们⽐赛40场 以对抗跨联盟的竞争者 - 每队4场对抗联盟当中的其他10⽀球队。所以这 ⾥, 各个分⽀当中的顶级球队可能⽐那个分⽀当中的第⼆名球队累积更多 的积分, 因此对于分⽀当中的第⼆名球队在整体联盟当中要累积到第⼆⾼ 的积分则会愈加困难。

最后, 要举例说明得更清楚些, 让我们只考量⼀个联盟只有4⽀球队 - 2个分 ⽀、各有2⽀球队。运⽤你在回答原来NBA美国职篮所想到的逻辑, 最佳两 ⽀球队来⾃相同分⽀的机率应该是3分之1。

如果我们运⽤⼀种平衡的赛程, 就说每⽀球队与其他球队只⽐赛⼀次。如 果你适度加权排名当中的ties和局状况, 那么电脑模拟显⽰顶级两⽀球队来 ⾃相同分⽀的机率为33.33%, 就如同预期那般。

然⽽, 如果我们陷⼊在⼀种不平衡的赛程当中, 这样将改变全局。让我们假 设每⽀球队在它⾃⾝所属分⽀当中与其他的球队各赛2次, 不过与其他分⽀ 的每⽀球队只⽐赛1次。假设与你相同分⽀球队的2场⽐赛先发⽣。所以在 每队⽐赛2场之后, 那就很清楚、在各个分⽀当中第⼆名的球队将会在其他 分⽀当中与第⼀名球队平分或落后。所以对于第⼆名的球队要想在总体联 盟的赛程当中爬到第⼆名、那将会是⾮常困难的。使⽤这种赛程的快速电 脑模拟显⽰出, 顶级两⽀球队来⾃相同分⽀的机率只有27.07%. 降低了⼤ 约6.26%.

现在, 这只是针对4⽀球队的联盟、4场⽐赛的赛程, 其中in-division分⽀内 相对于cross-division跨分⽀⽐赛的⽐率为2:1. 如果你将之拓展到15⽀球队 的联盟、82场⽐赛的赛程, 其中in-division分⽀内相对于cross-division跨分 ⽀⽐赛的⽐率更加接近于4:3.6, 就如同我之前所说的, 我会预期从你所说 的那个4 /14数值稍有偏差。在⼤范围时, 它可能会远低于1%, 我猜。不过 它还是存在的, 所以答案不可以严格说成是4/14.

⽆论如何, 我只是想要指出这点, 也感谢你提供我这个饶富趣味的问题去思 考与扩展我的思维。

致上敬意,
Jonathan Bradford