在这一页
球员道具分析中的常见谬误
在这一页
简介
球员道具的数学原理 - 第 5 篇(共 5 篇)
系列导航:
- 第一篇文章:理解线条背后的数学原理
- 第二条:球员道具投注的预期价值
- 第三条:道具赛的方差和资金管理
- 第四条:同场串关:相关性的数学原理
- 第五条:球员数据分析中的常见谬误(您当前所在位置)
导致投注者损失金钱的认知和数学错误
介绍
免责声明:本文仅供教育用途,并非投注建议。其目的是为了帮助读者理解导致糟糕投注决策的心理和数学误区,而非保证提供必胜策略。
在本系列文章的第 1-4 篇中,我们构建了一个用于球员属性分析的综合数学框架:
但即便拥有完美的数学工具,人类的心理和认知偏差也会误导我们。本文将探讨道具投注中最常见的谬误——直觉和分析上的错误,这些错误都会让投注者蒙受损失。
我们将涵盖以下内容:
- 赌徒谬误与小数定律
- 手感火热谬误与真正的连胜/连败
- 近因效应和信息的适当权重
- 均值回归(数学处理)
- 确认偏差和选择性统计数据
- 叙事谬误
- 样本量忽略
理解这些谬误是建立一套严谨、数学上合理的道具投注方法的最后一步。
赌徒谬误:对独立性的误解
赌徒谬误是指错误地认为过去的独立事件会影响未来的概率。在道具投注中,它表现为:
“A球员已经连续5场比赛得分低于他的总得分了。他今晚肯定会得分超过!”
为什么这样做是错误的
如果每场比赛都是独立事件(对于许多道具来说,这是一个合理的假设),那么今晚总分超过预设值的概率不会因过去的结果而改变。形式上:
对于独立事件,条件概率等于无条件概率。过去的结果对今晚的结果没有预测价值。
数学的现实
假设一名球员每场比赛都有 50% 的概率超过他的得分线(这是一个公平的投注)。那么他连续 5 场比赛得分低于得分线的概率是多少?
这种情况很罕见(发生概率为1/32),这让人感觉他“该”打出一个大分了。但这只是错觉。3.125%的概率是在连胜开始之前计算的。现在连胜已经发生,情况就不同了:
硬币(或玩家)没有记忆。每一局游戏都是全新的,胜负各半。
过去的结果确实重要
过去的结果能够更新我们对潜在概率的估计,因此具有参考价值。例如,如果我们认为某位球员得分超过预设值的概率为 50%,而他连续 10 场比赛得分低于预设值,那么:
- 我们运气不好(0.5^10 = 0.1% 的概率),或
- 我们之前估计的50%是错误的,实际概率更低。
贝叶斯推理表明我们应该更新为选项 2。但这与赌徒谬误不同——我们不是说“他应该得到”,而是说“我们的概率估计可能不正确”。
示例
球员A的得分预测值为24.5。你最初根据赛季数据(n=50场比赛,28局)估计他得分超过24.5的概率为55%。但他现在已经连续5场比赛得分低于24.5了。
赌徒谬误回应: “他该赢了!我要重注大分!”
正确的贝叶斯分析结果: “这5场比赛的样本表明,我55%的估计值可能过高。总共有50场比赛,其中28场是大分(这5场比赛之后有23场大分,27场小分),我的更新估计值为23/50 = 46%。我不应该投注大分。”
这种谬误认为过去的结果会使相反的情况更有可能发生。而正确的观点则认为,过去的结果有助于我们估计真实的潜在概率。
“手感火热谬误”与真正的连胜/连败
“手气好”谬误则与之相反:认为最近的成功可以预测未来的成功,而这种预测并没有数据支持。
“B选手最近6场比赛都打出了大分。他状态火热!押大分吧!”
研究
经典心理学研究(Gilovich、Vallone 和 Tversky,1985)分析了篮球投篮,发现没有证据表明连续投篮命中会增加下一次投篮命中的概率。球员连续投篮命中后再次投篮命中的概率并不比连续投篮不中后更高。
这表明“手感火热”很大程度上是一种错觉——人类会在随机序列中看到模式。
但是等等——条纹现象真的存在吗?
最近的研究(Miller & Sanjurjo,2018)表明,最初的分析存在一个细微的统计缺陷。经过更准确的分析,可以发现篮球投篮中存在“手感火热效应”(命中率提升约2-4个百分点)的证据并不充分。
所以真相是复杂的:
- 大多数人们认为的“手感火热”实际上是随机波动,表现为各种模式。
- 确实存在手感火热效应,但影响很小(2-4个百分点,而不是20个百分点)。
- 即使轻微的连胜或连败是真实存在的,过分重视近期表现仍然是谬误。
数学测试
如何判断连胜是真实发生的还是随机发生的?计算偶然观察到连胜的概率。
有 50% 真实概率的球员连续投出 6 局。概率:
这种情况虽然不太可能,但也并非完全不可能。如果100名玩家每人打40场比赛,我们预计会有几名玩家纯粹出于偶然地取得6连胜。
正确解读:这一连串事件只能勉强证明真实概率超过50%,但并非强有力的证据。我们应该适度更新估计值(或许从50%调整到52-54%),而不是大幅修正到75%。
均值回归(预览)
“手感火热谬误”忽略了均值回归现象:极端表现之后往往会出现相对不那么极端的表现。我们将在下一节中从数学角度探讨这一现象。
均值回归:数学原理
均值回归是一种统计现象,而非心理偏差。极端值之后往往会出现不那么极端的值,这是数学上的必然规律。
为什么会发生这种情况
任何观察到的表现都包含两个组成部分:
当我们观察到极端表现(非常高或非常低)时,很可能是:
- 真正的技能有些极端,而且
- 随机变异在同一方向上表现得极为极端。
在下一场演出中,我们期待:
- 真正的技能保持不变
- 随机变异会更接近平均值(根据随机性的定义)。
因此,下一次表现可能不会像第一次那样极端——这就是均值回归。
回归公式
如果一名球员的近期平均表现为 X_recent,长期平均表现为 X_longterm,则其预期的下一次表现为:
其中 w 是赋予最新数据的权重,它取决于:
- 近期数据的样本量(样本量越大→w值越高)
- 玩家稳定性(越稳定→w值越高)
- 变化原因(伤病恢复→w值升高;随机连胜→w值降低)
体重的大致参考标准:
其中 n_recent 是最近样本的大小,k 是一个常数(对于大多数玩家属性来说约为 30-50),表示我们对长期数据的信任程度。
示例
C球员职业生涯200场比赛场均篮板6.2个。最近10场比赛,他场均篮板9.5个。我们预测今晚的比赛结果如何?
简单粗暴的方法: “他最近的平均得分是 9.5 分,所以预测他今年的得分也是 9.5 分。”
正确的回归方法:
E[今晚] = 0.20 × 9.5 + 0.80 × 6.2
= 1.90 + 4.96
= 6.86 个篮板
我们预测他场均篮板数为 6.86 个,这比他近期的火热状态更接近他的职业生涯平均水平。这解释了他近期场均 9.5 个篮板很可能包含正的随机波动。
回归程度如何?
回归量取决于样本大小:
| 近期样本量 | 近期权重 | 职业生涯的分量 |
|---|---|---|
| 5场比赛 | 约11% | 约89% |
| 10场比赛 | 约20% | 约80% |
| 20场比赛 | 约33% | 约67% |
| 40场比赛 | 约50% | 约50% |
如果只有5-10场“火热”表现,我们应该将生涯数据权重提高80-90%。但大多数投注者恰恰相反,过分看重近期数据。
近因效应:上一局谬误
近因效应是指人们倾向于过分重视近期信息而低估较早信息,这种倾向超出了统计学上的合理范围。
常见表现
“D球员上场比赛得了35分。他今晚的得分线是24.5分。轻松超过这个分数!”
问题:单次游戏样本量为 n=1,标准误差巨大。正如我们在第二篇文章中所示,当 n=1 时,标准误差为:
单场比赛几乎说明不了任何问题。它完全是噪音,没有一点信号。
实例分析:正确的权重
球员D的情况:
- 职业生涯场均得分:22.5 分(n=300 场比赛)
- 本赛季:场均 24.0 分(n=50 场比赛)
- 上一场比赛:35 分(n=1 场比赛)
- 今晚的盘口:24.5 分
近因效应: “他上一场比赛得了35分!赌他大分!”
正确的统计响应:按方差倒数加权(样本越大,权重越大)。
赛季体重 = 50 / (300 + 50 + 1) = 14.2%
上一场比赛权重 = 1 / (300 + 50 + 1) = 0.3%
估算值 = 0.855 × 22.5 + 0.142 × 24.0 + 0.003 × 35
= 19.24 + 3.41 + 0.11
= 22.76 分
上一场比赛(35分)只是将我们的预测从22.5提高到22.76。正确的预测应该远低于24.5,而不是高于它。
当最新信息更重要时
只有当情况发生变化存在结构性原因时,才应更重视近因效应:
- 伤病恢复(球员恢复到完全健康状态)
- 角色调整(进入首发阵容,增加上场时间)
- 教练更换(新体系更适合球员)
- 交易(更好的团队,更好的利用率)
如果没有结构性原因,近期的表现大多是噪音,应该仅根据样本量进行加权。
确认偏差:只看到你想看到的
确认偏差是指人们倾向于寻找、解释和回忆那些能够证实自己已有信念的信息,而忽略与之相矛盾的证据。
它如何在道具投注中体现?
“我真的很喜欢这个结论。让我找找数据来佐证……”
- “他最近10场比赛中,有8场胜过这条线!”(暂且忽略他本赛季20胜30负的战绩)
- “他对阵这个对手场均能拿下28分!”(精选数据:n=3场比赛)
- “他的球队主场得分更多!”(确实如此,但赔率已经反映了这一点)
统计上的危险
只要变量足够多,总能找到某个球员表现出色的分组。这属于数据挖掘,而非数据分析。
例如:如果你测试 20 种不同的分组(主场/客场、对阵胜率高的球队、对阵排名前 10 的防守球队、日场比赛等),你很可能会发现 1-2 种分组,其中球员纯粹是出于偶然,超过其预期得分的概率达到 70% 以上。
数学原理:
P(7次以上成功) = 17.2%
如果你测试 20 个分段:
预期出现 7 次或以上成功的次数 = 20 × 0.172 = 3.44
即使面对实力五五开的玩家,你也会纯粹出于偶然发现 3-4 个“令人印象深刻”的分差。
解药
- 预先注册您的分析:在查看数据之前,确定您要考察的因素。
- 仅使用大样本:在信任任何拆分结果之前,样本量必须 n≥30。
- 反过来测试:对于你找到的每一个“优点”数据,也要同样努力地寻找“缺点”数据。
- 使用系统化的框架:对每个道具都遵循相同的分析流程(参见第 2 条)。
样本量忽略:小数定律
忽略样本量不足是指未能考虑样本量对置信度的影响。小样本存在巨大的不确定性,但投注者往往将其视为可靠的结果。
数学的现实
从com/article/expected-value-in-player-prop-betting/">文章 2,请记住,标准误差取决于样本大小:
95% 置信区间的宽度约为 ±2 SE:
| 样本量 | 标准误差 | 95% 置信区间宽度 |
|---|---|---|
| 5场比赛 | 22.4% | ±43.8% |
| 10场比赛 | 15.8% | ±31.0% |
| 25场比赛 | 10.0% | ±19.6% |
| 50场比赛 | 7.1% | ±13.9% |
| 100场比赛 | 5.0% | ±9.8% |
关键信息: 10场比赛中,7局的概率为70%,因此95%置信区间为[39%, 100%]。这与39%到100%之间的真实概率相符。数据几乎没有告诉我们任何信息!
示例
两名玩家:
球员 E:近 10 场比赛中,胜率超过预设值的概率为 70%(7 胜 3 负)
球员F:近100场比赛胜率超过预设值70%(70胜30负)
问题:我们应该更信任哪70%的人?
玩家 E(n=10):
95% 置信区间 = [41%, 99%]
玩家 F(n=100):
95% 置信区间 = [61%, 79%]
玩家F的70%胜率要可靠得多。玩家E的胜率很可能只有50%,只是运气好而已。
最小样本量规则
对于任何拆分或子集分析:
- n < 10:完全忽略纯噪声
- n = 10-30:证据较弱,谨慎使用
- n = 30-50:证据中等,值得考虑。
- n > 50:证据充分,可用于可靠估计。
大多数道具投注者经常违反这一规则,只相信 5-10 场比赛的样本。
叙事谬误:故事重于统计数据
叙事谬误是指围绕随机或统计现象构建解释性故事,然后用这些故事来预测未来的倾向。
共同叙事
- “他动力十足,因为他要对阵的是老东家!”
- “他们总是全力以赴地迎战对手!”
- “这是一场必须赢的比赛,他一定会挺身而出!”
- “他正处于合同年,他会格外专注!”
为什么叙事是危险的
这些说法有时或许属实,但它们存在以下问题:
- 不可证伪性:如果他表现出色,这种说法就得到了证实。如果他表现不佳,我们就用其他理由搪塞过去(“他动力太强,压力太大了”)。
- 后见之明偏差:事后,我们会构建一些叙事来“解释”结果。但这并不意味着这些叙事本身具有预测能力。
- 样本量=1:我们只会记住某人“发挥出色”的那一次,而不会记住他们20次表现不佳的情况。
测试
在根据某种说法下注之前,请先问问自己:
- 这可以测试吗?我可以收集以往案例的数据吗?
- 数据显示了什么?球员在对阵老东家时是否真的表现更好(平均而言,在样本量足够大的情况下)?
- 这种影响是否已反映在价格中?如果这是一种已知现象,博彩公司应该已经对此进行了调整。
例如:“复仇游戏”叙事
旁白:“球员G总是对他的老东家发飙!”
测试一下:球员G自被交易以来,已经与老东家交手4次。结果分别为:28分、18分、32分、22分。平均得分:25分。
职业生涯平均得分:24 分(n=200 场比赛)。
分析:
职业生涯:场均 24 分(n=200)
样本量 n=4 的标准误差 = √[方差/4] ≈ 12 PPG
差值 = 25 - 24 = 1 PPG
统计显著性 = 1 / 12 = 0.08 个标准差
“复仇游戏”效应在统计学上与零没有显著差异。这种说法缺乏数据支持。
叙事的重要性
当叙述能够指出可以用数据验证的结构性变化时,它们就很有用:
- “他缺席了20场比赛后现在已经恢复健康” → 查看上场时间、使用率
- 新教练为他设计了更多战术 → 查看每场比赛的投篮次数和触球次数
- “球队摆烂,他上场时间会更多”→ 查看实际上场时间趋势
但要利用叙述来确定要测试的内容,而不是将叙述本身作为测试。
相关性与因果关系
这是道具分析中经常出现的一个经典错误:
“当A队得分超过110分时,H球员场均得分28分(n=12)。他的数据是24.5,我认为今晚A队会得115分。轻松超过!”
问题
相关性并不意味着因果关系。可能有多种解释:
- 球员影响球队得分:当球员 H 表现出色(得分 28 分以上)时,球队得分 110 分以上(因果关系:球员 → 球队)
- 团队得分导致球员得分:当团队表现出色并得分超过 110 分时,球员 H 将获得更多机会并获得更多分数(因果关系:团队 → 球员)
- 共同原因:两者同时发生是由于第三个因素(例如,对手防守薄弱导致两者同时发生)。
- 反向因果关系:样本是精心挑选的——你看到的比赛都是因为某个球员得分超过28分,所以球队得分超过110分。
为什么这很重要
如果解释 1 是正确的(球员导致球队得分),那么你不能用“球队将得 110 分”来预测球员的表现——因果关系正好相反。
如果解释 4 是正确的(反向因果关系),那么相关性对于预测来说是没有意义的——你选择的比赛玩家本来就很厉害。
测试
要确定因果关系方向,请检查:
- 时间顺序:什么先发生?第一个进球?第一节比赛表现?
- 自然实验:玩家得分低但团队得分高,或反之亦然的比赛
- 控制变量:在控制对手实力后,相关性是否仍然成立?
通常来说,最稳妥的假设是:没有证明因果关系的关联性没有预测价值。
案例研究:避免多重谬误
让我们分析一个可能让我们误入歧途的道具,并展示如何正确思考。
情况
球员 J:总助攻数超过 8.5 次,赔率为 -110
数据:
- 职业生涯场均助攻数:7.2次(n=300场比赛)
- 本赛季:场均 8.0 次助攻(n=45 场比赛)
- 最近8场比赛:场均10.5次助攻(8场超过8.5次)
- 今晚的对手:场均允许对方控球后卫获得 9.2 次助攻(联盟平均水平:8.5 次)
- 今晚对阵老东家
谬误推理
赌徒谬误回应: “最近8场比赛8胜0负?他不可能一直保持下去。押小分!”
- 错误:如果真实概率超过 50%,则预期会出现连续波动,而不是出现衰退迹象。
应对手感火热谬误: “最近8场比赛8胜0负!他状态正佳!轻松拿下大分!”
- 错误: 8 场比赛样本量太小;过分强调了近期的表现;没有考虑均值回归。
叙事谬误回应: “复仇之战!他要让他的老东家好看!赌局结束!”
- 错误:没有数据显示复仇游戏效应;此特定情况下样本量为 1;无法证伪的叙述。
确认偏差反应: “他最近表现出色,对手送出助攻,这是一场复仇之战——一切都表明比赛结束了!”
- 错误:只挑选支持性证据;不审查相反的证据(职业生涯平均水平远低于该线)。
恰当的分析
步骤 1:按样本量称重
赛季体重变化 = 45 / (300 + 45 + 8) = 13%
近期权重 = 8 / (300 + 45 + 8) = 2%
基本估计值 = 0.85 × 7.2 + 0.13 × 8.0 + 0.02 × 10.5
= 6.12 + 1.04 + 0.21
= 7.37 次助攻
第二步:根据对手调整策略
对手场均允许对手送出 9.2 次助攻,而联盟平均水平为 8.5 次,相差 0.7 次助攻。这虽有意义,但差距并不大。
步骤 3:考虑不确定性
助攻的标准差通常约为 2.5。假设估计值为 8.07,而基准值为 8.5:
P(超过 8.5) ≈ 47%
步骤 4:计算 EV
结论
通过避免谬误(热手谬误、叙事谬误、近因效应、确认谬误)并使用适当的统计方法(样本量加权、均值回归、不确定性量化),我们得出的结论与直觉/谬误推理所暗示的结论截然不同。
严谨的分析表明应该放弃。而所有谬误的分析都表明应该下注——这恰恰说明了理解谬误至关重要。
摘要:谬误及其应对方法
| 谬论 | 错误 | 解毒剂 |
|---|---|---|
| 赌徒谬误 | 认为过去的结果会影响未来独立事件的观点 | 理解独立性;仅使用历史数据来更新概率估计 |
| 热手谬误 | 过分强调近期表现作为预测指标 | 检验连胜是否具有统计学意义;预期回归均值 |
| 近因效应 | 过分强调近期比赛数据而非职业生涯数据 | 按样本量加权;权重约为0.3%时使用n=1,而不是50%。 |
| 均值回归 | 未能预料到极端表现会趋于平缓 | 使用加权平均值:w × 近期 + (1-w) × 职业生涯 |
| 确认偏差 | 挑选支持既有观点的数据 | 预先注册分析;同样努力地寻找相反的证据 |
| 忽略样本量 | 将小样本视为可靠样本 | 任何分割都需要n≥30;计算置信区间 |
| 叙事谬误 | 用无法证伪的故事代替数据 | 用数据检验叙述;重点关注结构性变化 |
| 相关性≠因果关系 | 假设相关性意味着预测关系 | 检验因果关系方向;需要进行自然实验 |
构建一个不易出错的投注流程
为了系统性地避免这些谬误,需要建立一套一致的分析流程:
1. 使用标准化框架
对每个道具都按照相同的步骤操作,并基于文章 1-4 中的完整框架进行构建:
- 利用文章 1中的技术(赔率转换、持仓计算)提取市场信息
- 收集历史数据并计算置信区间(第 2 条)
- 按样本量加权并对均值应用回归(第 2 条)
- 谨慎运用情境调整(第二条)
- 计算期望值(第二条)
- 使用凯利准则进行投注规模计算(文章 3 )
- 如果对同一场比赛中的多个道具进行投注,则需要考虑相关性(第 4 条)
永远不要因为“感觉”或“直觉”而偏离你的流程。
2. 记录决策日志
记录每笔投注:
- 你的概率估计和推理
- 你考虑了哪些数据?
- 你忽略了哪些数据?为什么?
- 结果和球员实际表现
每季度回顾:你是否陷入了某种模式?是否过分重视近期比赛?是否选择性地引用数据?
3. 计算校准值
下注 50 次以上后,测试一下你的校准情况:
- 当你估计概率为 55% 时,道具命中率是否约为 55%?
- 当你估计概率为 65% 时,道具命中率是否约为 65%?
如果你的校准不准确(估计为 60%,但实际达到 50%),你就陷入了谬误——很可能是过度自信和确认偏差。
4. 使用基本费率
始终以基准率(职业生涯平均值、赛季平均值)为起点,并需要强有力的证据才能证明其偏离基准率。举证责任在于近期数据,以推翻大样本职业生涯数据。
5. 接受不确定性
以范围而非具体数值表示估算值:
- 错误:“我估计概率正好是 57.3%”
- 好的:“我估计概率在54%到60%之间,最佳猜测是57%”。
这种谦逊可以防止过度自信和过大的赌注。
6. 寻找反驳证据
在下注之前,务必刻意寻找不下注的理由。如果你找不到任何反驳证据,说明你寻找得还不够仔细——这就是确认偏差在作祟。
结论
本文是我们关于球员道具数学原理的五篇系列文章的最后一篇。我们之前已经探讨了以下内容:
- 文章一:如何解读赔率、将赔率转换为概率以及了解博彩公司抽水策略
- 第二条:如何根据数据计算期望值并估计真实概率
- 第三篇:如何运用凯利准则优化投注额度并管理资金
- 第四条:相关性如何影响同场串关投注以及为什么同场串关投注通常价值不高
- 第五条:如何识别和避免导致投注者损失金钱的认知谬误和数学谬误
我们在最后一篇文章中探讨的谬误或许是整个系列中最重要的一环。即使你拥有完美的数学工具(第1-4篇文章),但如果你陷入赌徒谬误、手气好时的错误思维、确认偏差或样本量忽略等陷阱,你仍然会做出糟糕的投注决策。
本文要点:
- 独立事件没有记忆:过去的结果并不会增加相反结果发生的概率。使用历史数据是为了估计概率,而不是预测“必然”的结果。
- 均值回归是不可避免的:极端表现往往会趋于平稳。职业生涯数据应被赋予更高的权重;近期的小样本数据则不宜过分重视。
- 样本量至关重要: 10 场比赛几乎说明不了任何问题。在得出任何可信的结论之前,样本量至少要达到 n≥30。计算置信区间。
- 叙事并非证据:关于动机、复仇和势头的故事通常无法证伪,也未经检验。应关注可衡量的结构性变革。
- 确认偏差无处不在:只要有选择性地寻找证据,就能找到支持任何观点的证据。因此,应该使用系统性的框架,并寻找反驳证据。
- 建立一致的流程:避免谬误的方法是进行系统分析,每次都遵循相同的步骤,并加入校准和审查环节。
球员道具投注的数学原理严谨且容错率极低。优势难得,波动性极大,谬误无处不在。但通过将文章 1-4 中的数学框架与文章 5 中的认知方法相结合,您可以运用清晰的思路和严谨的统计方法来处理道具投注,从而最大限度地提高成功率。
最重要的是:要对自己诚实。如果你在仔细追踪了100多笔投注后仍然没有盈利,那么你可能并没有优势。这并非道德上的失败——战胜有效市场极其困难。但认识到这一点是改进分析方法或更有效地利用时间和资金的第一步。
感谢您阅读本系列文章。我希望它能帮助您更清晰地思考球员道具投注中的概率、价值和风险。
全系列
球员道具的数学原理——全部5篇文章
- 第一篇文章:理解线条背后的数学原理
- 第二条:球员道具投注的预期价值
- 第三条:道具赛的方差和资金管理
- 第四条:同场串关:相关性的数学原理
- 第五篇:球员属性分析中的常见谬误(本文)
相关赔率奇才文章
- 投注系统与谬误——赌博中的其他认知偏差
- 为什么投注系统会失败——递增系统的数学原理
- 体育博彩概述- 全面的体育博彩数学