WOO logo

在这一页

同场串关:相关性的数学原理

在这一页

简介

同场串关:相关性的数学原理

球员道具的数学原理 - 文章 4(共 5 篇)

系列导航:

相关性如何影响串关定价以及为什么单注投注的庄家优势更高

介绍

免责声明:本文仅供教育用途,并非投注建议。本人不认可或推荐将同场串关作为投注策略。本文旨在帮助读者理解其定价背后的数学原理。

同场串关(SGP)已成为体育博彩中最受欢迎的投注产品之一。与传统的串关投注(将不同比赛的投注组合在一起)不同,同场串关允许您将同一场比赛的多个投注组合成一个投注。

根本的数学挑战在于:同一场比赛中的不同结果并非相互独立。如果一支球队赢盘,那么他们总得分超过预设值的概率也会更高。如果一名四分卫传球超过300码,那么他的球队获胜的概率也会更高。这些相关性从根本上改变了串关投注的定价方式。

本文解释了体育博彩公司用于为特定投注项目(SGP)定价的数学原理,包括相关矩阵、高斯 copula 方法和经验频率调整。本文建立在第一篇文章(赔率转换为概率)和第一篇文章(期望值计算)中介绍的概念之上。

传统帕雷数学(独立事件)

对于包含独立事件的传统串关投注,其数学原理很简单。如果您有n 个投注,每个投注的概率分别为p₁ , p₂ , ..., pₙ ,那么所有投注都赢的概率就是各个投注概率的乘积:

P(全部获胜) = p₁ × p₂ × ... × pₙ

该公式依赖于独立事件概率的基本规则。如果知道事件 A 发生并不能提供关于事件 B 是否发生的任何信息,则称事件 A 和 B 是独立的(形式上:P(A ∩ B) = P(A) × P(B))。

示例:传统三串一

假设你对来自不同游戏的三个赌注进行串关投注(确保彼此独立):

  • A队让分-110(隐含概率≈52.4%)
  • B队让分-110(隐含概率≈52.4%)
  • C队让分-110(隐含概率≈52.4%)

关于隐含概率的说明:我们使用文章 1中的公式将美式赔率转换为概率。例如,对于 -110 的赔率:

隐含概率 = 110 / (110 + 100) = 110 / 210 = 0.524 = 52.4%

合并概率(假设相互独立):

P(全部获胜) = 0.524 × 0.524 × 0.524 = 0.144 = 14.4%

公平赔率计算:如果真实概率为 14.4%,则公平赔率计算如下:

公平赔率(十进制)= 1 / 0.144 = 6.94
美国公平赔率 ≈ +594

实际赔付:大多数体育博彩公司对标准赔率为 -110 的 3 串 1 投注赔付约为 6 比 1 (+600)。

博彩公司的优势在于支付的赔率略低于公平赔率。在这种情况下:

实际赔付隐含概率 = 1 / 7 = 14.3%
庄家优势 = (14.4% - 14.3%) / 14.4% ≈ 0.7%

这种适中的庄家优势在传统串关投注中属于正常水平。然而,这种计算的关键在于假设每场比赛的结果都是独立的——即每场比赛的结果互不影响。对于同一场比赛的串关投注,这个假设完全不成立。

同场串关投注中的相关性问题

当所有投注都来自同一游戏时,独立性就被破坏了。考虑以下常见的SGP构造:

  • A队获胜(-140,隐含概率≈58.3%)
  • A队四分卫传球超过275.5码(-110,隐含概率≈52.4%)
  • 比赛总得分超过 48.5 分(-110,隐含概率 ≈ 52.4%)

这些结果呈正相关

  • 如果A队获胜,他们的四分卫很可能表现出色 → 第一局和第二局之间存在正相关性
  • 如果四分卫传球超过 275 码,比赛得分可能更高 → 第二回合和第三回合之间存在正相关关系
  • 如果A队获胜,尤其是以较大优势获胜,总分更有可能超出预期 → 第1轮和第3轮之间存在正相关性

使用独立性公式会大大低估这三个物体同时击中目标的真实概率。

数学框架

设 X₁、X₂、X₃ 为二元随机变量(1 = 赢,0 = 输),分别代表串关投注的三项结果。我们需要计算:

P(X₁=1, X₂=1, X₃=1) = ?

独立后:

P(X₁=1, X₂=1, X₃=1) = P(X₁=1) × P(X₂=1) × P(X₃=1)

具有相关性:

P(X₁=1, X₂=1, X₃=1) ≠ P(X₁=1) × P(X₂=1) × P(X₃=1)

真实概率取决于 (X₁, X₂, X₃) 的联合概率分布,该分布反映了结果之间的协同变化。我们不能简单地将边缘概率相乘;我们必须考虑这种依赖结构。

为了合理定价此串关投注,博彩公司必须直接估算 P(X₁=1, X₂=1, X₃=1),并考虑相关性。本文余下部分将探讨他们使用的方法。

相关矩阵:衡量依赖性

体育博彩公司利用历史数据来估算相关性。对于每一对投注类型(例如球队胜负与球队总得分、四分卫码数与比赛总得分等),他们都会根据过去数千场比赛的数据计算经验相关系数。

皮尔逊相关系数

对于两个二元结果 X 和 Y(分别编码为 1 表示胜利,0 表示失败),皮尔逊相关系数为:

ρ = [P(X=1, Y=1) - P(X=1) × P(Y=1)] / √[P(X=1) × P(X=0) × P(Y=1) × P(Y=0)]

分子衡量联合概率与独立性预测值之间的差异程度。分母将这种差异归一化,使其值介于 -1 和 +1 之间。

解释:

  • ρ = +1:完全正相关(两者总是同时发生)
  • ρ = 0:无相关性(独立事件)
  • ρ = -1:完全负相关(当一个事件发生时,另一个事件永远不会发生)
  • 典型的体育博彩范围: ρ介于-0.4和+0.6之间

相关矩阵示例

以下是根据 NFL 比赛历史数据推导出的一个假设性相关矩阵。这些数值仅为示例,但具有代表性,能够反映体育博彩公司可能观察到的相关性:

团队获胜四分卫传球超过275码总超过
团队获胜1.00 0.35 0.28
四分卫传球超过275码0.35 1.00 0.42
总超过0.28 0.42 1.00

该矩阵显示了中等程度的正相关性。相关性最强(0.42)的是四分卫传球超过275码与比赛总得分超过预设值之间的相关性——这符合直觉,因为高传球码数通常预示着高得分比赛。

球队获胜与四分卫的表现(0.35)以及比赛总分超过预设值(0.28)均呈正相关,尽管这些相关性较弱。这种结构很典型:相关性存在,但很少达到极高的程度。

重要提示:相关矩阵会因比赛情况(热门球队与冷门球队、主场与客场、总分高低比赛等)而显著变化。成熟的体育博彩公司会针对不同的比赛情况维护不同的矩阵。

高斯Copula法在SGP定价中的应用

体育博彩公司使用的一种复杂方法是高斯 copula ,它能模拟联合概率,同时保留每笔单独投注的边缘概率。这种方法将边缘行为(每笔投注单独获胜的频率)与依赖结构(投注如何共同变化)区分开来。

方法论

  1. 转换为正态变量:使用逆正态累积分布函数(CDF)将每个二元结果转换为潜在的连续正态变量:
    Z₁ = Φ⁻¹(p₁), Z₂ = Φ⁻¹(p₂), Z₃ = Φ⁻¹(p₃)

    其中 Φ⁻¹ 是逆标准正态分布累积分布函数,p₁、p₂、p₃ 是边缘概率。

  2. 应用相关结构:将 (Z₁, Z₂, Z₃) 模型化为具有相关矩阵R 的多元正态分布:
    (Z₁, Z2, Z₃) ~ MVN(0, R)

    其中 R 包含相关矩阵中的成对相关系数。

  3. 计算联合概率:三个赌注全部获胜的概率为:
    P(全部获胜) = P(Z₁ > c₁, Z₂ > c₂, Z₃ > c₃)

    其中 c₁、c₂、c₃ 是对应于每个赌注未获胜的临界值(即 cᵢ = Φ⁻¹(1 - pᵢ))。

对多元正态分布的这种积分通常使用蒙特卡罗模拟或数值积分方法计算。

示例

使用之前提到的三串一投注策略,并结合上面所示的相关矩阵:

  • A队获胜的概率 = 0.583
  • P(四分卫传球超过275码) = 0.524
  • 总分超过 48.5 的概率 = 0.524

独立后:

P(全部获胜) = 0.583 × 0.524 × 0.524 = 0.160 = 16.0%

利用相关性(使用上述矩阵的高斯 copula):

P(全部获胜) ≈ 0.212 = 21.2%

与独立性假设相比,相关性使联合概率提高了约 33%。这是关键所在:正相关性使得串关投注的命中率高于独立性假设所预期的水平,这意味着博彩公司必须提供比传统串关投注更低的赔率(更低的派彩)。

如果博彩公司按照传统的三串一赔率(约 +600)支付赔率,而实际概率为 21.2%,那么他们将提供:

投注者的预期收益 = 7 × 0.212 - 1 = 0.484 = +48.4%

这对博彩公司来说将是灾难性的。(关于预期值计算的概述,请参见文章 2。 )相反,他们可能会提供 +350 的赔率,这意味着:

投注者的预期收益 = 4.5 × 0.212 - 1 = -0.046 = -4.6%

现在,投注者面临 4.6% 的庄家优势,与单注类似。

经验频率法

一种更简单、更直接的方法是统计特定投注组合在历史数据中出现的频率。这种方法不需要对相关性的形式做任何假设(与高斯 copula 不同),只需使用观察到的频率即可。

流程

  1. 找出可比的历史比赛:找到所有与当前情况相符的过去比赛(相似的让分、相似的总分、相似的球队实力)
  2. 记录结果:对于每场历史比赛,记录每注赌注是否获胜。
  3. 计算关节频率:统计所有腿部同时击打的次数。
  4. 调整样本量:应用统计调整(例如置信区间)来弥补数据量不足的问题。
  5. 加上庄家优势:将频率转换为赔率,并考虑所需的利润率。

计算示例

在NFL历史上500场球队被看好赢3-7分,且总得分在45-51分之间的比赛中:

结果频率可能性
热门选手获胜290 58.0%
最有可能传球超过275码的四分卫255 51.0%
总金额超过265 53.0%
三人同时击中102 20.4%

与独立性的比较:

独立性假设:0.580 × 0.510 × 0.530 = 0.157 = 15.7%
观察到的频率:20.4%
相关性调整:20.4% / 15.7% = 1.30(由于相关性导致增加 30%)

这种经验方法证实了高斯 copula 函数的预测:相关性会显著提高联合概率。博彩公司使用 20.4% 这个数值(可能根据当前比赛的具体情况进行调整)来设定赔率。

经验方法的优点:

  • 无需任何分布假设
  • 准确地捕捉现实世界中发生的相关性
  • 只要有足够的历史数据,就很容易实施。

缺点:

  • 每种特定组合都需要大型数据集
  • 对新型组合的推广效果不佳
  • 对于罕见的投注类型或不寻常的游戏情况,可能会出现噪音。

大多数复杂的体育博彩公司采用混合方法:在数据丰富的地方使用经验频率,在数据不足的地方使用高斯 copula 或其他模型来填补空白和平滑估计。

体育博彩公司如何计算SGP赔率:完整流程

以下是体育博彩公司为同一场比赛的串关投注定价所使用的完整工作流程:

步骤 1:估计边际概率

对于每一场比赛,确定其真实概率(不包含佣金)。博彩公司通过其预测模型和做市算法得出这些概率:

  • A队获胜:真实概率56% → 赔率-130(含佣金后隐含概率为56.5%)
  • 四分卫传球超过 275 码:真实概率 48% → 赔率为 -110(含佣金后隐含概率为 52.4%)
  • 总分超过 48.5 分:真实概率为 52% → 报价为 -110(含佣金隐含概率为 52.4%)

步骤二:应用相关性调整

使用 copula 方法或经验频率(或两者结合),计算真实的联合概率。在本例中,假设他们的分析结果如下:

三者全胜的概率 = 0.189 = 18.9%

与独立性假设进行比较:

独立性假设:0.56 × 0.48 × 0.52 = 0.140 = 14.0%
相关系数:18.9% / 14.0% = 1.35

在这种情况下,相关性使联合概率增加了 35%。

步骤 3:添加活力

将真实概率转换为包含所需庄家优势的赔率:

公平赔率 = 1 / 0.189 = 5.29(美式赔率:+429)
图书报价:+350(隐含概率 = 22.2%)
庄家优势 = (0.222 - 0.189) / 0.222 = 14.9%

14.9%的庄家优势远高于单注通常4-5%的优势。这也是体育博彩公司热衷于推广SGP(单注奖金)的原因之一。

步骤 4:四舍五入到标准串关赔率

为了简化操作并提升用户体验,许多体育博彩网站会将赔率四舍五入到标准的串关投注增量(+300、+350、+400、+450、+500 等)。这种四舍五入方式可能会略微增加或减少实际的庄家优势,具体取决于四舍五入的方向。

在这种情况下,+350 已经是一个标准增量,因此不需要额外的舍入。

第五步:动态调整

高级书籍还会根据以下因素进行实时调整:

  • 投注失衡:如果太多投注者选择某种特定组合,赔率可能会进一步降低。
  • 精明玩家的资金流向指标:如果已知的精明玩家都在避开某些单场锦标赛(SGP),博彩公司可能会提供略微更高的赔率来吸引更多玩家参与。
  • 相关性不确定性:对于相关性难以估计的特殊组合,图书通常会增加额外的安全边际。

为什么博彩公司喜欢同场串关投注

从博彩公司的角度来看,单注奖金(SGP)是利润极其丰厚的产品。普通单注的庄家优势通常在 4-5% 之间;而单注奖金的庄家优势则经常达到 15-25% 甚至更高。造成这种情况的原因有很多:

1. 相关性不透明度

投注者很难计算出相关事件的真实概率。即使是经验丰富的投注者,如果没有大型历史数据集和统计建模工具,也会遇到困难。这种信息不对称使得博彩公司能够建立更大的优势,而不会引起客户的抵触。

2. 娱乐价值定价

玩家们为了SGP的刺激和“故事性”,愿意接受更差的赔率。小额投注有可能获得大额回报,这种模式创造了娱乐价值,投注者愿意为此付费,类似于彩票。

3. 复数数学

即使是那些在概念上理解相关性的精明投注者,也常常缺乏准确评估SGP(单场投注)价值的工具。数学上的复杂性(高斯联结函数、不同游戏情境下的经验频率调整)本身就构成了识别定价错误的SGP的天然障碍。

4. 选择偏差

投注者往往会选择高度相关的组合,却没意识到博彩公司已经将这种相关性考虑在内。例如:一位投注者认为,“如果球队大胜,那四分卫肯定发挥出色!”于是他构建了一个包含“球队胜场+四分卫总码数+比赛总总得分”的组合投注。但博彩公司已经根据这种相关性降低了赔率。

具有讽刺意味的是,那些“感觉”最明智的投注(相关性高,所有投注项相互支持)恰恰是博彩公司掌握最多赔率信息、优势最大的投注。这是一种确认偏差,我们将在第五篇文章中详细讨论。

5. 难得的价值机会

与传统博彩市场不同,传统博彩市场中,通过比较赔率和精明资金的运作可以提高效率,而SGP市场的效率则较低。博彩公司更容易对新颖的组合定价错误,或者对新信息的反应迟缓。然而,SGP的基本庄家优势非常高,即使找到一个“定价错误”的SGP,通常也会导致负的预期收益。

案例研究:负相关

并非所有SGP相关性都是正相关的。了解负相关性有助于解释为什么某些投注组合能带来出人意料的高赔率。请考虑以下SGP:

  • A队获胜(他们是略占优势的一方)
  • B队明星跑卫冲球码数超过95.5码

这些结果呈负相关:如果 B 队的跑卫冲刺 95 码以上,则 B 队很可能控制了地面进攻,使 A 队获胜的可能性降低。

对定价的影响

设想个体概率联合概率
独立性假设55% × 45% 24.8%
呈负相关(ρ = -0.30)相同的边缘19.2%

分析:负相关性将联合概率从 24.8%降低到 19.2%。这意味着博彩公司可以在保持其预期优势的同时,提供比独立性计算所显示的更高的赔率。

赔率示例:

合理赔率(19.2%):+421
新加坡元典型定价:+450
庄家优势:(0.182 - 0.192) / 0.182 = -5.5%(实际上对投注者有利!)

这似乎创造了一个机会!但是,有几点需要注意:

  • 罕见组合:投注者很少构建负相关的SGP,因为他们“感觉不对劲”(支持双方)。
  • 价格调整:精明的体育博彩公司会意识到负相关性,因此并非总是提供比例更高的赔率。
  • 心理因素:负相关。即使在数学上合理的情况下,SGP 也会感到下注不舒服。
  • 行动失衡:书籍可能会积极调整这些方面,因为它们很少获得自然行动。

教训:如果你一定要投注单注奖金(SGP),那么从价值角度来看,负相关组合是最有趣的。然而,大多数休闲玩家会完全避开这类组合,而精明的玩家通常也会完全不投注单注奖金。

对投注者的实际影响

理解SGP的数学原理可以得出以下几个实际结论:

1. SGP通常价值不高

串关投注的庄家优势通常是单注的3-5倍。除非你有充分的理由相信某个串关投注的定价有误,否则最好还是进行单注投注,或者干脆避免串关投注。

2. 避免高度相关的组合

那些“感觉”最划算的组合(球队获胜 + 四分卫得分超过预设值 + 比赛结束)恰恰是博彩公司数据最丰富、定价模式最合理的组合。你不太可能在这里找到价值。

3. 考虑负相关性

如果你一定要投注SGP,那就寻找负相关的组合,因为博彩公司可能会提供不成比例的高赔率。这看似违反直觉,但可能具有更高的数学价值。

4. 样本量要求

要构建自己的相关性估算模型,你需要成百上千场相关的历史比赛数据。对大多数投注者来说,这不切实际。要知道,博彩公司拥有远胜于你的数据和建模能力。

5. 替代策略:单注

如果你认为A队会赢,而且他们的四分卫会冲球超过指定码数,并且比赛总分会超过指定分数,那么你就有了三个正期望值的投注选项(在你看来)。为什么要把它们合并成一个庄家优势高达15-25%的单注投注(SGP)呢?你完全可以分别进行三个庄家优势只有4-5%的投注。(我们将在第三篇文章中讨论多注投注的最佳投注额。)

三注10美元的单注,胜率为52%,赔率为-110:
每次投注的预期价值 = (0.52 × $9.09) − (0.48 × $10) ≈ $4.73 − $4.80 = −$0.07
总期望值 ≈ 3 × (−$0.07) = −$0.22(约占质押的 30 美元的 −0.7%)

一张价值 10 美元的新加坡博彩公司股票,赔率为 +350,隐含概率为 22.2%,实际概率为 18.9%:
预期值 = (0.189 × 35 美元) − (0.811 × 10 美元) = 6.62 美元 − 8.11 美元 = −1.49 美元 ≈ −15% 的投注额

即使SGP和单独投注策略每次组合都承担10美元的风险,但SGP的预期收益大约是单独投注的7倍。这假设你的概率估计是正确的,这就引出了我们关于预期收益计算的第二篇文章。

结论

同场串关投注是体育博彩定价中一项重大的数学挑战。本次分析的主要结论如下:

  1. 相关性是真实存在的,而且相当大:单场比赛的结果之间存在相关性,通常高达 30-50% 甚至更高,这违反了使传统串关投注可行的独立性假设。
  2. 体育博彩公司使用复杂的方法:高斯 copula、经验频率表和相关矩阵使博彩公司能够对数千种投注组合进行合理的准确定价。
  3. 更高的庄家优势:由于相关性的复杂性、信息不对称和娱乐价值定价,SGP 的庄家优势通常为 15-25%,而单注的庄家优势为 4-5%。
  4. 投注者的劣势在于结构性因素:由于无法获取相关矩阵或大型历史数据集,投注者很难识别定价错误的单场投注机会。数学上的优势完全掌握在庄家手中。
  5. 负相关性很有意思:少数几家公司提供的单场博彩公司提供的 ...

对于追求正预期收益的优势赌徒来说,教训显而易见:通常应该避免同场串关投注。识别这种投注方式所需的数学技巧远超大多数投注者(包括精明的投注者)的实际能力,而其基本庄家优势又高得令人望而却步。

如果你把单注投注当作娱乐消遣,那就把它当作其他娱乐支出一样对待。但如果你的目标是进行数学上合理的投注,并尽可能降低庄家优势,那就坚持选择经过充分研究的单注投注,这样你才能更准确地估算真实概率。

在下一篇文章(第五篇)中,我们将探讨球员道具分析中常见的谬误,包括赌徒谬误、手感火热谬误以及均值回归的数学原理。了解这些认知偏差将有助于您避免在道具投注中犯下代价高昂的错误。

系列导航

球员道具的数学原理 - 文章 4(共 5 篇)

相关赔率奇才文章

  • 凯利准则——优势赌徒的最佳投注额度
  • 赌场优势——了解赌场和体育博彩公司的优势
  • 投注系统——为什么大多数投注系统在数学上都行不通