WOO logo

本福德定律与2020年大选

上周,我开始讨论如何错误地运用本福德定律来指控2020年总统大选存在选民舞弊。那篇简报篇幅很长;所以,正如承诺的那样,本周我将继续讨论这个话题。

让我开始思考的,是我在非赌博论坛“Diversity Tomorrow”上发表的一篇帖子。该帖子部分指出,密歇根州的选举结果显示,根据本福特定律,选民舞弊的可能性高达 99.999%。这段引文显然出自该来源 (https://yournews.com/2020/11/08/1915953/benfords-law-has-been-used-to-prove-election-fraud-in/)。

那篇文章里的数学太差了,通常不值得讨论。然而,它给了我一个教东西的机会,而教育总是一件好事。文章链接了底特律每个选区层面的选举数据。然后,文章继续论证,根据本福特定律,选举结果与预期高度不符。

什么是本福德定律?简而言之,它部分地指出,一组随机数据中第一个数字的频率应遵循对数分布,如下所示:

数字可能性
1 30.10%
2 17.61%
3 12.49%
4 9.69%
5 7.92%
6 6.69%
7 5.80%
8 5.12%
9 4.58%
全部的100.00%

只有当应用该算法的数据服从指数分布且每个数据项独立时,才能预期出现这种数字频率。然而,并非所有随机数据都遵循这种指数分布,尤其是那些经过精心挑选、大小达到一定程度的数据。以底特律的选举结果为例,2020 年有 629 个选区至少有一张总统选票。每个选区的平均票数为 381 张。如果选票数量服从指数分布,并且平均值如此,那么可以预期 24.6% 的选票会在 100 到 250 票之间。

事实上,60.6% 的选区都处于这个范围内。考虑到这一点,似乎大多数选区的人口规模都比较稳定。

鉴于底特律选区规模相对稳定,结果当然会不通过本福德检验!指望他们能通过本福德检验,简直是对统计数据的滥用,也是无知大众如何轻易被糟糕的数学公式所迷惑和误导的一个例子。这就像在内华达州拉夫林一家赌场里,对玩宾果游戏的顾客进行平均年龄调查一样。

我可以轻松地继续分享我对本福德和选举的其他分析。不过,除了底特律的拉斯维加斯奇才队比赛之外,我已经在“本福德定律与2020年大选”主题帖中分享了我对其他比赛的分析。

说实话,这整个话题让我心情很不好。用本福德测试来指控选举舞弊,恰恰表明任何人都可以在互联网上畅所欲言,不受任何监管。这一点人人皆知。虽然我完全支持言论自由,但我认为听众应该质疑一下发言者的资质。如果这太耗时,至少应该问问对方所说的内容是否经过了“嗅觉测试”,结论是否合理且有证据支持。

总之,请不要轻信你听到的一切。对所有事情都要保持适度的怀疑态度。一个说法越不可思议,就越需要证据来证明它。每个人,包括我自己,都应该保持开放的心态,承认自己在某些事情上可能犯错,并接受这样的证据。与此同时,现实似乎是,一个观点越荒谬,就越容易被人们坚持。

回到本福德定律,这里有一些资料表明用它来分析选举是危险的。他们的观点比我更清楚。

本福德定律并不能证明 2020 年美国总统大选存在舞弊行为,作者:Jen Golbeck

为什么拜登的选票不符合本福德定律?作者:马特·帕克

直到下周,愿好运与你同在。