本福德定律与2020年大选
上周,我开始讨论如何错误地运用本福德定律来指控2020年总统大选存在选民舞弊。那篇简报篇幅很长;所以,正如承诺的那样,本周我将继续讨论这个话题。
让我开始思考的,是我在非赌博论坛“Diversity Tomorrow”上发表的一篇帖子。该帖子部分指出,密歇根州的选举结果显示,根据本福特定律,选民舞弊的可能性高达 99.999%。这段引文显然出自该来源 (https://yournews.com/2020/11/08/1915953/benfords-law-has-been-used-to-prove-election-fraud-in/)。
那篇文章里的数学太差了,通常不值得讨论。然而,它给了我一个教东西的机会,而教育总是一件好事。文章链接了底特律每个选区层面的选举数据。然后,文章继续论证,根据本福特定律,选举结果与预期高度不符。
什么是本福德定律?简而言之,它部分地指出,一组随机数据中第一个数字的频率应遵循对数分布,如下所示:
数字 | 可能性 |
---|---|
1 | 30.10% |
2 | 17.61% |
3 | 12.49% |
4 | 9.69% |
5 | 7.92% |
6 | 6.69% |
7 | 5.80% |
8 | 5.12% |
9 | 4.58% |
全部的 | 100.00% |
只有当应用该算法的数据服从指数分布且每个数据项独立时,才能预期出现这种数字频率。然而,并非所有随机数据都遵循这种指数分布,尤其是那些经过精心挑选、大小达到一定程度的数据。以底特律的选举结果为例,2020 年有 629 个选区至少有一张总统选票。每个选区的平均票数为 381 张。如果选票数量服从指数分布,并且平均值如此,那么可以预期 24.6% 的选票会在 100 到 250 票之间。
事实上,60.6% 的选区都处于这个范围内。考虑到这一点,似乎大多数选区的人口规模都比较稳定。
鉴于底特律选区规模相对稳定,结果当然会不通过本福德检验!指望他们能通过本福德检验,简直是对统计数据的滥用,也是无知大众如何轻易被糟糕的数学公式所迷惑和误导的一个例子。这就像在内华达州拉夫林一家赌场里,对玩宾果游戏的顾客进行平均年龄调查一样。
我可以轻松地继续分享我对本福德和选举的其他分析。不过,除了底特律的拉斯维加斯奇才队比赛之外,我已经在“本福德定律与2020年大选”主题帖中分享了我对其他比赛的分析。
说实话,这整个话题让我心情很不好。用本福德测试来指控选举舞弊,恰恰表明任何人都可以在互联网上畅所欲言,不受任何监管。这一点人人皆知。虽然我完全支持言论自由,但我认为听众应该质疑一下发言者的资质。如果这太耗时,至少应该问问对方所说的内容是否经过了“嗅觉测试”,结论是否合理且有证据支持。
总之,请不要轻信你听到的一切。对所有事情都要保持适度的怀疑态度。一个说法越不可思议,就越需要证据来证明它。每个人,包括我自己,都应该保持开放的心态,承认自己在某些事情上可能犯错,并接受这样的证据。与此同时,现实似乎是,一个观点越荒谬,就越容易被人们坚持。
回到本福德定律,这里有一些资料表明用它来分析选举是危险的。他们的观点比我更清楚。
本福德定律并不能证明 2020 年美国总统大选存在舞弊行为,作者:Jen Golbeck
为什么拜登的选票不符合本福德定律?作者:马特·帕克
直到下周,愿好运与你同在。