第二港湾, 华人休闲之家

 找回密码
 注册帐号
搜索
热搜: 活动 交友
查看: 604|回复: 1

布什对戈尔:谁该是第43任美国总统?

[复制链接]
发表于 2016-3-30 21:50:20 | 显示全部楼层 |阅读模式
原点实验室 / 布什对戈尔:谁该是第43任美国总统?徐轶青 · 12 小时前
美国大选初选正如火如火如荼地进行着。十六年前2000年的美国大选同样充满戏剧性。由于共和党总统候选人小布什(George W. Bush)和民主党总统候选人戈尔(Al Core)得票过于接近,选举结果直到选举日后的36天才确定。
最终,小布什因为在佛罗里达比戈尔多拿了537张选票,获得了该州25张选举人票,当选第43任美国总统。在佛州,小布什得到291万2790票;戈尔得到291万2253票,差距不足该州总投票数的万分之一。
由于选举结果过于接近,选举一结束,戈尔团队就根据佛州选举法,要求在几个结果“可疑”的县重新计票。
戈尔在棕榈滩县(Palm Beach County)的得票明显低于预期。支持戈尔一方的人怀疑,这很可能与该县使用的“蝴蝶票”(butterfly ballot)有关。在该县使用这种选票上,戈尔的位置是填第三个孔。但是,想投戈尔的选民很容易误填成第二个孔,那么这些选民实际上把票投给了改革党候选人布凯南(Pat Buchanan)。在全国范围内,布凯南只得到约千分之4的选票。
双方因此陷入了法庭 拉锯战。12月8日,佛州最高法院以4比3判 定在佛州范围内重新计票。此前,美国最高法院已主动介入。12月9日,最高法院暂停重新计票。12月12日,最高法院判定重新计票过程违宪 ,这也就意味着小布什获胜。12月13日, 戈尔承认败选。
布什诉戈尔一案在美国宪法史上意义重大,许多评论家写过了,不再重复。刚刚过世的最高法院大法官Scalia在此案中扮演了重要角色。目前在共和党初选 中当红的Teb Cruz据传是布什法律团队中的重要成员。
从统计角度来说,我们关心一个很简单的问题:棕榈滩县“蝴蝶票”是否直接导致了小布什当选?
当年在风口浪尖的时候,五位年轻人用简洁而有力的统计证据表明,答案是肯定的。可惜的是,他们的发现并没有影响法院的判决。原因很简单,统计的逻辑,并不是法律和政治的逻辑。
次年,他们将发现发表在《美国政治学评论》(APSR)上。这篇文章是我在APSR上读过的最精彩和令人信服的文章之一。
为了写这篇博客,我向他们其中的两位写信,问他们要来的数据。我希望能够以最透明的方式把他们的统计分析过程呈现给大家。
作者们使用县级别和选民个人级别的数据。我们只使用县级数据。
我们首先来看原始数据,包含67个点,就是佛州的67个县。对于中小规模的数据,最简单的方法——散点图——往往是最有力、最能说服人的。纵轴是布凯南的得票数,横轴是每个县的总投票数。
我用这个67点,对布凯南得票数和总投票数的关系做一个简单的平滑估计。可以看到,在使用蝴蝶票的棕榈滩县,布凯南的得票率远高于正常的情况。但是布凯南甚至都没有在那里进行过选举造势。
如果我们对这种异常表现做一个统计检验(studentized residual),我们发现,棕榈滩县必定有什么特别奇怪的事发生了。
有的朋友可能会觉得选票数的分布太扭曲了。我把每县的总得票数和布凯南得票都取对数,情况仍然类似。注意到,两个变量的关系非常接近线性了,因为两个变量的边际分布都接近正态了。
上面这些证据似乎仍然不充分。也许棕榈滩县真的发生什么事,让大家一下子特别支持布凯南,但又和选票的设计无关。
为了排除这种可能,作者们比较了“缺席投票”和“选举日投票”两种不同的情况。缺席投票是只由于不能在选举日到投票站投票,选民通过邮寄的方式提前投票。缺席投票占总投票数的15%左右。
有一点很关键,在棕榈滩县,只有在选举日使用了蝴蝶票。
把选票按“缺席投票”和“选举日投票”分成两组,分别画出布凯南得票数与总投票数的关系。我们看到,棕榈滩县的异常情况仅仅在选举日的那些选票中出现。
这说明,并不是棕榈滩县的选民因为什么奇怪的原因特别支持布凯南,那肯定是选举日出了什么问题!
等等,还有一种可能:也许“缺席投票”和在“选举日投票”选民很不同。有可能讨厌布凯南人都提前把票给投了,结果在选举日,剩下更多的是支持布凯南的选民。
这种情况不是不可能。可是如果这种情况在佛州的其他66个县都不存在,只在棕榈滩县出现,那就见鬼了。
于是,作者们画下面这张图。我觉得实在太精彩了。
作者直接比较布凯南的缺席得票率和选举日得票率。纵轴是两个得票率(百分比)之差,横轴仍然是该县的总投票数。阴影表示不确定性。这张图表明,在其他66个县,缺席得票率和选举日得票率在统计上非常接近。很自然,在选 民非常少的县,这个差值变异度更大,因为数据的噪音更大。
唯有棕榈滩县是异数。对于这个有超过40万选民的大县,缺席得票率和选举日得票率出现这样大的差距,绝对不是偶然。
运用选民级别的数据,作者们发现,由于蝴蝶票设计,大约有2800名戈尔的支持者错把选票投给了保守的改革党候选人布凯南,远远超过两人在佛州的得票数之差。
也就是说,棕榈滩县的蝴蝶票把小布什送上的美国总统的宝座。
Wand et al (2001) “The Butterfly Did It: The Aberrant Vote for Buchanan in Palm Beach County, Florida”, American Political Science Review Vol. 95, No. 4 December 2001
数据与代码请移步GitHub关注“原点实验室”的微信,请扫二维码,或搜索“cndatalab”。
-------------------
马克•吐温说过,世上有三种谎言:谎言、该死的谎言,和统计。
他的话里透露出对统计数字深深的不信任。许多社会科学研究的发现确实不可靠。我觉得有两个原因。
首先,数据和研究方法的限制使研究人很难做出稳健的统计推断,且不说因果推断。世界太复杂。与实验室环境不同,在真实世界里,并没有那么多做可控实验的机会。不过,社会科学发展很快。过去认为对的结论,在新的方法面法面前,看起来漏洞百出。这是好事。
另一个重要原因是人的因素。统计数据太容易被操纵、拿来误导公众。即使研究者秉持格物致知的初心,他们在研究过程中面临太多细小的决定,而这些决定最终很可能会影响研究结果。生存压力和人类与生俱来的自我确认偏误加剧了发表偏误(publication bias)。在这个将科学方法奉作神明的时代,有些结果被用来指导政策 ,结果有可能是灾难性的。
媒体报道的、公众记住的,往往是可以用一句话概括的研究结果,很少有人在乎数据分析的过程。我希望通过亲手“打开”数据,以最透明的方式呈现,能说服更多人相信可靠的统计证据。这些数据案例和代码,也可以在未来用作教学的例子。
这是我尝试做这个公众号的原因。我也希望有兴趣的同行、朋友可以加入进来。
回到原点,我们来看看数据吧。

 楼主| 发表于 2016-3-31 10:08:55 | 显示全部楼层
这个案例真是经典啊。正好在其他州都势均力敌,正好在佛罗里达州也是势均力敌,然后就差这几千票,造成了美国8年轨迹的不同。
您需要登录后才可以回帖 登录 | 注册帐号

本版积分规则

Archiver|手机版|小黑屋|第二港湾

GMT-5, 2024-5-18 00:25 , Processed in 0.016701 second(s), 15 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表