误差范围与抽样方式:解读统计数据需留心的若干概念(一)
编者注:本文根据5月19日亚洲美国记者协会(Asian American Journalists Association)年度大会工作坊“Very Basic Statistics for Journalists”整理而成。工作坊分享者为香港大学传媒及研究中心助理教授锻治本正人(Masato Kajimoto),以及讲师Anne Kruger。发表前已经原作者授权。
现代新闻报道总少不了各种数据,比如民意测验、统计调查,以及大家耳熟能详的GDP等经济指标,各种百分比和变化幅度等更是反复出现。然而,数字引用或表述不当轻则引起误会,重则成为“谣言”,但这很可能只是因为有的记者对统计数字缺乏认识,并非有意为之。
需要提高统计素养不只是记者,其实读者也需要提高警惕。有哪些常见问题需要我们注意?新闻写作训练如何可以避免犯错?如何正确阅读统计数据?让我们先在具体情景中,了解几个经常被忽略的统计学概念。
情景一:民意调查
在过去半年的各国大选报道中,我们时常会听到说今天某个总统候选人的支持率上升了,明天某个党派在民意测验中落后了,诸如此类。当我们读到这些新闻时,千万要小心!因为记者往往忽略了一些统计学中的概念和要求,而正确掌握这些概念对于解读统计数据十分必要。
误差范围
一个常见的被忽略概念是“误差范围”。
我们知道,民意调查都是抽样进行的。以有约七百万人口的香港为例,专业的民调机构一般会选择大约一千人进行访问,然后以此推算出全体香港市民对某件事情的态度。而这种以一千被访问对象推算七百万人“民意”的过程就会产生误差。误差是完全不可避免的,顶多只能尽量缩小,除非对七百万人中的每一个进行人口普查式的访问。
因此,专业调查机构在发布数据时均会公布其“误差范围”,但大众媒体通常有意无意地忽略这个误差,也许是担心过多数字会把读者给绕晕了。可是问题就随之而来。
比如,某调查机构发布的数据显示,某位政治人物在民调中支持率从上月的55%变成本月的50%,那么媒体是否就可以兴冲冲地大书特书某人支持度下跌了呢?
且慢。调查机构还说了,该民调的误差范围是七个百分点。也就是说,该名人士上月在公众中的支持率从48%到62%均有可能,而本月则是为43%到57%之间的任意一个数值。二者之间其实有大范围重叠。所以,支持率究竟是升了还是跌了其实说不好。
那么有人也许会问,我们是否可以说该名人士在被访问的大约一千人中的支持率下跌了呢?很遗憾,这也是不行的。每次调查访问的一千人并不是同一批人,而是每次单独随机抽样后得到的样本。
简而言之,对于误差范围大于变化率的民意调查,记者不能得出任何大而化之的结论,只可客观公布调查结果中的数字,其中包括误差范围,并说明在误差范围内两次调查之间并无显著变化。
这也就部分解释了为什么在一些国家的大选报道中,原本支持率轻微“领先”的候选人最终还是会落选,因为统计学规则告诉我们,在误差范围内,“领先”的“事实”很有可能并不存在。当然,也有可能是“落后”方的支持者看见民调结果后更踊跃地出来投票所致,这就不在本文探讨之列了。
抽样方式
“抽样方式”是另一个经常被大众媒体忽略的概念,最集中体现的就是网络民意调查。
传统的专业调查机构一般都会按照一定比例在不同人群中抽取调查对象,以尽量贴近真实的人口分布。比如,一般电话调查员都会询问性别、年龄,以确保被访问群体是男女各半,年龄分布也要大致符合人口普查数据。一些特定的调查还会询问职业、居住地等信息。
而多数面向大众的网上民意调查则不会事先筛选访问对象,因而任何人都能参与投票的网络调查除了吸引眼球外几乎不能说明任何问题。如果有媒体还郑重其事地进行报道,一个明智读者的最佳处理方式是:忽略这条新闻。
下一期我们将会介绍在健康科学报道中的常见统计数据解读误区。
编辑/Ivan Zhai,梁思然
相关阅读: