《纽约时报》记者:数据新闻不存在半真实
“你写的报道即便是事实也可能仍是错的。” 在5月欧洲的一场调查记者和数据新闻大会上,美国《纽约时报》数据新闻记者Robert Gebeloff如是说。
大会全称是“European Investigative Journalism Conference & Dataharvest”。Gebeloff认为,数据和新闻的结合可能会导致一些错误的解读,且难以杜绝。
“每当我做新闻报道时,都希望能获得关于选题的一切资料。” Gebeloff表示他会从所有可能的渠道搜集数据,再用相关方法验证,而最后只会发表那些他确认为事实的部分。
不存在“半真实”
时下流行事实核查,美国网站Politifact就发明了一个叫Truth-O-Meter的工具来衡量政治人物讲话的真实程度,将结果分别用“真实”、“大部分真实”、“半真实”、“大部分失实”或“失实”(false)来表示。
然而,Gebeloff认为这些标准不适用于数据新闻,“数据新闻不能止步于‘半真实’,只要哪怕一丁点失实都是不可承受之错。” 他坚持数据新闻必须永远真实。
用错误方式报道正确事实
有时候,即便你文章中写的统统都是事实,Gebeloff认为也有可能出错:“你可能算对了数字,却用错了地方,或者未能说明其中的不确定性,又或者用错误的方式陈述事实。”
他举了个例子。此前有媒体报道称,美国前总统小布什任命的移民法官倾向于拒绝批出避难申请。该报道的依据一篇论文中的数字:16名法官中的11人过往拒绝避难申请的比例高于平均水平。Gebeloff认为,尽管相关论文看似正确,但该媒体据其所作出的报道仍旧是错误的。
Gebelof解释说,那11人中有两人的拒绝率在统计上其实高得并不显著,因此不能得出结论说两人高于平均水平。
他进一步解释道,统计学上,“卡方检验”是用来计算差异显著性的公认方法,主要说明一个群体与另一个群体相比,是否有明显不同的特征。该公式主要涉及两个因素,一个是差异大小(比如前面提及的拒绝率的差别),另一个是样本大小(比如法官作出决定的次数,次数太少就很难说明问题)。因此,如果我们基于很小的统计样本来说事,那就会导致事实正确但结论错误的情况。
慎用数学
数学是一门精确而又深奥的学科,一般大众难以明白较高级的数学理论,因此记者在使用时务必谨慎,因为你很难在报道中向读者解释清楚。
Gebelof认为记者可以用数学方法来发现新闻线索,但他的经验是,如果发现相关方法无法用浅显的语言说明白,就要果断放弃。
向调查对象求证
Gebeloff和《纽约时报》的同事于2016年12月发表了一组关于纽约州监狱对犯人存在性别歧视问题的调查报道。在运用多种方法对六万宗监狱纪律处分个案进行统计分析后,他们在报道中写下了这样的文字:
“分析发现,在多数监狱,黑人和拉丁裔遭受纪律处分的比例高于白人——某些案例中甚至达到两倍。他们被关禁闭的次数更多,时间也更长。”
Gebeloff表示,他们不仅与专家分享统计数据以作进一步求证,同时也与报道的批评对象即监狱方分享。他认为即便遭到反驳,记者也应该在报道发表前确切知道反驳的内容,并且将其一并写入报道。
Gebeloff一再强调,数字本身的准确并不足够,还要放在正确的语境中用恰当的方法解释,否则“半真实仍然是失实。”
为此,总结出一个核对清单供记者同行参考。
1.仔细核对数据:
- 注意数据的日期
- 核对写法和重复之处(duplicate)
- 识别出异常的数值
- 统计上的显著性本身不是新闻
- 对趋势的判断要基于全体数据,而不是随意挑选出的某一段时间的数据
- 确保数据反映现实
2.每次进行数据处理都要留下记录,写明处理的方法和结果,以确保日后可以重复操作。
3.确保你可以向读者清晰解释你所使用的数据处理方法。
4.仔细思考你的报道可能遭到哪些反驳,如何避免犯错,如何自圆其说。
5.把报道的批评对象也纳入消息源,在报道发表前找到潜在的反驳内容。
6.把报道中引用的证据逐一列出并编号,记下证据来源以及取得的方式,以备不时之需。
编译/周穗斌
编辑/梁思然
相关阅读:
清单 | 贴士、网课与阅读清单:新闻人提高统计素养的资源汇总(三)
NICAR 分享 | 五条经验打造数据团队 小机构也能做出大新闻
本文首刊于作者的个人博客datajournalistiek.nl,深度网经授权转载。
Winny de Jong是一名数据新闻记者及培训师,目前为自由撰稿人状态。她此前在荷兰杂志OneWorld担任数据新闻记者。她也曾在多个机构演讲或提供培训,包括TEDx,欧洲新闻学中心(European Journalism Center)、欧洲调查新闻学的Dataharvest大会,以及多家新闻学院等。