普利策奖得主教你五步,做好数字化调查
数媒时代,善于处理数据、呈现故事,是报道掷地有声的关键。普利策奖新晋得主、ProPublica记者T. Christian Miller在美国调查记者与编辑协会(IRE)2016年度会议上分享了调查数字化的实用步骤和工具,解剖普利策获奖调查的关键。你还可参考《借助公开资源,全球记者开发了哪些调查好工具?【内附工具精选】》。
第一步:数字化处理材料
数字化,数字化,数字化——重要的事情说三遍。身处数字化时代,我尽量把每份资料——笔记、照片、音频、视频、文件作数字化整理。强推以下整理工具:
Document Cloud是一款可供用户上传的PDF文件、作光学字符识别(Optical Character Recognition,简称OCR)的工具。它扫描文本资料,提取文字信息,供用户检索。Document Cloud还支持用户在文章上标重点和做注释。另外,它还支持时间轴制作和实体识别搜索。目前Document Cloud仅对美国调查记者与编辑协会(IRE)成员开放。
其他OCR工具—OCR技术还能把纸质文件转成适合电脑检索的PDF。它分析文件时,是用自存的字体数据库对照文本、注意特有字形。遇到难辨字眼,某些OCR软件还用拼写检查工具“猜出”。虽然准确率难达100%,但可以帮你减轻工作量。用不了Document Cloud也不用着急,还有大把的免费OCR软件供选择。可参照:《五款最优光学识别免费软件,实现图转文》(英文字符)和《知乎问答: OCR 中文识别用哪种软件识别率比较高?》(中文字符)。
深度君补充:如果想抽取数据,且PDF文本并非扫描生成,Tabula, CometDocs (收费) 和ABBYY FineReader (收费)可以帮你忙。其中Tabula可与浏览器配合使用,可兼容 Windows, Mac 和Linux系统。用法为:上传PDF文件到Tabula,选中想抽取的表格信息。数据即可输出至CSV等表格数据程序,就是这么简单。
音视频转录工具:许多转录工具提供优质视频、音频的语音转文字服务,不少工具每分钟仅收一美元,成本很低且质量不错。如果想在网上发布重要的采访视频,不妨找转录服务,稍贵的可一天内即可完成转录,花费约每分钟三美元。英文转录软件,rev.com, Transcription Associates, Transcribe和TranscribeMe都做得不错,中文转录软件可参阅:《采访录音难搞定?工具测评帮你忙》。温馨提示:确保重要引述不出错,一定要重看或重听材料。
Excel和谷歌表格——几乎所有材料我都用Excel和谷歌表格来处理,Excel可以创建和整理不同体量的信息。例如,我写过一篇民用工程承包商在伊拉克受伤的故事,案例众多,一下子记不全,我用Excel整理了重点关注的30多个案例,逐个添加案例数据。
思路整理工具—如果你做的调查耗时很长,可考虑使用如印象笔记和微软笔记等兼容Office系统的文件整理软件。这两款软件的特别之处在于,用户可粘贴网页、跟踪信源信息和整理数据。
第二步:为故事添加数据
数据能为不少故事增色添彩,使故事更贴合背景、更具辨识度。数说故事也变得越来越简便了。
报道中,复杂的数据分析不是必须。它可以很简单,比如报道谋杀案时对比今年和去年的案件数;它也可以很复杂,比如对上市公司期权回溯作多元回归分析。简单也好,复杂也罢,重点是数据无处不在,因此不要逃避数据,而要善用它们。
做个小练习吧。翻开任一报纸,看开头几篇报道,思考: 它们还隐含了哪些背景条件呢?
除了用数据,如何找数据也是一个问题,不妨先从权威机构和政府部门开始查找。如果关注国际数据,可参考:《24万数据集整合,211种文件转换:社会发展类公开数据清单》,也可查询Geohive整合的“亚欧非美政府官方数据大集合”。国内数据,可登入全球深度报道网,点击“资源库”——“深度报道公开数据库+检索连接”,查阅调查相关议题。
第三步:按时间顺序叙事
无论调查报道以何种形式建构 ,其篇幅是长或短,叙事采用陈述型或主题型,情节发展是由角色或话题推动,总归要按时间顺序叙事。
我坐下写作时,第一件事就是列出时间轴。有个夸张的例子:有次我写了一篇关于哥伦比亚北部圣多明戈(Santo Domingo)村的爆炸案的故事,做了足足11页的时间轴,它们对观察事件发展大有帮助。
时间轴的三个好处:
• 帮你看到易被忽略的事件关系。
• 帮你快速查阅事件。
• 供你在时间轴添加信源信息,帮助记忆信息来源。
我喜欢用表格制作时间轴,你也可以用Word来做,只要每段开头使用“年-月-日”(YYYY-MM-DD)这种日期格式,Word就能据日期分段。你可以在文档底部输入信息作分段,确保时间轴按时间顺序排列即可。
以我愚见,现有的时间轴工具还满足不了新闻业需求。目前的工具更重产出而非数据收集,类似的有网页版工具Tiki Toki和Dipity,还有北卡罗莱纳大学Knight Lab的timelinejs和我们ProPublica的TimelineSetter。但是对这些工具我多少还是有点不满意。表格和word文档倒是挺好用。
第四步:用人物讲故事
现在该开始写报道了。要把故事写活,就必须要写个有料的人物。
记笔记或跟他人谈话时,我习惯在精彩的引述旁标上星号。重看笔记时,你可直接找星号,单独整合成“语录”,浏览一遍,找出最好的十到二十条。这样做的原因有二:
1. 能帮助你建立报道结构。你可借此构思引题、开头引述和过渡段落等。
2. 能保证留下最佳内容。所谓“取其精华,去其糟粕”,仔细浏览所有信息,找到简短有力、一针见血的部分。
选取报道人物是另一关键,并不是每次都能找到合适人选。如果报道的时间跨度大、包含角色多,最佳处理方式可以是以时间为主线、按事件发展的顺序叙述。有时,一个故事可能没有一个合适的人物——千万别把角色硬塞进故事里,这样会破坏人物形象。
相反,如果有人妙语连珠,其经历让人震撼慨叹,能充分体现报道主旨,写TA你就能游刃有余,记得把TA的故事用到极致。
第五步:把故事讲清楚
这是最难的一部分:如何讲故事。
但其实通过上述一至三步,你应该或多或少对调查报道叙事有点感觉了。
我最喜欢的报道结构是时间线叙事。这种结构帮助读者理解发生了什么,事件之间如何联系,让文章变得易读。但如果说按时间叙事是叙事的唯一方法,肯定会招致非议。
一般来说,我会在开头概括故事及主要观点——找到一个易写、易吸引人的场景,在文末呼应,或是写简单的硬新闻导语。接下来写主题段落,提及关键发现、有关方面的反应。至此大概有10至15段,看到这里的读者能判断是否继续阅读。写完开头,故事就能按照时间顺序自然叙述了。
我的次选是按主题叙述。换言之,就是故事分成能解释问题的几大块——我把这种办法称为“大杂烩”。用这种叙事结构时,我在每个主题里也都按时间叙事。
以上是我创作报道的过程,可以分为好几步,但大多会同时进行。一开始,我就思考如何用人物叙事、以何种结构叙事。同时,我也寻找合适的数据,将材料数字化处理。这些步骤无需固定,但可反复操作。每当发现新数据、新人物,或者处理数据时找到了新趋势,我都会重走步骤,作出修改。
调查与写作的过程也许漫长而艰辛,但归根到底,读者想看的都是扣人心弦、叙事清晰、真实可信的报道。因为发稿时间易变,资源缩减,员工流失,作品不会一直保持高水准,但我们仍可尝试。如果方法对路,效果一定出彩。
T. Christian Miller是美国非盈利独立网络媒体ProPublica的高级记者。 他曾在《洛杉矶时报》任职11年,报道过2000美国总统选举,并任分社社长3年,负责中、南美洲地区10个国家的报道。出版著作Blood Money: Wasted Billions, Lost Lives, and Corporate Greed in Iraq . 他曾获得广播报道的George Polk奖,创伤报道的达特灾难与创伤报道卓越奖,调查报道方面的Selden Ring奖以及美国调查记者与编辑协会奖(Investigative Reporters and Editors)等。
编译/梁思然
编辑/周炜乐,王一苇