辅助功能设置

文字大小

色彩设置

单色 柔和色 dark

阅读工具

底部遮盖 标尺

在 #GIJC23 的一场研讨会上,讨论了人脸识别等尖端科技和工具可以如何帮助调查报道。图:Wiktoria Gruca, GIJN

文章

人脸识别以外,调查记者还应用到哪些尖端科技呢?

English

在 #GIJC23 的一场研讨会上,讨论了人脸识别等尖端科技和工具可以如何帮助调查报道。图:Wiktoria Gruca, GIJN

调查新闻事业的蓬勃发展,有赖于传统调查技术和尖端科技工具的结合。在这个格局发展快速的领域,拥有最好的技术和工具,可以帮助媒体和记者保持领先位置,并且讲述具影响力的新闻故事。

在第13届全球深度报道大会 #GIJC23 一场关于尖端科技调查技术的研讨会上,dataLEADS 首席执行官 Syed Nazakat、有组织犯罪及贪腐报道计划(OCCRP)研究项目负责人 Karina Shedrofsky 和国际调查记者同盟(ICIJ)培训经理 Jelena Cosic 讨论了他们最近进行的调查,以及他们最喜爱使用的方法和工具,包括人脸识别服务、档案分类工具等。

超越人脸识别

Karina Shedrofsky 以她的一项最新调查项目——涉及俄罗斯教师的加密货币骗局,来展示她如何应用她最喜欢的调查工具。她只有一张可疑目标人物的照片,其他什么线索都没有,于是她利用 PimEyes 入手进行人脸识别。PimEyes 是一项具有人脸识别功能的反向影像搜寻服务。

OCCRP 的 Karina Shedrofsky 介绍了她最近进行的一些调查,以及过程中应用到的人脸识别技术。图:Smaranda Tolosano, GIJN

PimEyes 反馈了可能源于目标人物的大量结果和连结,包括一个人名和另一张照片。Karina Shedrofsky 于是转向使用亚马逊的工具 Rekognition(可以比较两张照片上的人脸,辨认两张脸是否属于同一个人),并且得到98%吻合的结果。不过,Karina Shedrofsky 强调了反复验证人脸识别结果之重要,即使这些工具的辨识结果可信度非常高,但也有失败或出错的机会。

在另一次调查案例中,PimEyes 没有给 Karina Shedrofsky 反馈任何结果,于是她转向应用 search4faces。那是一项专门为俄罗斯流行社交媒体平台 VKontakte 建立索引的服务。这一次,她得到了所需要的搜索结果。

Karina Shedrofsky 分享的第三个调查案例中,她提到一名商人被指充当一名受制裁的俄罗斯寡头的代理人。一名记者曾经跟这名商人的儿子交谈,但对方否认商人是他的父亲。记者于是请 Karina Shedrofsky 帮忙,希望证实两人的关系。

Karina Shedrofsky 所知道的信息,包括该名商人及其儿子的全名、儿子的出生日期,以及儿子工作的单位——俄罗斯一家主要国有银行。这一次,她使用了 Pipl。这是一款擅于将人们的现实存在和线上足迹结合的工具,只要输入电邮地址、电话号码等信息,就可以得出目标人物的社交媒体账号、实际地址等。

由于该名儿子有一个相当平凡的名字,Pipl 给出了许多的搜寻结果,包括一封带有银行网域的电子邮件。由此,Karina Shedrofsky 找到了一个她认为属于该名儿子的 Facebook 账号,但那是一个没有任何资讯的私人账号。当调查似乎走进了一个死胡同,Karina Shedrofsky 再次使出了她所知道的一个重要调查技巧——即使是 Facebook 私人账号,你仍然可以通过单击个人资料页面右上角的三点图标,搜寻账号时间轴上公开发布过的所有内容。

Karina Shedrofsky 搜寻了她能联想到的所有东西,例如生日、相关人名等。她发现,在她所知的该名儿子的生日日期当天,该个 Facebook 私人账号也收到了生日祝福信息。

至此,Karina Shedrofsky 已经非常有信心,认定找到了正确的账号。通过搜寻关键词“love”,她进一步找到该名儿子的妻子之名字。通过在 Google 上搜寻他们的姓氏和名字,她找到一家摄影公司的网站,上面有他们的结婚照片。惊喜地,该公司发布了整个婚礼相册,让 Karina Shedrofsky 发现了一张照片,里面有怀疑是儿子父亲的那一名商人。借助 PimEyes 的辨识和反向搜图功能,Karina Shedrofsky 找到了匹配的照片。

Karina Shedrofsky 表示,她近期最喜欢使用的工具,除了 OCCRP 的 Aleph database,就是 OpenCorporates。此外,她也喜欢使用联络信息应用程序,例如 TruecallerRocketreach

老派技术与尖端工具

来自国际调查记者同盟(ICIJ)的 Jelena Cosic 表示,她经常会结合使用老派技术和现代工具。她介绍了 ICIJ 一项关于森林砍伐的最新跨境调查项目。该项目揭露了一些取得环境认证、标榜业务推动“可持续发展”的企业,实际上被指控从事破坏森林和侵犯人权的生意。这不是一项简单的调查项目,Jelena Cosic 及其调查团队必须使用大量的信源来自行建立数据库,这些信源包括:

  • 发出环境认证的机构和审核员;
  • 《欧盟木材法规》(EUTR)依国家列出的违规行为清单;
  • 非政府组织针对破坏环境行为所作出的举报,以及相关的官方报告;
  • ImportGenius 上的贸易资料;
  • 自由资讯(FOIs)、企业文件、市场行销资料、法庭文件等;
  • 通过 Orbis 和 Factiva 存取到的母公司资料。

调查团队需要将这些数据都整理到一起,建立起单一的主数据库,以便存取资讯。Jelena Cosic 强调了在展开此类调查之前就确定好研究方法之重要。

Jelena Cosic 表示,她一直以来最喜爱的工具是 ICIJ 的 Datashare。那是一款可能运行 OCR(光学字元辨识)技术的工具,能让上传的文档可以被搜寻。它还可以按人物、组织、位置等自动检测和过滤文档,从而提升搜寻效率。

充满不确定性

Karina Shedrofsky 和 Jelena Cosic 都承认调查新闻事业正面临许多挑战。前者观察认为,这个领域是“more art than science(大意是指充满不确定性,只能靠经验直觉来进行)”,而且不断发生变化。她警告:“要保持领先于持续进化的犯罪行为,是一项持续的挑战。”

至于 Jelena Cosic,她点出了从中国获取信息的困难、欧盟资料保护法规(GDPR)的限制,以至浏览离岸数据和网域注册的复杂性。

不过,他们都指出有一些方法可以克服困难,保持调查记者的领先地位。以下是他们给予调查记者的一些建议:

  • 电子试算表是你的最佳朋友,利用试算表来组织你的数据;
  • 寻求数据专家的指导,以进行有效的资料管理;
  • 对下载到的文件作出标签,并将它们分类组织到不同的文件夹里;
  • 探索 Chrome 的插件,用它们来撷取整个网页,并且使用 Wayback Machine 的插件来保存搜寻记录;
  • 对大量文档建立起架构,善有标签来作有效的分类;
  • 使用有双重加密的开源平台来进行安全的协作;
  • 充份认识到调查新闻事业中,多元化技能和背景的价值。

您可以根据知识共享协议条款免费转载这篇文章

转载


阅读更多

GIJC 侧记 GIJC23

#GIJC23 侧记:危险者的聚会

“如果把这两千多个人都消灭了,全世界的独裁者应该会睡个好觉。”在 GIJC23 现场,我们一直开这样的“地狱玩笑”,却又如同另类的集体心理诊疗。自由作者邹思聪在这篇侧记中讲述了三位俄罗斯流亡记者的故事——他们虽然再也无法回国,却在异乡坚持报道、建立生活。

GIJC 侧记 GIJC23

#GIJC23 侧记:哪怕空间再小,也不要停止做事

在参会之前,于月想知道这个世界上有没有哪些同行和我们一样处境艰难,又是怎样克服?在听到来自世界各地的同行分享后,她觉得哪怕空间再小,也不要停止做事。

GIJC 侧记 GIJC23 全球深度报道大会

GIJC 侧记:残缺的数据,模糊的面孔,天秤倾斜的判决——从女性杀戮报道说起

如今我们究竟需要怎样的报道?在影响力如此受限的当下,我们究竟如何定义和看待“impact”?在报道杀戮女性的分享中,独立记者易小艾找到了部分答案:有些记录,若没有留下,真的会丢,若还有一些力气,就一起守住每一个留下记录的可能吧。