2020年5月底,英国政府一名高级顾问公开宣称,2019年已就冠状病毒的危险性发出书面警告。
读者可以在该顾问于2019年3月4日撰写的博客中看到这一警告,内容包括了 「冠状病毒(coronavirus)」一词,这似乎是明确无误的证据。
但BBC的一项调查显示,原来的博文中并没有写上「冠状病毒 (coronavirus)」这个词,而在2020年4月9日,也就是疫情已经全面爆发的时候,警告才「突然地」出现在了文章中。
BBC 的首席互联网研究专家保罗·迈尔斯(Paul Myers)表示,现在有很多有效的工具和技术可以帮助记者挖掘数字网络在过去的状态,包括戳穿该顾问声称自己曾「警告谎言」的 Wayback Machine;而另一种方法,则是利用谷歌街景,记者可以在过去的场景中「走动」并进行观察。
在最近一次为来自94个国家的700多名记者举办的在线大师班上,迈尔斯介绍了一些实用的开源工具、语法技巧和搜索技术,以帮助记者发掘与此次疫情相关的、难以捉摸的内容,包括文字、图片和发布在社交媒体上的帖文。此次活动是 GIJN「调查新冠疫情(Investigating the Pandemic)」系列网络研讨会的第十场。
GIJN 围绕疫情举办的大多数网络研讨会都可以在 GIJN 的YouTube 频道上观看。但由于特别的原因,我们无法对此次的研讨会进行录制。但我们为你从中收集了一些最强大且易用的 takeaways —— 简单,但鲜为人知的语法技巧(用于普通的谷歌和 Twitter 搜索,而非高级或基于订阅的搜索工具。如果你对高级搜索/订阅搜索感兴趣,可以在GIJN网站的过往文章中找到,也可以访问迈尔斯的个人网站:Research Clinic)
例如,有多少记者知道,在一个词语的前后加上引号 —— 或在不需要的关键词前加上一个减号——可以消除数不胜数的多余搜索结果?又或者,一个大写的”OR”就可以防止你不小心毁掉你的搜索结果?再或者,加上”site: “这个前缀可以将搜索结果限制在指定域名上?
迈尔斯目前是 BBC Academy 调查支援项目的负责人。他邀请与会的记者们思考社交媒体平台在现实中的使用情况。因此,虽然 Instagram 的搜索功能体验较差,但活跃于该平台的年轻用户比其他平台用户更倾向于标记自己的位置,这使得 Instagram 值得引起记者关注:在突发新闻事件中,记者可以利用该平台寻找现场人员。他同时鼓励记者通过使用标签云(word clouds)来寻找某些社区成员才会使用的标签,从而了解到该社区的最新动态。
虽然他在90分钟的会议中提到了十几种工具(且在此前GIJN主办的演讲中还描述了更多的工具)但迈尔斯强调,「搜索思维」才是线上搜索最根本的能力。
「大多数会人用自然语言(natural language)在谷歌上搜索,但这样有时会让它误解你的问题。所以,我认为用逻辑和特殊工具来『控制』谷歌所得出的结果会好得多。」
「谷歌是不知道我们想要什么的。要进行有效的搜索,你需要制定一个专门的策略和正确的关键词。搜索很容易,但真正要找东西很难。每次你搜索什么的时候,原则上你需要看看你得到了多少结果。如果结果太多,你还需要输入更多的细节。」
为了说明逻辑思维方式,迈尔斯提供了一个搜索比较著名暗杀事件的例子。输入搜索词「Kennedy」和「Lennon」——意思是 John F. Kennedy 和 John Lennon——那就会获得大量搜索结果,包括英国足球队的网站。但如果加上「Caesar」这个词,搜索的结果就会突然只围绕着暗杀展开。对此,迈尔斯解释说:「除了暗杀,这三个词还有什么理由会出现在同一页上呢?逻辑引导了我们的搜索,并直接导致我们的搜索结果会有质的不同。」
同时,在社交媒体上搜索个人时,花上一分钟,用逻辑想想,你就应该知道:如果想搜索一个青少年的资料,在 TikTok 或 Instagram 等平台上开始会更有效,而不是LinkedIn;而如果你想找一个大公司的 CEO 则相反。而在 Twitter 上,由于字数限制,用户倾向于使用简写。打个比方,以“info” 为关键字,而非 “information”,这样可能更有效。
以下是迈尔斯与大家分享的大量技巧和工具的一些总结:
使用搜索引擎的小贴士
-
- 谨记,谷歌并不能看到网络上的所有内容。有些网页隐藏在付费墙后面,而有些网页则隐藏在站点索引文件 robots.txt 中;
- 不要直接去以你想要的东西为关键字进行搜索。相反,你要先想,你想要的东西会出现在哪种网页/社交媒体帖文中,然后再去搜索这些网站/社交媒体帖文中更可能出现的关键字;
- 你可以通过在单个单词周围使用引号来缩小搜索范围(引号将指示谷歌只搜索完全匹配的词语,而将同义词排除在外);或在特定词组前面添加减号,这样可以排除你不想包含在搜索结果的内容;
- 你可以通过在选项之间添加大写的 “OR” 一词来增加搜索的灵活性,避免将一些想要的搜索结果排除在外;
- 在需要的时候,你可以使用 “site:” 在特定的域名上搜索内容。
- 尝试了解谷歌搜索的标签页(tabs)、工具(tools)和高级搜索功能,包括指定搜索结果的日期范围等;
- 先找出最确定的关键词,再找出「有可能」的关键词;
- 你可以在 archive.org 和 archive.is 上查找被删除的页面——尤其是社交媒体帖文。
- 你可以用 ext:pdf 这个短语查找pdf文件。当搜索被删除的文件时,可以考虑寻找缓存版本。如果你知道该文件中确定出现的几个词,就在谷歌搜索栏中把它们加上引号,看看是否有其他来源的同一文件。
- Bing 可以做一些谷歌做不到的事情。迈尔斯说,它「允许一种『鸟瞰』视角——它允许你越过栅栏看问题。」它允许你通过IP地址(而非域名)进行搜索。他提到,「如果在同一台电脑上有50个不同的域名,这一功能将很有用。(但是)谷歌也是很出色工具,我们可以根据自己的需要来选择。」
搜索社交媒体的小贴士
- 虽然你可以从外部对特定社交媒体平台内容进行搜索,但用平台自带的搜索框来进行搜索效率更高:因为它与自己的数据库相连,可以提供更多最新的结果;
- 在寻找某个人时,首先要尝试确定他们的电子邮件地址。电邮地址除了可能为我们提供关于该人的一些个人信息线索外(如姓名、生日等),它通常还是人们在网络上唯一的标识符,通常兼作用户名,可以被Pipl.com 等寻人数据库有效利用。
- 在email-format.com中输入你的目标人物就职的公司名称,网站就有可能根据公司,为你提供该公司电子邮件地址的标准格式。结合你目标人物的姓名,你就可能找到他们的个人电邮地址;
- 使用在线地图中自动生成的经度和纬度数字,找出特定地区的人对特定话题的看法。将经纬度数字复制到 Twitter 上,并将它们(不含空格地)添加到前缀 “geocode: “中。然后在数字串的末尾加上你需要的半径——例如,”1km”(一公里)。
- 想要在谷歌搜索 Youtube 上的内容,可以输入site:youtube.com,或者直接在其视频标签页中搜索;
- 适应每个平台不同的用户偏好。例如,如果想在 Instagram 成功搜索到想要的内容,你往往需要在词语间采用下划线 “_” 或直接用复合词形式,而连字符 “-” 则不常用。虽然你不能从 Instagram 复制图片,但它们确实提供了可用于继续搜索的元信息。
- Picbabun 是提供 Instagram 内容搜索服务的网站之一。它支持复制 Instagram 图片并以全尺寸打开。
- Echosec 是一个对记者相当友好的网站。在上面你能够找到通过 Twitter 发送的 Instagram 帖文。网站的搜索功比 Instagram自带的要好用得多。
- 要想时刻关注 Twitter 社区的最新动态,你需要找到只有这些社区成员才会使用的标签。你可以从 Hashtagify.me 上的文字中找到特定的标签。比如,搜索航空公司客舱人员使用的标签,就会发现 #crewlife 是这个社区成员主要会使用的标签。再回到 Twitter 用这些 tag 进行搜索,你马上就能看到航空公司人员发布的帖文。
- 在谷歌使用 “intitle: ” 前缀,可以限制只在标题中搜索;
- 如果你预感到有人对 Facebook 帖文进行过编辑,点击右上角的三个小点,看到「编辑历史」,你就能看到以前的版本;
- 如果你怀疑整个帖文都被调整了时间,你可以将光标悬停在 Facebook 帖文旁边的小时钟图标上,该帖文的创建日期便能显示出来:
- 使用前缀 “url: “,你可以找到带有其他网站链接的Twitter帖子。基于此,你可以找到人们对自己在亚马逊上挂卖的面膜进行推销的帖子,例如,在搜索中加上 url:amazon;
- Followerwonk 允许你在 Twitter 中搜索人们的个人简介,而且还可以找到两个不同账户的共同关注者。
- 虽然 Facebook 的搜索功能很不好用,但它确实允许通过任何关键词进行搜索,包括公司名称。所以你可以在最初不知道一个人的名字的情况下,通过他所就职的公司最终搜索到他;
- Facebook 还能读取上传图片中嵌入的文字和数字,所以即使是车牌号也有可能被搜索到;
- 提供可靠的 Facebook 高级搜索的网站,包括 FBsearch 和 Graph.tips;
- 有时候,登入你的个人账号进行搜索时,搜索引擎会根据你的过往记录进行顶点推送,这时「最相关(most relevant)」的筛选条件会限制你的搜索。在这种情况下,使用谷歌时可以打开「避免过滤泡沫(avoiding the filter bubble)」功能,来避免开启这项功能;而在 Facebook 想要解决这一问题,你需要注册一个没有朋友和个人信息的账户并清除你的 Cookies。
- 一个相当先进的(但要收费的)搜索网站是 Social Links ,它的工作基于 Maltego。迈尔斯说:「它确实要花钱。但我已经用它做了很多事情。你可以在不同的社交网络上进行面部识别搜索;搜索被标记的帖子或照片。(许多记者)对 Facebook 决定取消用户图谱搜索功能的能力感到失望。(但)你以前借助 Graph Search 能做的所有事情,现在你都可以用一款 Maltego 程序和在其上运行的 Social Links 就能做到。」
Rowan Philp 现在是 GIJN 的记者。他曾是南非媒体 Sunday Times 的首席记者。作为一名驻外记者,他迄今已经在二十多个国家进行过新闻报道。