报道亚洲| BBC专家:网络搜索,大有可为
说起网络搜索,大家都不陌生,但如何用网络搜索查出人物和线索,还能揪出假冒文凭?有何工具可以起到奇效?BBC互联网研究专家Paul Myers多次参与新闻机构和会议培训,此次还将参加第二届亚洲深度报道大会,带来新分享。想知道他有何“人肉”妙招?不妨看看深度君的整合清单吧!
1. 网络搜索原理+技巧:教你查网页、人和域名
搜索引擎是我们常用的“开源”搜索工具中最重要的部分之一。结合社交网络,域名查找,以及更传统的搜索方式比如报纸和通讯录查找等,有效的网页搜索将会帮你找到调查过程中至关重要的信息。
BBC的互联网研究专家Paul Myers《调查报道信息核实手册》(Verification Handbook for Investigative Reporting)上分享了自己使用谷歌搜索的一些妙招,一些方法也可以迁移到百度试试。
何为有效的网页搜索?谷歌之类的搜索引擎其实并不知道它们帮你找出来的网页是关于什么内容的。它们知道的是,这些页面上出现了哪些词。所以,要有效利用搜索引擎,你需要找出目标网页中应该会有的关键词。
要点:使用高级检索语法
大部分搜索引擎都有这类“隐蔽功能”,助你锁定搜索范围,改善搜索结果。
技巧1:非必需关键词(Optional keywords)
如果你没有一个特别确定的关键词,你可以嵌入一些可能的关键词,并使它们不损坏结果的完整性。
举个例子:你想查找有关德克萨斯州海洛因使用情况的网页,但它们不一定都含有“德克萨斯”这一关键词,有些页面可能只会提到德州不同城市的名字。
技巧来了:你可以用一个大写的“OR”将这些城市名分开,使它们成为检索词中的“非必需关键词”,如下图所示:
你也可以用这个技巧通过不同名称或拼写搜索同一个公司、机构或个人,如搜索“伊斯兰国”(ISIS / Isalamic State):
技巧2:利用域名搜索(Search by domain)
如果你想集中查找一个特定网站上的相关内容,可以使用的高级搜索语法是在“site:”后面输入网站域名。
比如,你只想查找Twitter上的相关结果,那么在关键词后输入“site:twitter.com”即可,如下图所示:
如果想在Twitter之外加上Facebook的相关结果,只要再用上“OR”就可以搞定,如下图所示:
这个技巧也可以用来集中搜索某个特定公司的网站。谷歌将只会从该站点返回结果。
你还可以用这个技巧来搜索政府或者学术网站上的资源。当你所研究的国家中政府和高校网站使用特别域名类型时,这一招尤其有效。如下图所示,搜索英国学术网站上的资料时,输入“site:ac.uk”:
注意:搜索学术网站时,记得检查一下你所找到的网页是由某所高校、某位教授、还是某个学生编辑和维护的。具体的信源是谁,一向都很重要。
技巧3:搜索文件类型(Searching for file types)
有些信息会以特定的文件格式类型出现。比如,数据出现的格式通常是Excel电子表格;专业制作的报告常以PDF文件的形式出现。
技巧来了:在“filetype:”后面加上目标文件类型的拓展名(如Excel表格的xls,Word文档的docx,幻灯片的pptx等),就可以在搜索过程中锁定某一特定格式的资料了。比如,搜索英国航空公司网站上(ba.com)PDF格式的年度报告(annual report),可搜索——”annual report” site:ba.com filetype:pdf,如下图所示:
【想知道如何有效找人、确认域名主人?请点击标题链接来获取技巧吧!】
2. “人肉”案例:一分钟搜出“水分文凭”
钱钟书小说《围城》的主角方鸿渐在欧洲游学,不务正业。临回国,为给出钱供自己读书的家人一个交代,花了三十美金,向一个爱尔兰酒鬼买了一张美国“克莱登大学”博士学位证书,全名“克莱登法商专门学校函授班博士”。
在首届亚洲深度报道大会上,人气爆高的BBC互联网研究专家Paul Myers介绍了一招社交媒体搜索小技巧,帮你找出“克莱登大学”毕业的“方鸿渐们”。
深度君会在下文用深沉的语言配上图文解说,向大家展示Paul的搜索技巧和所举的例子。
如果你心中也有一所让你疑惑的“克莱登大学”,不妨也动动手,看看有啥发现:
锁定你的“克莱登大学”
Paul以美国一所名叫Almeda University的大学(又叫Almeda College、Almeda College & University……后简称A大学)为例。
A大学提供学术课程和远程教育。但是所颁发的文凭没有获得美国教育部的学术认证。
也就是说在美国拿着这间大学的文凭找工作,雇主是不会认的。一些人习惯称之为“野鸡大学”。
深度君发现2006年,美国佛罗里达州的小城那不勒斯(Naples)有两名警察拿着A大学的学位证书申请佛州政府的加薪项目,结果州政府不认A大学学位,将二人炒鱿鱼。两名警察经过漫长的三年官司,最终恢复职位和补偿。律师的辩护理由是他们申请加薪时,未能检验出A大学学位无效是单位失职,而非警察本人的过错。
既然 美国人普遍不认A大学的证书。那在外国如何呢?
Paul 想看看印度有哪些人拿了A大学的证书。于是他打算搜一下领英的印度网站,看看哪些人公开称自己是A大学毕业的。
在谷歌搜索地址栏输入:
“almeda university” site:in.linkedin.com
说明:
“almeda university” —> 在谷歌输入”XXX”,谷歌仅会搜索与引号内完全匹配的结果。
site:in.linkedin.com —>在谷歌输入 “site:+网站地址” 告诉谷歌缩小搜索范围,仅在领英网站搜索内容。这里Linkedin的网站前面加上了in.,限定是搜索领英在印度的网站。(领英中国是前面加cn,即cn.linkedin.com)
告诉谷歌:在领英印度网站搜索简历上出现A大学的人。
按回车,出现了一连串名字。第一个Sasi先生(后简称S先生)出现了多次”Almeda University”。不如打开看一下吧!
首先映入眼帘的是这位S先生的职业照和关键背景介绍。
他是印度一家能源工程公司的副主席。之前从事的工作也都是能源领域。朋友不少,已经500+了。最新的教育背景是毕业于印度一家叫石油能源研究的大学。
继续往下看。到教育背景一栏,目标A大学出现…
从S先生自己填写的资料来看,他从2000年开始在A大学进修四次,获得了市场营销MBA学位、项目管理管理学学士学位、电子工程硕士学位。他花了八年时间攻读电子工程博士学位,根据描述,他已经完成了毕业论文,经过美国认证(the US attestation),即可获得博士学位。
如果还记得深度君在一开始的介绍,你大概会得出和深度君一样的结论:S先生花了14年拿到了三个在美国找不到工作的学位证书,还有一张永远“在路上”的博士学位证。
可是,如果是对A大学完全不了解的人呢?
问题来了:我可不关心远在印度路人S先生文凭硬不硬气。作为调查记者,我怎么靠它找新闻呢?
联合国如此高大上,招人那一定是火眼金睛。要不看看为联合国工作的人里面会不会也拿着A大学的文凭吧!
让我们回到谷歌重新搜索:
这次搜索的是:
“almeda univesrity” “United Nations” site:linkedin.com
告诉谷歌:在领英网站上搜索同时出现A大学和联合国信息的人
回车!
出现一批A大学毕业的联合国高级人才。
第一个是联合国的安全顾问。看起来很酷,点开看看吧。
下面就是这位Bosko 先生(后简称B先生)的领英页面。
照片也很帅气。B先生曾在国际红十字会(ICRC)和欧洲安全与合作组织(OSCE)工作。后来在联合国阿富汗支助团(UNAMA)工作。
我们来看看B先生的教育背景。
B先生90年代在克罗地亚的大学读了新闻专业,2001年开始在A大学进修培训和领导的学士课程,然后继续在A大学进修国际关系硕士课程。
栗子举完。Paul传授的小技巧你掌握了没?
请注意:S和B先生并不等同买文凭的方鸿渐。因为A大学仅是未获得学术认证,但并不代表不合法。而且说到底,这一纸文凭的水分究竟多大,无法靠一分钟的搜索找出答案。需要有好奇心的你追踪深挖。
一句话:师傅领进门,修行就靠个人啦。
3. 搜索利器:10款强力“人肉”搜索工具:
1)搜索电话IP:Aql.com
谁在发送大量垃圾短信?骚扰电话又是从哪里打过来的?别急,Aql.com帮你忙。该网站专供搜索电话IP所属地、供应商信息和目前位置、地区编号、连接网络的名称,甚至还有最近改变网络的日期等。只要按格式输入电话号码,以上信息一键搞定。此外,如果想查找与Skype相关的信息,用SkypeGrab就能得到打出Skype电话的IP地址。
2) 查找相似域名:TCPIPUTILS.com
主要用于查找与目标网址相类似的域名。例如,小编键入“全球深度报道网”的网址(cn.gijn.org),马上找到了21个类似的域名,包括gijn.cn,gijn.com,gijn.net等等。如果试试中国银行的网站“www.boc.cn”,出来的域名更多达50个,不乏混淆视听的boc.co.kr和bo.co.uk,,它们并不是中银在韩国或者英国的分网站,而全都是美国一个IP造出来的虚假地址。拿其他网站来试试吧,不光是域名,ipv4、ipv6、网络供应商ip和所在地的信息也一查俱全,还可以单独点开域名,看看它有没有包含在DMOZ这样的公共网页目录里面。这样大概就能帮你找到那些借着大网站名头行诈骗之实的钓鱼网站了。
3) 查看图片元数据:Jeffrey’s Exif & Metadata Viewer
在网上看到了超炫的摄影作品但不知道是在哪里拍摄、使用了什么参数?这款工具可以帮我们可以依据关键图片线索锁定时间地点。只需黏贴图片地址或上传图片至Jeffrey’s Exif & Metadata Viewer,图片基本信息(大小、像素等),包括拍摄地点和时间、具体参数(快门、光圈、镜头型号等等)都能查出。最神的是,你还能了解到Google Map图像以及当时的定位,放大缩小随你看。同类型的平台还有Gbimg.org,不妨对比一试。
4)获取网站后台文件:Pentest Tools
这个工具分为信息收集(Information gathering)、网站应用检测(web application testing)和基础设施检测(infrastructure Testing)三部分。键入要查询的网站域名,就能找到子域名(subdomains),或者下载关于网站服务器、链接漏洞信息(URL Fuzzer)的pdf报告等,甚至可以找到网站背后的文件目录(directory and files),可以知道网站更详细的内容信息。
看过专家分享,小伙伴们是不是十分期待呢?此次尼泊尔会议,Paul Myers也将带来精彩分享:“互联网侦探:挖出潜在的网络信息”(Internet Detective: Digging Out Hidden Info Online),如感兴趣请点击此处查阅最新详情,也可关注深度君的实时报道哦。
Paul Myers是BBC的互联网研究专家,同时运营网站“互联网搜索诊所”(The Research Clinic),致力于引导记者们找到最好的网络搜索平台、应用和其他资源。他在BBC学院(BBC Academy)负责的培训课程包括网上调查、数据新闻、社交媒体、统计学以及网页设计。Myers还曾培训过《卫报》、《每日电讯报》、《泰晤士报》、CNN、世界银行及联合国开发计划署的工作人员。
“报道亚洲”——第二届亚洲深度报道大会将于2016年9月23日至25日在尼泊尔首都加德满都举行。深度君将在会前陆续发布会议亮点,解析会上不容错过的人和事,敬请关注!
若想了解更多亚洲大会资讯,请关注大会官网,全球深度报道网(cn.gijn.org)和英文网站(gijn.org),微博@全球深度报道网和话题#报道亚洲16#,微信“全球深度报道网”(ID: gijn_cn),Twitter @gijnCh和话题:#IJAsia16,我们将及时推送会议热闻和好资源。