资源中心

•

主题

» 报道工具和技巧

干货 | 数据收集和处理工具一览

作者周炜乐 • 2015年11月05日

进入大数据时代，调查报道愈加成为信息战。从哪里收集有效数据？如何抽取、筛选、整合、分类大量琐碎的信息？如何分享、存储数据，并实现随取随用？深度君整理了一张数据收集和处理工具清单，分为八大类，方便实用，各有所长，供大家选择。

1.全文本搜索和挖掘的搜索引擎：

包括：搜索方法、技术：全文本搜索，信息检索，桌面搜索，企业搜索和分面搜索

开源搜索工具：

Open Semantic Search：专门用于搜索自己文件的搜索引擎，同样的还有Open Semantic Desktop Search:可用于搜索单一一台笔记本电脑或单一用户的文件资源。

InvestigateIX: 用于搜索加密外部设备
Recoll: 适用于Linux系统的桌面搜索引擎
Fuzzy search with lists：清单搜索、模糊搜索

搜素数据库和API

如果你想编程，你可以试用以下强大的搜索引擎：Solr和Elastic Search，支持索引和API搜索，更多全文搜索、实时检索、数据分析、多格式数据读取（JSON, SML, CSV或HTTP）等强大功能等你开发。

2.数据库、数字文档、数据管理系统、文件管理系统和内容管理系统：

还在为不同格式的脚注、尾注、文中引用和文献参考大费脑筋吗？资源整理神器Zotero的标注和引用功能帮你解决难题。它可以在Word，Open Office添加引用，在Google doc和电子邮件中插入文献参考，或者为数据库添加标记。

LibreOffice Calc:开源表格程序
Document cloud:文档管理系统，管理纸质文件扫描版本或者PDF 格式文件
Semantic MediaWiki: MediaWiki(著名开源引擎，可用于构建企业/个人知识库，维基百科就是使用MediaWiki的成功范例)的免费开源扩展，可供用户存储、调用数据
Drupal CMS:内容管理模块，可以让你快速便捷地以用户界面创制自己的内容格式、数据字段和表格

想从大量文件中单独抽取金额来分析？专业的文件管理系统Agorum可以自动从账单抽取金钱数额，帮你轻松解决。

想标记图片中的文字？Pundit帮你办到，它同时支持文本和图片标记。
想在网站加注释？Annotator.js帮你在任何网页加注释，而且可以添加评论、标签、链接、用户或者更多不同种类的信息，第三方插件还能帮你在难以搞定的PDF、EPUB、视频、图片、声音甚至更多格式的文件上添加标注。

标注了信息，想收到更新提醒？Hypothesis可供用户订阅一系列已标注的活动信息，而且能按照自己的兴趣获取通知，而且还能分享评注、链接词典。程序员还可以获取有限的网站许可，通过第三方应用创建、更新、删除、搜索注释。

3. 文本文件挖掘、分析

Text mining tutorial: How to analyze large document collections：文本挖掘教程：如何分析大容量文件集（使用Open Semantic Search来挖掘文本）
Understanding language data: 理解语言数据：可以使用开源NLP（自然语言处理）软件

统计词频有困难？Overview project可以显示文本最常用的词和它们的词群分布
想以图解的方式查看文本检索结果？文本搜索工具Jigsaw:（非开源软件，但可免费下载）可统计文本中最重要的人物、地点、组织等实体的出现频率，并将他们之间的关系以列表、图表、时间表和关系图的形式呈现出来，提高文本分析效率。

如果你觉得不够，我们还推荐：

Wikipedia list of open source text mining software：维基百科上整合的开源文本挖掘软件列表
Tapor: 研究专用的文本分析门户，提供大量文本分析工具，你可以按照类型或标记找到最适合的一款。

4. 图表和关系网络分析（SNA）

帮助分析关联并将其可视化的工具：

关系网分析教程：教你如何用Open Semantic Search可视化关联
Gephi：桌面工具，协助数据分析，可将图表和关系网可视化，可最多包含5万个关系点，用户可自主筛选呈现的点。
Cytoscape.js: Javascript数据库，能将关系网、事物分属和图表可视化
Semantic Mediawiki:上面介绍过，不仅是数据库，也是适用于关联数据、非常灵活的内容管理系统
Detective: 以Python/Django和neo4j图像数据库为基础的内容管理系统，适用于分析关系。

5. 抽取、转换数据

包括数据整合、抽取、转换、转移、ETL（数据提取、转换和加载）网络爬虫采集等等

从文件抽取结构化数据：

Tika content analysis toolkit: 从文档和文件抽取文本和元数据
CSV Manager:将csv表格输入Solr为基础的搜索引擎
想从PDF文件抽取数据、转化为可编辑的文本？免费软件Tabula可以直接从PDF文件抽取数据表格，神奇吧？
图片识别和文本扫描：光学字符识别（OCR）

从图片识别文本（OCR）

Tesseract: 光学识别软件，从图片识别文本

低质量扫描没法看？Scantailor帮你分页、矫正文本、添加/删除页边，可以将原始文本传换成PDF或者DJVU格式的文件，便于打印。

从声音识别、抽取文本：

CMU Sphinx: 开源声音识别工具，支持英语、法语、中文、德语、荷兰语、俄语。该开发商还提供关键词识别和读音识别等实用工具，可以多多关注。

从网站抽取数据（网络信息采集/网络爬虫）

网络采集哪家强？简易 Scrapy帮你忙：你可以依托Scrapy建立自己的网络爬虫工具，编写Python代码，在Windows,Mac,Linux和BSD系统上都可运行。

6. 输入、修改、转换数据

将数据转换成纯文本的超强工具： Tika content analysis toolkit
将数据转换成其他格式的工具：Talend Open Studio和Kettle

编写文件和删除元数据

14 PDF Redact Tools 记者为了保护信息，往往需要编写文件、清除敏感文件、删除隐藏在文件或图片里的元数据，例如软件的序列号或软件、用户名，以下工具可供参考：

PDF Redact Tools: 以最安全的方式删除PDF中的元数据
MAT: Metadata Anonymisation Toolkit:从不同的文件格式和图片格式中删除元数据

7. 统计与分析

包括数据分析、统计、图表、数据可视化

开源表格程序LibreOffice Calc
上面介绍过的HUE Solr search和Kibana for Elastic Search，除了能检索数据库和API，也能完成数据分析
适用于数据分析和计量经济分析的专业电脑程序：Statistical software
统计和分析的工具大全：Business Intelligence
用R 、 Python或其他编程语言编程分析数据

以上数据分析太复杂？刚入门，想理解数据分析原理？推荐阅读解释数据挖掘方法的书Mining of massive datasets（请点击链接，下载免费PDF格式）

8. 通用开源软件工具包

19 Debian 最强大的通用开源工具包，例如 Debian GNU/Linux或Ubuntu Linux，涵盖了成千上万个免费软件和开源工具、软件数据库和编程语言。

运行时，用户无需移除现有的操作系统：安装适用于Windows和Mac的Virtual Box，你就可以在现有操作环境下的单独的窗口运行上述Linux软件。

本作品采用知识共享许可协议署名-禁止演绎 4.0 国际进行许可

您可以根据知识共享协议条款免费转载这篇文章

阅读相关主题的文章：

开源软件数据分析数据挖掘文本挖掘

转载

This work is licensed under a Creative Commons Attribution-NoDerivatives 4.0 International License

<h2>干货 | 数据收集和处理工具一览</h2> 作者 周炜乐 for Global Investigative Journalism Network &bull; 2015年11月05日 进入大数据时代，调查报道愈加成为信息战。从哪里收集有效数据？如何抽取、筛选、整合、分类大量琐碎的信息？如何分享、存储数据，并实现随取随用？深度君整理了一张数据收集和处理工具清单，分为八大类，方便实用，各有所长，供大家选择。<hr>1.全文本搜索和挖掘的搜索引擎：包括：搜索方法、技术：全文本搜索，<a href="http://en.wikipedia.org/wiki/Information_retrieval">信息检索</a>，<a href="http://en.wikipedia.org/wiki/Desktop_search">桌面搜索</a>，<a href="http://en.wikipedia.org/wiki/Enterprise_search">企业搜索</a>和<a href="http://en.wikipedia.org/wiki/Faceted_search">分面搜索</a>开源搜索工具：<ul>
<li><a href="http://www.opensemanticsearch.org/">Open Semantic Search</a>：专门用于搜索自己文件的搜索引擎，同样的还有<a href="http://www.opensemanticsearch.org/doc/desktop_search">Open Semantic Desktop Search</a>:可用于搜索单一一台笔记本电脑或单一用户的文件资源。</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/1-Open-Semantic-Search.png"><img class="wp-image-5341 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/1-Open-Semantic-Search-771x283.png" alt="1 Open Semantic Search" width="643" height="236"></a><ul>
<li><a href="http://www.mandalka.name/investigateix/">InvestigateIX</a>: 用于搜索加密外部设备</li>
<li><a href="http://www.lesbonscomptes.com/recoll/">Recoll</a>: 适用于Linux系统的桌面搜索引擎</li>
<li><a href="http://www.opensemanticsearch.org/doc/search/list">Fuzzy search with lists</a>：清单搜索、模糊搜索</li>
</ul>搜素数据库和API<ul>
<li>如果你想编程，你可以试用以下强大的搜索引擎：<a href="http://lucene.apache.org/solr">Solr</a>和<a href="https://www.elastic.co/products/elasticsearch">Elastic Search</a>，支持索引和API搜索，更多全文搜索、实时检索、数据分析、多格式数据读取（JSON, SML, CSV或HTTP）等强大功能等你开发。</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/2-Elastic.png"><img class="wp-image-5342 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/2-Elastic-771x359.png" alt="2 Elastic" width="612" height="285"></a>2.数据库、数字文档、数据管理系统、文件管理系统和内容管理系统：<ul>
<li>还在为不同格式的脚注、尾注、文中引用和文献参考大费脑筋吗？资源整理神器<a href="http://www.zotero.org/">Zotero</a>的标注和引用功能帮你解决难题。它可以在Word，Open Office添加引用，在Google doc和电子邮件中插入文献参考，或者为数据库添加标记。</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/3-Zoerto.png"><img class="wp-image-5343 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/3-Zoerto-771x402.png" alt="3 Zoerto" width="579" height="302"></a><ul>
<li><a href="http://www.libreoffice.org/discover/calc/">LibreOffice Calc</a>:开源表格程序</li>
<li><a href="http://www.documentcloud.org/">Document cloud</a>:文档管理系统，管理纸质文件扫描版本或者PDF 格式文件</li>
<li><a href="http://www.semantic-mediawiki.org/">Semantic MediaWiki</a>: MediaWiki(著名开源引擎，可用于构建企业/个人知识库，维基百科就是使用MediaWiki的成功范例)的免费开源扩展，可供用户存储、调用数据</li>
<li><a href="https://www.drupal.org/documentation/modules/field-ui">Drupal CMS</a>:内容管理模块，可以让你快速便捷地以用户界面创制自己的内容格式、数据字段和表格</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/4-Drupal.png"><img class="alignright size-large wp-image-5344" src="https://cn.gijn.org/wp-content/uploads/2015/11/4-Drupal-771x314.png" alt="4 Drupal" width="771" height="314"></a><ul>
<li>想从大量文件中单独抽取金额来分析？专业的文件管理系统<a href="http://www.agorum.com/homepage/english/product-overview-of-open-source-dms-ecm.html">Agorum</a>可以自动从账单抽取金钱数额，帮你轻松解决。</li>
</ul><ul>
<li>想标记图片中的文字？<a href="http://www.thepund.it/">Pundit</a>帮你办到，它同时支持文本和图片标记。</li>
<li>想在网站加注释？<a href="http://annotatorjs.org/">Annotator.js</a>帮你在任何网页加注释，而且可以添加评论、标签、链接、用户或者更多不同种类的信息，第三方插件还能帮你在难以搞定的PDF、EPUB、视频、图片、声音甚至更多格式的文件上添加标注。</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/5-Annotator1.png"><img class="wp-image-5346 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/5-Annotator1-771x460.png" alt="5 Annotator" width="624" height="372"></a><ul>
<li>标注了信息，想收到更新提醒？<a href="https://hypothes.is/">Hypothesis</a>可供用户订阅一系列已标注的活动信息，而且能按照自己的兴趣获取通知，而且还能分享评注、链接词典。程序员还可以获取有限的网站许可，通过第三方应用创建、更新、删除、搜索注释。</li>
</ul>3. 文本文件挖掘、分析<ul>
<li><a href="http://www.opensemanticsearch.org/doc/analyze/textmining">Text mining tutorial: How to analyze large document collections</a>：文本挖掘教程：如何分析大容量文件集（使用Open Semantic Search来挖掘文本）</li>
<li><a href="http://entopix.com/so-you-need-to-understand-language-data-open-source-nlp-software-can-help/">Understanding language data</a>:&nbsp;理解语言数据：可以使用开源NLP（自然语言处理）软件</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/6-NLP.png"><img class=" wp-image-5347 aligncenter" src="https://zh.gijn.org/wp-content/uploads/2015/11/6-NLP.png" alt="6 NLP" width="555" height="416"></a><ul>
<li>统计词频有困难？<a href="http://www.overviewproject.org/">Overview project</a>可以显示文本最常用的词和它们的词群分布</li>
<li><img class="alignright wp-image-5348" src="https://zh.gijn.org/wp-content/uploads/2015/11/7-Jigsaw.jpg" alt="7 Jigsaw" width="183" height="122">想以图解的方式查看文本检索结果？文本搜索工具<a href="http://www.cc.gatech.edu/gvu/ii/jigsaw/">Jigsaw</a>:（非开源软件，但可免费下载）可统计文本中最重要的人物、地点、组织等实体的出现频率，并将他们之间的关系以列表、图表、时间表和关系图的形式呈现出来，提高文本分析效率。</li>
</ul>如果你觉得不够，我们还推荐：<ul>
<li><a href="https://en.wikipedia.org/wiki/List_of_text_mining_software#Open_source">Wikipedia list</a>&nbsp;of open source text mining software：维基百科上整合的开源文本挖掘软件列表</li>
<li><a href="http://tapor.ca/"><img class="wp-image-5349 alignright" src="https://cn.gijn.org/wp-content/uploads/2015/11/7-TAPOR-logo-771x178.png" alt="7 TAPOR-logo" width="286" height="66">Tapor</a>: 研究专用的文本分析门户，提供大量文本分析工具，你可以按照类型或标记找到最适合的一款。</li>
</ul>4. 图表和关系网络分析（SNA）帮助分析关联并将其可视化的工具：<ul>
<li><a href="http://opensemanticsearch.local/doc/analyze/graph">关系网分析教程</a>：教你如何用Open Semantic Search可视化关联</li>
<li><a href="http://gephi.org/">Gephi</a>：桌面工具，协助数据分析，可将图表和关系网可视化，可最多包含5万个关系点，用户可自主筛选呈现的点。<a href="https://zh.gijn.org/wp-content/uploads/2015/11/8-Gephi.jpg"><img class="alignright wp-image-5350" src="https://zh.gijn.org/wp-content/uploads/2015/11/8-Gephi.jpg" alt="8 Gephi" width="345" height="213"></a></li>
<li><a href="http://js.cytoscape.org/">Cytoscape.js</a>: Javascript数据库，能将关系网、事物分属和图表可视化</li>
<li><a href="http://www.semantic-mediawiki.org/">Semantic Mediawiki</a>:上面介绍过，不仅是数据库，也是适用于关联数据、非常灵活的内容管理系统</li>
<li><a href="http://www.detective.io/">Detective</a>: 以Python/Django和neo4j图像数据库为基础的内容管理系统，适用于分析关系。</li>
</ul>5. 抽取、转换数据包括数据整合、抽取、转换、转移、ETL（数据提取、转换和加载）网络爬虫采集等等从文件抽取结构化数据：<ul>
<li><a href="https://zh.gijn.org/wp-content/uploads/2015/11/9-tika.png"><img class="alignright size-full wp-image-5351" src="https://zh.gijn.org/wp-content/uploads/2015/11/9-tika.png" alt="9 tika" width="292" height="100"></a>&nbsp;<a href="http://tika.apache.org/">Tika content analysis toolkit</a>: 从文档和文件抽取文本和元数据</li>
<li>&nbsp;<a href="http://www.opensemanticsearch.org/doc/search/csv">CSV Manager</a>:将csv表格输入Solr为基础的搜索引擎</li>
<li>想从PDF文件抽取数据、转化为可编辑的文本？免费软件Tabula可以直接从PDF文件抽取数据表格，神奇吧？</li>
<li>图片识别和文本扫描：<a href="http://www.mandalka.name/investigative_journalism/#ocr">光学字符识别（OCR）</a></li>
</ul>从图片识别文本（OCR）<ul>
<li><a href="https://code.google.com/p/tesseract-ocr/">Tesseract</a>: 光学识别软件，从图片识别文本</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/FireShot-Capture-411-11-tesseract-ocr.png"><img class="size-full wp-image-5353 aligncenter" src="https://zh.gijn.org/wp-content/uploads/2015/11/FireShot-Capture-411-11-tesseract-ocr.png" alt="FireShot Capture 411 -11 tesseract-ocr" width="696" height="74"></a><ul>
<li>低质量扫描没法看？<a href="http://scantailor.org/">Scantailor</a>帮你分页、矫正文本、添加/删除页边，可以将原始文本传换成PDF或者DJVU格式的文件，便于打印。</li>
</ul>从声音识别、抽取文本：<ul>
<li><a href="http://cmusphinx.sourceforge.net/">CMU Sphinx</a>:&nbsp;开源声音识别工具，支持英语、法语、中文、德语、荷兰语、俄语。该开发商还提供关键词识别和读音识别等实用工具，可以多多关注。</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/12-CMU-Sphinx1.png"><img class="wp-image-5356 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/12-CMU-Sphinx1-771x264.png" alt="12 CMU Sphinx" width="529" height="181"></a>从网站抽取数据（网络信息采集/网络爬虫）<ul>
<li>网络采集哪家强？简易&nbsp;<a href="http://www.scrapy.org/">Scrapy</a>帮你忙：你可以依托<a href="http://www.scrapy.org/">Scrapy</a>建立自己的网络爬虫工具，编写Python代码，在Windows,Mac,Linux和BSD系统上都可运行。</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/FireShot-Capture-404-Scrapy-I-A-Fast-and-Powerful-Scraping-and-Web-Crawling-_-http___scrapy.org_.png"><img class="size-large wp-image-5355 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/FireShot-Capture-404-Scrapy-I-A-Fast-and-Powerful-Scraping-and-Web-Crawling-_-http___scrapy.org_-771x211.png" alt="FireShot Capture 404 - Scrapy I A Fast and Powerful Scraping and Web Crawling _ - http___scrapy.org_" width="771" height="211"></a>6. 输入、修改、转换数据<ul>
<li>将数据转换成纯文本的超强工具：&nbsp;<a href="http://tika.apache.org/">Tika content analysis toolkit</a></li>
<li><img class="size-full wp-image-5357 alignright" src="https://zh.gijn.org/wp-content/uploads/2015/11/13-talend-logo.png" alt="13 talend-logo" width="210" height="52">将数据转换成其他格式的工具：<a href="https://www.talend.com/resource/etl-tool.html">Talend Open Studio</a>和<a href="http://community.pentaho.com/projects/data-integration/">Kettle</a></li>
</ul>编写文件和删除元数据<img class="alignright wp-image-5358" src="https://zh.gijn.org/wp-content/uploads/2015/11/14-PDF-Redact-Tools.png" alt="14 PDF Redact Tools" width="207" height="180">记者为了保护信息，往往需要编写文件、清除敏感文件、删除隐藏在文件或图片里的元数据，例如软件的序列号或软件、用户名，以下工具可供参考：<ul>
<li><a href="https://firstlook.org/code/project/pdf-redact-tools/">PDF Redact Tools</a>: 以最安全的方式删除PDF中的元数据</li>
<li><a href="https://mat.boum.org/">MAT: Metadata Anonymisation Toolkit</a>:从不同的文件格式和图片格式中删除元数据</li>
</ul>7. 统计与分析包括数据<a href="https://en.wikipedia.org/wiki/Data_analysis">分析</a>、<a href="https://en.wikipedia.org/wiki/Statistics">统计</a>、图表、<a href="https://en.wikipedia.org/wiki/Data_visualization">数据可视化</a><ul>
<li>开源表格程序<a href="http://www.libreoffice.org/discover/calc/">LibreOffice Calc</a></li>
<li>上面介绍过的<a href="http://gethue.com/solr-search-ui-only/">HUE Solr search</a>和<a href="https://www.elastic.co/products/kibana">Kibana for Elastic Search</a>，除了能检索数据库和API，也能完成数据分析<img class="size-large wp-image-5359 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/16-hue-771x282.png" alt="16 hue" width="771" height="282"></li>
<li>适用于数据分析和计量经济分析的专业电脑程序：<a href="https://en.wikipedia.org/wiki/List_of_statistical_packages#Open-source_statistical_packages">Statistical software</a></li>
<li>统计和分析的工具大全：<a href="https://en.wikipedia.org/wiki/Business_intelligence_tools">Business Intelligence</a></li>
<li>&nbsp;用<a href="http://www.r-project.org/">R</a>&nbsp;、&nbsp;<a href="http://www.python.org/">Python</a>或其他编程语言编程分析数据</li>
</ul><a href="https://zh.gijn.org/wp-content/uploads/2015/11/18-Python.png"><img class="wp-image-5361 aligncenter" src="https://cn.gijn.org/wp-content/uploads/2015/11/18-Python-771x282.png" alt="18 Python" width="651" height="238"></a><ul>
<li>以上数据分析太复杂？刚入门，想理解数据分析原理？推荐阅读解释数据挖掘方法的书<a href="http://infolab.stanford.edu/~ullman/mmds/book.pdf">Mining of massive datasets</a>（请点击链接，下载免费PDF格式）</li>
</ul>8. 通用开源软件工具包<img class="alignright wp-image-5362" src="https://cn.gijn.org/wp-content/uploads/2015/11/19-Debian-771x278.png" alt="19 Debian" width="405" height="146">最强大的通用开源工具包，例如&nbsp;<a href="http://www.debian.org/">Debian GNU/Linux</a>或Ubuntu Linux，涵盖了成千上万个免费软件和开源工具、软件数据库和编程语言。运行时，用户无需移除现有的操作系统：安装适用于Windows和Mac的<a href="http://www.virtualbox.org/">Virtual Box</a>，你就可以在现有操作环境下的单独的窗口运行上述Linux软件。
	This <a target="_blank" href="https://zh.gijn.org/resource/%e5%b9%b2%e8%b4%a7-%e6%95%b0%e6%8d%ae%e6%94%b6%e9%9b%86%e5%92%8c%e5%a4%84%e7%90%86%e5%b7%a5%e5%85%b7%e4%b8%80%e8%a7%88/">article</a> first appeared on <a target="_blank" href="https://gijn.org">Global Investigative Journalism Network</a> and is republished here under a Creative Commons license.
	<img id="republication-tracker-tool-source" src="https://gijn.org/?republication-pixel=true&amp;post=657947&amp;ga=UA-21528033-17">

数据记者莱昂纳多·尼科莱蒂：我用什么工具进行数据挖掘、分析和可视化？

作者 Hanna Duggal • 2024年10月17日

莱昂纳多·尼科莱蒂是彭博社数据记者，他对社交媒体上的极端主义、生成式 AI 中的种族和性别刻板印象等都有深入报道，他是用什么工具进行数据挖掘、分析和可视化的？

报道工具和技巧

调查记者利塞斯·布恩：我用什么工具进行数据分析和可视化？

作者 Andrea Arzaba • 2021年09月24日

在这期“工具箱”栏目中，我们采访了委内瑞拉调查记者利塞斯·布恩。她对当地的非法采矿、环境犯罪等行为进行过深入的调查，也参与多项跨国调查合作。在工作中，她不仅要对海量数据进行处理，还要以美观的设计呈现给读者，哪些工具帮助她实现了这些目标？

深度报道精选

深度报道精选：被清仓的方舱医院、“妈妈岗”争议、“骂游戏”产业链

作者 Stanley Leung • 2025年06月27日

“清仓”取代“清零”，引发争议的“妈妈岗，“骂游戏”如何成为了一个产业链的关键一环……全球深度报道网精选了6月值得一读的深度报道。

深度报道技巧

制作调查播客的六个技巧

作者 Alcyone Wemaëre • 2025年06月23日

在近期举行的 Dataharvest 大会上，来自波兰和葡萄牙的资深播客制作人分享了制作调查播客的六大技巧，内容涵盖叙事技巧和商业模式等。

辅助功能设置

文字大小

色彩设置

阅读工具

其他

资源中心

主题

干货 | 数据收集和处理工具一览

阅读相关主题的文章：

转载

阅读更多

报道工具和技巧

数据记者莱昂纳多·尼科莱蒂：我用什么工具进行数据挖掘、分析和可视化？

报道工具和技巧

调查记者利塞斯·布恩：我用什么工具进行数据分析和可视化？

深度报道精选

深度报道精选：被清仓的方舱医院、“妈妈岗”争议、“骂游戏”产业链

深度报道技巧

制作调查播客的六个技巧

资源中心

主题

干货 | 数据收集和处理工具一览

相关资源

数据记者莱昂纳多·尼科莱蒂：我用什么工具进行数据挖掘、分析和可视化？

制作调查播客的六个技巧

如何使用“信息洗衣机”工具检查网站内容和元数据？

2024年有哪些不可错过的调查工具？

分享

相关资源

数据记者莱昂纳多·尼科莱蒂：我用什么工具进行数据挖掘、分析和可视化？

制作调查播客的六个技巧

如何使用“信息洗衣机”工具检查网站内容和元数据？

2024年有哪些不可错过的调查工具？

相关文章

数据记者莱昂纳多·尼科莱蒂：我用什么工具进行数据挖掘、分析和可视化？

调查记者利塞斯·布恩：我用什么工具进行数据分析和可视化？

深度报道精选：被清仓的方舱医院、“妈妈岗”争议、“骂游戏”产业链

制作调查播客的六个技巧

阅读相关主题的文章：

转载

阅读更多

报道工具和技巧

数据记者莱昂纳多·尼科莱蒂：我用什么工具进行数据挖掘、分析和可视化？

报道工具和技巧

调查记者利塞斯·布恩：我用什么工具进行数据分析和可视化？

深度报道精选

深度报道精选：被清仓的方舱医院、“妈妈岗”争议、“骂游戏”产业链

深度报道技巧

制作调查播客的六个技巧