
PDF文檔數據難處理?資深記者教你幾招
你一定有過類似經歷:試圖從PDF中提取數據表,發現command C加command V只帶來一堆胡亂排列、不知所云的的數據。南非資深數據記者Laura Grant根據多年的經驗推薦了一組簡單好用的工具,以及使用PDF文檔的小技巧,幫你解決難題。
你一定有過類似經歷:試圖從PDF中提取數據表,發現command C加command V只帶來一堆胡亂排列、不知所云的的數據。南非資深數據記者Laura Grant根據多年的經驗推薦了一組簡單好用的工具,以及使用PDF文檔的小技巧,幫你解決難題。
社交媒體傳播廣、速度快,假新聞得以散播,但記者也有更多機會巧用公開資源大展身手。目前,全球各地開始湧現以挖掘故事、核查信息為一體的記者群體,藉助公開信息和平台,開發報道工具。他們都開發了哪些好工具?可以發揮哪些功能?請隨着專家的梳理一探究竟吧。
工欲善其事,必先利其器。想做優秀的數據記者,也得隨時備好工具。深度君借鑒數據記者Duc Quang Nguyen的工具包,分功能推薦R語言程序包和其他軟件,教你準備屬於自己的數據利器。
談到數據新聞,總也繞不開技術。記者不懂點行話,還怎麼跟團隊技術小夥伴溝通?在NICAR會議上,數據極客同時也為NBC4調查記者的Tisha 一起和 ProPublica新聞應用開發師Sisi,向大家介紹了一些熟悉又陌生的技術,分享了不少軟件、互聯網平台等。
深度君經授權轉載鏑次元數據傳媒實驗室(ID: dyclub-org)的NICAR分享,看看清單里有哪些術語還不熟悉?文中還附有相應教程,或者參考深度君的分享《獨家 | 全球調查+數據新聞指南超全清單》哦。
數據可視化的常用工具有很多,想試試新的get更多功能?挖掘普通的Office強大的圖表生成功能?深度君經授權轉載Simon阿文的文章,為你介紹那些被人忽略、但輕便實用的好工具,囊括製作信息圖表、詞雲、圖標設計,抽取地理數據、一鍵生成可視化等功能【多圖,歡迎轉發收藏後在WIFI條件下觀賞】。
數據一多,就有可能出現數據名目不統一、殘缺或者冗餘等情況,且數據量越大錯誤可能越多。如何才能使雜亂無章的數據變得清晰有致?免費開源的數據清洗工具Open Refine就是你的好幫手,不但可以清洗數據、轉換格式,藉助網絡服務和外部數據幫你擴展,而且還能鏈接數據庫。深度君經授權分享數據新聞網編寫的《中國數據新聞工作坊培訓手冊》,為你總結Open Refine的簡明使用方法。
搜索引擎是我們常用的“開源”搜索工具中最重要的部分之一。很多人覺得搜索引擎常常帶來令人失望的查找結果,信息的來源也並不可靠。其實,只要掌握一些小竅門,就能將搜索結果限定在可以信任的站點中。來看看BBC的網絡搜索專家分享了哪些實用技巧——