輔助功能設置

文字大小

色彩設置

單色 柔和色 dark

閱讀工具

底部遮蓋 標尺

文章

挪威大會第二日報道精選:如何在新聞里使用數據

在新聞中使用數字、採用可視化形式呈現新聞,已經成為新聞報道的普遍做法,看似簡單,其實背後技巧多多。

在2015全球深度報道大會上,伊利諾伊大學厄巴納香檳分校教授、全球深度報道網董事會主席Brant Houston、調查記者與編輯協會(Investigative Reporters and Editors,IRE)的執行總監Mark Horvit及培訓主管Megan Luther分享了如何選用數據、如何用數據讓新聞更可信以及製作發布數據可視化時的“必記要點”。

Brant Houston在講解使用眾數的情況1

如何在海量數據中抽取數據寫進故事?相信這是每一個記者都曾經歷或仍在苦惱的問題。擁有豐富調查報道實踐和培訓經驗的Houston總結出了幾種新聞記者適合使用的數據類型,並強調最重要的前提:清楚新聞故事中使用的數據是為了解決什麼問題,我們才能決定能採取什麼樣的算法;複雜或者含混的數據時常出現,我們有時需要驗證算法,或者自己動手算出新數據。

推薦使用的數據類型:

  1. 在描述一個地區的人口收入或者住房情況時,以中位數取代平均數。中位數是按大小排列時最中間的數字,比平均數更有代表性,更易讓讀者理解和推測具體情況,並有助於避免收入差距懸殊且低收入人數較多時,使用平均數會拉高收入水平這一陷阱;
  2. 使用眾數反應頻率和集中情況。例如,一共有15個人,兩人收入500萬,兩人收入5萬,剩下的收入10萬,10萬是眾數,能說明所在團體大多數人的收入水平;
  3. 使用比例和比率。採用單位平均數據,要點就更清楚了。比例適用於突出不同主體之間的差別;
  4. 特別關注比率(百分比)變化。假設一個人今年的收入是4萬美元,下一年收入為4.2萬美元,前後差了2000美元,從百分比來看,收入變動了5%,或者說漲了5%。兩組相關數據的百分比變化中就有新聞可挖。譬如,公司的預算上調了30%,而所購買物品的價格僅上漲了2%,那麼背後原因是什麼?如果有物品選擇、預算決策的信息,說不定就能找到貓膩,寫成新聞;
  5. 計算百分比變化時,我們應關注最顯著的變化,捨棄輕微變動。

選好了數據,呈現數據也同樣重要,用圖表展示比文本列舉更直觀形象。Houston推薦了表格、線形圖、餅圖、柱狀圖,都能讓讀者清晰閱覽數據,一看即懂。

同時,他還推薦了幾個易於下載表格數據的權威網站:世界衛生組織的Observatory Data(GHO)、世界銀行的數據庫、聯合國網站(能鏈接到很多重要統計網站或頁面)。

數據到手後,需確定要檢索的數據目錄,掌握基本的分類,同時確定篩選的標準,要見到樹林而非樹木——從數據看概況而不是局限在小範圍。

database

另一場題為“新聞故事中使用數據的最佳方式”的分享中,來自IRE的Mark Horvit和Megan Luther逐步分析了數據可視化作品當中最通用的數據使用法則。

關於使用數據,選定時間範圍非常重要,至少有3年左右的數據對比會更具可信度。

用時間軸展示數據,更容易被讀者理解;要想更快更准地選數據 ,就得明白數據庫數據的計算方法。

選取數據後,你還需要在數據分析之前做幾件事:先把數據備份,算算關鍵數據來驗證它們是否有效、合理,搞清楚每一行每一列的數據分別代表什麼。這裡有兩點非常重要,一是看看有沒有缺失的數據,並了解每一行數據的意義,這樣就能加快數據分析;二是清楚所選數據應該一共有多少行多少列,有些國家可能會隱藏部分數據,因此在使用之前一定要確認,以免作品中出現離奇數據,無法自圓其說——換句話說,你要確保數據是連貫的、計算的數字項是前後一致的。除此之外,也不要做數據假設。

數據分析完成後,最好記錄下工作流程和得出的結果,不要只存儲數據透視表(pivot tables)就草草了事。要把發現寫下來,建立備忘錄,並準備好接下來要做的事件清單,或為攝影師和網站等單獨建立工作清單。同時,應對照IT或數據講座、培訓分享的內容來確認自己做的對不對。提前考慮怎麼呈現數據,別等着呈分析完數據才開始,最好在分析過程中即有一定的預想和準備。

驗證你的數據分析。篩選分析出的數據包含項,或者使用不同的結構查詢語言,檢查你的主要發現和工作記錄,也讓其他人幫助你檢查數據。

單純的數據不等於好故事,把你的結果分享給例如數據來源機構的官員,以驗證自己的數據準確度,聽聽他們的意見。報告、文件中的數字總數和單個數字相加的結果應該一致,與此同時,也要以其他相關信息來驗證數據的有效性。

現在終於可以下筆寫新聞了!同樣,你不能對數據的使用過於大意:最好用表示程度的詞來描述數字,例如“至少”、“多於”、“大約”,以避免後面反覆修改。不要在一個作品裡使用太多數據,也切勿過分推理自己的數據,只寫合理且得到驗證的結論。寫清楚數據的來源,列出你獲取數據的機構名稱。

此時,記者得不斷問自己:我還不知道的部分是什麼?這樣會導致什麼樣的錯誤結果?有沒有把所有的發現結果都與信源對照核查過?是不是每一個數據元素(圖片、交互式效果等等)都能確切表達它應該表達的意思?我的發現是不是和所有人的認識相衝突?數據的魅力在於它並不能直接開口告訴你錯在哪裡,而是會通過結果顯示出來。如果分析結果與通識完全不一樣,你的報道要麼精彩絕倫,要麼錯得離譜。

你還需要一份最後檢查的清單:在採訪時,讓信源拼寫自己的名字和稱呼頭銜;記錄或者抄寫採訪信息;反覆驗證可靠信源的言論;保存鏈接和其他研究成果;詢問信源其他新聞報道中偏頗之處,避免犯同樣的錯誤。

correct the error

在提交之前,多重檢查可保證萬無一失。最後自己再多看看數字、計算方法、名字、頭銜、地點、對照筆記和記錄檢查筆記、定義、鏈接、拼寫和語法、語句引用等,計算機的拼寫檢查系統也會出錯,所以還是參考權威的拼寫建議(字典等)更保險。

您可以根據知識共享協議條款免費轉載這篇文章

轉載


閱讀更多

參會感想:從全球深度報道大會看數據的力量

在大數據和新媒體時代,數據變得越來越重要,這次深度報道大會更是深刻地印證了這一點。大會彙集了許多前沿的數據分析思維、技術和工具,為從事深度報道的記者們提供了新的調查視角和途徑。